Via all’IA italiana: lanciato Italia, l’LLM “nazionale”

9 miliardi di parametri, una “finestra di contesto” di 4.096 token e un vocabolario di 50.000 token (i tasselli di discorso, di senso, che costituiscono la base delle risposte che dà un’intelligenza artificiale). Tutti italiani. Sono le credenziali tecniche con cui è stato presentato oggi Italia, il large language model (LLM) interamente sviluppato nel nostro Paese, dalla startup iGenius che ha usato come “palestra” per il suo addestramento il supercomuputer Leonardo di Cineca (oggi il sesto al mondo per potenza computazionale). Un modello al 100% open source, disponibile online da subito.

“L’Intelligenza Artificiale generativa è una rivoluzione sociale, prima ancora che tecnologica, oggi le imprese vivono una distuption sociale più che tecnologica, per una crisi di competenze, e un po’ perché la tecnologia da mezzo è diventata un fine” ha detto Uljan Sharka fondatore e Ad di iGenius. “Grazie al suo Dna umanistico, l’Italia ha l’opportunità di promuovere un Rinascimento Digitale, che può dare vita a un nuovo modo di realizzare soluzioni di AI, dove le persone sono al centro”.

Rispetto delle persone, gratuità (“già da oggi potenzialmente i nostri competitor possono usare Italia” dice Sharka) e conformità assoluta con le normative europee sull’Intelligenza Artificiale.
Ma non è un prodotto consumer, puntualizza l’Ad: “è stato pensato per aiutare le aziende nell’adozione dell’Intelligenza Artificiale generativa in settori altamente regolamentati, come i servizi finanziari, l’industria e la Pubblica Amministrazione, dopodiche, essendo completamente open, nessuno impedisce a qualcun altro, che disponga degli enormi capitali necessari, di provare a fare un concorrente di ChatGpt”. E a proposito di fondi, per iGenius è in arrivo a breve un grosso aumento di capitale, con il probabile ingresso di nuovi soci.

Italia, il cui logo ricorda vagamente quello di Meta, è stato sviluppato in soli 5 mesi dai membri del team iGenius, sul supercomputer Leonardo. L’addestramento è partito da zero, in italiano, su oltre mille miliardi di parole, utilizzando un mix eterogeneo di fonti: sorgenti pubbliche, dati sintetici e contenuti di settore forniti da partner commerciali selezionati di iGenius. “Nove miliardi di parametri sono un numero molto consistente, per fare un esempio la prima versione di Llama, LLM di Meta era basata su 8 miliardi di parametri. Stiamo lavorando per rilasciare a breve una versione di Italia da 10 miliardi e, successivamente, una versione multilingua” ha annunciato Uljan Sharka.
“Siamo contenti che un’azienda italiana, con un progetto innovativo che cerca di rendere possibile una postura, un’interpretazione, un “bias” – inteso nel senso di tendenza – italiano, dal punto di vista di dati, immagini ecc., abbia avuto la possibilità di accedere alla potenza di calcolo di Leonardo: a conferma del ruolo di Cineca come abilitatore dell’innovazione digitale e della competitività del Paese” ha sottolineato Alessandra Poggiani, Direttrice Generale di Cineca.

Per garantire l’integrità etica dei contenuti generati dal modello, sono stati sviluppati filtri di sicurezza specifici per la lingua italiana, pensati per rimuovere contenuti sensibili, espliciti e ad alto potenziale di bias (questa volta inteso nel senso di distrorsione), nonché per limitare al massimo l’esposizione di contenuti coperti da copyright.

Ma perché avere un LLM italiano? I motivi sono diversi: intanto ha ovviamente una maggiore efficacia nella gestione della lingua, e anche dell’output, dato che non deve tradurre la richiesta in inglese, elaborarla e ritradurla in italiano come avviene con gli altri LLM, come quelli di OpenAI, Anthropic, Google, Meta ecc.
“Inoltre Italia è in grado di elaborare e generare token in italiano con prestazioni equivalenti adun aumento del 60% della sua finestra di contesto: una notevole efficienza in termini di costi e risorse necessarie per servire il modello, aspetto essenziale per una soluzione di IA pensata per il mondo aziendale” conclude Sharka.

Infine: come funziona Italia? Abbiamo avuto la possibilità di fargli qualche domanda, come utenti consumer (che, hanno ribadito con forza i tecnici di iGenius presenti, NON è lo scopo dell’LLM) e al momento ci sembra di poter dire che potenzialità ce ne sono ma bisogna ancora “studiare”. Sicuramente il “bias” nazionale è piuttosto palese, il rilancio della propaganda italiana è evidentemente tra le cose buone. Errori ne ha fatti molti, sia di informazioni sia di logica e di calcolo matematico, ma le risposte, giuste o sbagliate che siano, sono probabilmente scritte in un italiani migliore di quanto facciano ChatGpt &Co.
Qui sotto un po’ di videate delle domande che ho fatto. Ai lettori il giudizio (alle risposte e, ovviamente, alle domande, volutamente tendenziose). In ogni caso da oggi ognuno potrà interrogare Italia a suo piacere, scaricandolo da qui.

Fonte : Repubblica