Modello Italia, la sfida italiana a ChatGPT

Cineca ci ha messo la capacità computazionale del supercomputer Leonardo, iGenius l’esperienza e la proprietà intellettuale: il risultato è Modello Italia, applicazione di intelligenza artificiale che punta a competere con colossi come ChatGPT. Una competizione che si baserà sull’attenzione alla privacy, sulla scelta di una licenza open source e su soluzioni che mettano al riparo dalle allucinazioni che colpiscono i large language models (Llm).

Un modello tutto italiano

Da OpenAI a Google, passando per Meta e arrivando fino alla francese Mistral e alla cinese 01.AI, tutti i principali modelli oggi sul mercato sono addestrati su dataset che parlano in inglese. “Questo genera un bias culturale estremamente pericoloso se pensiamo che, in futuro, molti servizi e prodotti saranno gestiti con un’interfaccia utente basata sul linguaggio naturale”, spiega a Wired Uljan Sharka, fondatore e amministratore delegato di iGenius, azienda milanese che si occupa di sviluppare applicazioni basate sull’AI. “Quando andiamo su modelli di larga scala – prosegue – si inserisce un bias culturale non indifferente e non accettabile. Stiamo sottovalutando l’effetto che la lingua ha sull’addestramento dei modelli. Di qui la scelta di utilizzare solamente dataset in lingua italiana per alimentare il supercomputer che sta addestrando Modello Italia.

“L’Italia può vantare un’infrastruttura pubblica di supercalcolo tra le migliori al mondo – sottolinea il presidente di Cineca Francesco Ubertini – grazie alla quale oggi una startup italiana entra nell’arena internazionale dei modelli di linguaggio, con una soluzione completamente aperta, affidabile e pienamente conforme ai principi nazionali ed europei”.

La licenza open source

“Vogliamo democratizzare l’accesso a queste tecnologie”, afferma l’ad di iGenius. Per questo, in un contesto i modelli dei principali presenti sul mercato sono proprietari, la scelta compiuta dall’azienda milanese e dal consorzio Cineca è stata quella di ricorrere alla licenza Mit. Sviluppata dall’omonima università americana, consente il riutilizzo del software. L’obiettivo, in altre parole, è che, oltre alla versione standard, sulla base di questo Llm possano nascere diverse soluzioni realizzate da qualunque sviluppatore sia interessato a usare Modello Italia come base per la costruzione di applicazioni legate all’intelligenza artificiale. O che possono avere bisogno di un modello che parli l’italiano come prima lingua.

Sviluppato mentre il Parlamento e Consiglio europeo discutevano l’AI Act, Modello Italia è stato costruito rispettando le previsioni normative europee. Sul fronte del copyright, spiega Sharka, per addestrare il modello “abbiamo selezionato dataset con licenza aperta, come ad esempio Wikipedia, e abbiamo costruito dei filtri che evitassero l’impiego di contenuti protetti”. L’elenco completo delle fonti sarà reso pubblico, come provede la licenza Mit, ma il fatto che al Cineca facciano capo 118 enti pubblici, tra i quali 2 ministeri e 70 università italiane lascia intendere quali possano essere i dataset che stanno addestrando l’algoritmo.

Fonte : Wired