Il 2023 si chiude come era cominciato, con un’accusa di violazione di copyright contro una IA generativa. Rispetto a gennaio, questa volta il bersaglio è più grosso: se a inizio anno fu Getty a portare in tribunale Stable Diffusion, questa volta è il New York Times a fare causa addirittura a OpenAI (e quindi a Microsoft) e alla sua ChatGPT. Il celeberrimo quotidiano americano ha spiegato di essere intenzionato a difendere il diritto di autore e online (qui) ha raccontato che milioni di suoi articoli sarebbero stati usati per addestrare la popolare chatbot di Sam Altman, che ora (paradossalmente) gli fa concorrenza come forma affidabile di informazione.
Le ragioni della causa
Secondo l’NYT, le due società (OpenAI è ormai diventata una costola di Microsoft) avrebbero sfruttato senza permesso i suoi contenuti per creare le loro IA, compresi prodotti molto noti (e molto redditizi) come appunto ChatGPT e Copilot. La causa, che potrebbe avere significative ripercussioni sul mondo dell’informazione, anche alla luce del recente accordo fra Apple e alcuni editori proprio per allenare le sue IA con le news, segue mesi di negoziazioni commerciali tra le tre società, che però non avrebbero portato ad alcun accordo. Al diffondersi della notizia, il titolo del New York Times è salito in Borsa dello 0,25%, mentre quello di Microsoft ha perso lo 0,2%.
Non è la prima volta che accade (e probabilmente non sarà l’ultima) perché questo metodo di addestramento, cioè leggere online milioni e milioni di pagine e farle proprio, è quello principale per più o meno tutte le IA. E qui nasce il primo problema, come su Italian Tech abbiamo spiegato spesso: a chi appartengono le fonti originarie da cui ChatGPT, Copilot e altri prodotti di OpenAI e Microsoft hanno imparato a fare quello che fanno? Secondo la redazione del New York Times, appartengono al New York Times, che dovrebbe essere remunerato per questo tipo di utilizzo. O almeno avvisato del fatto che tutto questo avvenga.
L’altro problema è più generale e riguarda l’utilizzo che si fa di queste informazioni (quelle contenute negli articoli dei giornalisti, le foto, le immagini, i disegni, le opere d’arte mostrate online): raccolte in enormi database, vengono solitamente messe a disposizione gratuitamente, a patto che se ne faccia un uso non a scopo di lucro (è il concetto del Fair Use ed è spiegato qui). Cosa che è decisamente l’opposto di quello che stanno facendo OpenAI e Microsoft con i loro prodotti.
Fonte : Repubblica