Secondo il responsabile dell’intelligenza artificiale di Microsoft Mustafa Suleyman, i contenuti pubblicati su internet possono essere copiati o riutilizzati a piacimento da chiunque. L’idea, espressa durante un’intervista al canale americano Cnbc, ha inevitabilmente riacceso il dibattito sullo sfruttamento di materiali protetti da copyright per l’addestramento di modelli di AI avanzata.
Cosa ha detto Mustafa Suleyman
Quando gli è stato chiesto se le aziende di intelligenza artificiale stiano rubando “la proprietà intellettuale del mondo” per addestrare i loro algoritmi, Suleyman (che è anche uno dei fondatori di DeepMind) ha risposto che il “contratto sociale” in vigore dagli anni Novanta prevede che le informazioni disponibili sul web aperto possano essere utilizzate liberamente nell’ambito del fair use, la dottrina che consente di usare materiale protetto da copyright a scopi di informazione. In altre parole, “chiunque può copiare, ricreare o riprodurre” i contenuti online, che rappresenterebbero dei “freeware”.
X content
This content can also be viewed on the site it originates from.
Il leader dell’AI del colosso di Redmond riconosce che esistono dati esplicitamente protetti. “C’è una categoria a parte, in cui un sito, un editore o un’organizzazione giornalistica vietano esplicitamente lo scraping o il crawling per qualsiasi motivo diverso dall’indicizzazione […]. È una zona grigia e credo che finirà nei tribunali”, ha specificato Suleyman, aggiungendo però di non conoscere nessuno che non abbia attinto comunque queste informazioni e sottolineando che le leggi sulla proprietà intellettuale devono essere modificate.
“L’economia dell’informazione sta per cambiare radicalmente. [Grazie all’intelligenza artificiale] ridurremo a zero il costo della produzione di conoscenza. È molto difficile da accettare per le persone, ma tra 15-20 anni produrremo nuove conoscenze scientifiche e culturali a un costo prossimo allo zero“, ha continuato il numero uno dell’AI i Microsoft.
Il grande dibattito sui dati dell’AI
Le dichiarazioni di Suleyman arrivano in un momento di grandi discussioni intorno al tema dell’uso improprio della proprietà intellettuale per lo sviluppo di sistemi di intelligenza artificiale sempre più potenti. Microsoft è il principale investitore e partner di OpenAI ed entrambe le aziende sono coinvolte in una serie di controversie legali per presunte violazioni del copyright.
La startup che ha creato ChatGPT è stata fortemente criticata per non aver rivelato le fonti da cui estrae i dati usati per migliorare le prestazioni dei suoi algoritmi e all’inizio di quest’anno ha dichiarato che è “impossibile addestrare i principali modelli di IA di oggi senza ricorrere a materiali protetti“.
Gli analisti avvertono che la disponibilità di nuovi dati che possano essere utilizzati senza violare i diritti di proprietà intellettuale è diventata un problema crescente per le aziende che sviluppano soluzioni AI. Il Wall Street Journal avverte che c’è più del 50% di possibilità che la domanda di informazioni affidabili per allenare gli algoritmi di intelligenza artificiale superi l’offerta entro il 2028.
Questo articolo è apparso originariamente su Wired en español.
Fonte : Wired