Sora, Sundar Pichai sostiene che OpenAI avrebbe violato la policy di YouTube per addestrarla

Guai in arrivo per OpenAI, che potrebbe aver violato i termini e le condizioni d’uso di YouTube per addestrare il suo modello text-to-video Sora. Ad affermarlo è il CEO di Google Sundar Pichai in un’intervista rilasciata al giornalista Nilay Patel di The Verge, in cui ha chiaramente espresso i suoi dubbi sulla nuova intelligenza di OpenAI. Secondo quanto rivelato da Pichai, infatti, già da qualche tempo YouTube stava “seguendo e cercando di capire” come la società madre di ChatGpt avesse addestrato il modello in grado di generare video di alta qualità a partire da un semplice prompt di testo.

X content

This content can also be viewed on the site it originates from.

A marzo, in occasione della presentazione di Sora, in un’intervista al Wall Street Journal il CTO Mira Murati ha dichiarato che la compagnia ha “utilizzato dati disponibili pubblicamente e dati concessi in licenza” per addestrare il suo nuovo modello. Un’affermazione che già allora ha sollevato non pochi dubbi tra i professionisti del settore, dato che la Murati è stata alquanto vaga quando le è stato chiesto se OpenAI avesse preso dati da piattaforme come YouTube e Instagram. “In realtà non ne sono sicura – ha risposto -. Sa, se fossero pubblicamente disponibili all’uso, allora lì potrebbero esserci dei dati. Ma non ne sono sicura”.

Una risposta non certamente esaustiva, che è rimasta nel dimenticatoio fino allo scorso mese, quando il CEO YouTube Neal Mohan ha dichiarato a Bloomberg che se OpenAI avesse addestrato Sora sui video pubblicati sulla piattaforma sarebbe stata una “chiara violazione” dei suoi termini di utilizzo. Oltre che un gesto poco rispettoso nei confronti dei creator, “che si aspettano che questi termini vengano rispettati”. E ora la questione torna alla ribalta con le affermazioni di Sundar Pichai, che alla domanda “Quindi ti sei sentito come se avessero infranto i tuoi termini e condizioni?” ha risposto con un secco “Esattamente. Sì, esattamente”.

Con questa dichiarazione – o accusa, che dir si voglia -, il CEO di Google riporta l’attenzione su una questione alquanto spinosa per l’evoluzione dell’AI, ossia la carenza di dati da destinare alla formazione dei modelli di grandi dimensioni. D’altronde, non è la prima volta che aziende del settore si trovano ad affrontare critiche per la violazione del copyright. E siamo certi che non sarà neppure l’ultima.

Fonte : Wired