Google l’aveva annunciato alcuni mesi fa, ma ora la funzione è finalmente è disponibile anche in Italia: si può delegare all’intelligenza artificiale la “visione” di una clip di YouTube.
Gemini, vale a dire il chatbot che sfrutta l’omonima IA di Google, non vedrà la clip sul serio – ne parliamo meglio più avanti – ma il risultato è praticamente identico. E permetterà all’utente di farsi un’idea veloce del contenuto del video.
Ma come si fa? È molto semplice: basta aprire Gemini, appunto, aprire le “impostazioni”, cliccare su “Estensioni” e assicurarsi che quella di YouTube sia attiva.
Poi è sufficiente tornare alla schermata principale, incollare l’indirizzo di un video di YouTube nella barra in basso, riservata al testo, e chiedere all’IA: “Riassumi questo video”.
A questo punto il gioco è fatto: si ottiene una sintesi più o meno lunga del contenuto.
Come ci riesce l’IA?
Con un piccolo trucco: Gemini non guarda effettivamente le immagini ma si basa sulla trascrizione di ciò che viene detto in un determinato video. Si tratta, in gran parte dei casi, del testo messo insieme a partire dai sottotitoli che YouTube genera automaticamente.
Nonostante si possa contare su una sintesi scritta in italiano, l’estensione di Gemini per YouTube sembra funzionare a dovere – nel momento in cui scriviamo – soltanto con i contenuti in lingua inglese. Abbiamo provato a offrire a Gemini clip in italiano, provvisti di trascrizione, ma è stato impossibile ottenere un riassunto. La nostra lingua comunque risulta tra quelle supportate da Gemini: non è escluso che a breve questa limitazione venga rimossa.
Si possono anche fare domande specifiche sul contenuto di un video. Ma è importante sapere che si possono chiedere informazioni solo su clip che contengono un discorso, una conversazione, un’intervista o comunque sia del parlato. Se si prova a incollare la Url di un video di YouTube senza audio, o con suoni ambientali, Gemini non sarà in grado di soddisfare la richiesta dell’utente.
Inoltre bisogna sempre tenere a mente che l’IA, nelle sue risposte, potrebbe inventare qualcosa.
Abbiamo provato a chiedere, per esempio, le frasi chiave di una lezione di recitazione tenuta da Tom Hanks. Ma quelle che ha restituito l’IA avevano un timecode totalmente sballato. Forse Hanks le ha pronunciate nel corso della sua lezione di un’ora, ma di certo non ai punti indicati dall’intelligenza artificiale.
È evidente che il fact-checking di un sommario, o di altre risposte dell’IA sul contenuto di un video, è più semplice se si ha a che fare con un video breve.
Va detto che esistono da tempo strumenti più o meno noti che permettono di fare una sintesi dei video di YouTube. Anche questi si basano sulla trascrizione dei contenuti. Ma in molti casi il funzionamento di questi strumenti “non ufficiali” è complesso e non è efficace.
Il riassunto con Gemini invece è l’ideale, perché lo “studio” dei video di YouTube è praticamente integrato. A questo proposito, Google ha lanciato anche altre “estensioni” che permettono alla sua IA di operare direttamente nell’ambiente Workspace (con impatto, quindi, su Gmail e Google Docs) oppure in Google Maps. In più sono state rilasciate due estensioni che si occupano di una ricerca più intelligente di voli e hotel.
Tutte queste estensioni si possono attivare o disattivare nelle impostazioni di Gemini.
Va tenuto in conto che Google, se l’utente non interviene disabilitando le sue “attività” su Gemini (icona in basso a sinistra, col simbolo di un orologio), può usare le conversazioni con l’IA, la posizione e tutta una serie di feedback per migliorare e addestrare la sua intelligenza artificiale.
Fonte : Repubblica