Google, l’AI di DeepMind ora prevede anche la struttura del dna

In passato la comprensione delle strutture proteiche richiedeva un lavoro minuzioso svolto grazie a microscopi elettronici e a una tecnica chiamata cristallografia a raggi X. Diversi anni fa, alcuni gruppi di ricerca accademici hanno iniziato a testare le potenzialità del deep learning, la tecnica al centro di molti recenti progressi dell’AI, per prevedere la forma delle proteine a partire dagli amminoacidi che le compongono, imparando da strutture verificate.

Nel 2018 Google DeepMind ha annunciato che stava lavorando a un software di AI chiamato AlphaFold per prevedere con precisione la forma delle proteine. Nel 2020, AlphaFold 2 ha prodotto risultati sufficientemente accurati da generare un’ondata di entusiasmo nel campo della biologia molecolare. Un anno dopo, l’azienda ha distribuito una versione open source del sistema, utilizzabile quindi da chiunque, insieme alle previsioni di 350mila strutture proteiche, tra cui quasi tutte le proteine conosciute nel corpo umano, per poi toccare addirittura quota 200 milioni nel 2022.

La capacità di AlphaFold di modellare diverse proteine è stata migliorata in parte grazie a un algoritmo chiamato modello di diffusione (diffusion model), che aiuta i generatori di immagini AI come Dall-E e Midjourney a creare immagini bizzarre e talvolta fotorealistiche. Il modello di diffusione di AlphaFold 3 rende più nitide le strutture molecolari generate dal software ed è in grado di generare modelli proteici plausibili sulla base degli schemi rilevati nell’analisi di una serie di strutture proteiche verificate, proprio come un generatore di immagini impara dalle fotografie reali.

Detto questo, AlphaFold 3 non perfetto. L’AI di DeepMind integra una scala di affidabilità basata sui colori che permette di interpretare l’attendibilità delle sue previsioni: le aree di una struttura proteica in blu indicano per esempio un’elevato tasso di attendibilità, mentre le zone in rosso denotano una minore certezza.

L’AI e il futuro della ricerca scientifica

David Baker, un professore dell’università di Washington a capo di un gruppo che lavora sulle tecniche di progettazione delle proteine, ha provato a “sfidare” AlphaFold. Nel 2021, prima che DeepMind lanciasse la sua creazione, il suo team ha prodotto una previsione indipendente della struttura proteica ispirata ad AlphaFold. Di recente il suo laboratorio ha distribuito un modello di diffusione che aiuta a modellare una gamma più ampia di strutture molecolari, pur ammettendo che AlphaFold 3 è più capace. Le prestazioni di AlphaFold 3 in termini di previsioni delle strutture sono davvero impressionanti, ha detto Baker, secondo cui è un peccato che il codice sorgente del sistema non sia stato messo a disposizione della comunità scientifica.

Hassabis, che dirige tutte le iniziative di Alphabet nel campo dell’intelligenza artificiale, si sta focalizzando ormai da tempo alle potenzialità dell’intelligenza artificiale per accelerare la ricerca scientifica. Il numero uno di DeepMind è convinto che le ultime tecniche sviluppate dalla divisione AI di Google per AlphaFold potrebbero rivelarsi utili per la creazione di sistemi più generali che puntino a superare le capacità umane in molte ambiti. Se nel prossimo decennio i programmi di AI come Gemini diventeranno molto più capaci, continua Hassabis, “potrebbero utilizzare sistemi come AlphaFold come strumenti per raggiungere altri obiettivi“.

Questo articolo è apparso originariamente su Wired US.

Fonte : Wired