Cellula virtuale, la più grande banca dati di cellule per allenare modelli di Ai è ora accessibile a tutti

Un passo importante per la creazione della cellula virtuale. Il 25 febbraio 2025 l’ Arc Institute, nonprofit californiana per lo sviluppo di modelli innovativi di ricerca, ha lanciato in collaborazione con Vevo Therapeutics l’Arc Virtual Cell Atlas: una collezione di misure di migliaia di molecole per 300 milioni di cellule. L’Atlas include due banche dati:

  • Tahoe-100M, che misura 60.000 interazioni tra farmaci e cellule, per 50 tipi di cellule cancerogene
  • scBaseCamp, che include migliaia di tipi diversi di cellule di 21 specie animali, raggruppate da svariati studi pubblici.

Accessibile a tutti gratuitamente, nel complesso si tratta della più grande banca dati di misure a singola cellula, una risorsa fondamentale per costruire terapie mirate usando l’intelligenza artificiale (AI).

Mentre leggete queste parole, le molecole danzano nel vostro cervello. Negli ultimi quindici anni, gli scienziati hanno imparato a misurare migliaia di queste molecole contemporaneamente, digitalizzando una cellula alla volta, con tecniche come la trascrittomica, la proteomica, e la metabolomica. Più di recente, sono stati messi a punto metodi che misurano queste molecole in risposta a “perturbazioni”, spesso farmaci o agenti chimici e biologici che modulano un gene o una proteina. Infatti, la risposta di una cellula all’aumento o alla diminuzione di una molecola può rivelare la funzione di quella molecola. Come quando togliamo una spezia da una ricetta: è allora, quando manca, che capiamo il ruolo di quella spezia nel sapore finale. Una molecola di cui si conoscono le funzioni diventa un possibile bersaglio per disegnare farmaci.

La creazione di una cellula virtuale che simuli accuratamente in un computer i comportamenti di queste molecole in una cellula reale è considerata da tempo l’obiettivo della biologia computazionale. I primi tentativi di creare cellule virtuali risalgono agli anni ’90, basati su equazioni deterministiche per descrivere ogni molecola e interazione tra molecole, ma questa strada, molto utile per capire i batteri, si è rivelata limitata per le cellule umane, troppo complesse.

Dal 2023, i primi modelli di linguaggio “cellulari” (che invece delle parole usano la quantità di ciascuna molecola) hanno iniziato a simulare le cellule umane senza equazioni precise, ma con l’AI generativa. Questi modelli condividono molti principi di funzionamento con ChatGPT, Claude e Deepseek, e sono possibili grazie alle grandi masse di dati molecolari che sono state generate nell’ultimo decennio. Come per allenare ChatGPT è servito l’intero web, per allenare modelli di linguaggio cellulari e costruire una vera e propria cellula virtuale servono molte cellule e molte molecole in risposta a molte perturbazioni. Le perturbazioni sono come “domande” che facciamo alle cellule, e le loro risposte addestrano la cellula virtuale, come le domande in linguaggio umano hanno addestrato ChatGPT. La banca dati di misure a singola cellula in risposta a perturbazioni rilasciata per questo motivo dall’Arc Institute, in open access, rende possibile allenare modelli di AI su una scala senza precedenti. Queste AI potranno simulare come reagirà una cellula a perturbazioni mai testate in laboratorio.

L’obiettivo per la cellula virtuale è un modello di intelligenza artificiale multimodale che possa rappresentare e simulare il comportamento di molecole, cellule e tessuti in diversi stati. Per quanto non sappiamo ancora quanti e quali dati serviranno per avere simulazioni realistiche, e con quali costi, la cellula virtuale potrebbe rendere lo sviluppo di farmaci più efficiente e prevedibile, auspicabilmente portando sul mercato nuovi farmaci per malattie senza trattamento in tempi più rapidi. La cellula virtuale aprirà le porte alla possibilità di creare “gemelli digitali” delle cellule di un paziente, incorporando profili a singola cellula e informazioni cliniche per monitorare condizioni di salute e suggerire interventi. Infine, la cellula virtuale potrebbe rivoluzionare le terapie cellulari, permettendo di progettare modifiche cellulari mirate per malattie rare e tumori.

Fonte : Wired