Un’azienda di intelligenza artificiale genera in laboratorio 500 milioni di anni di evoluzione finché non trova una proteina fluorescente artificiale | Salute e benessere
Gli scienziati si chiedono se l’evoluzione avrebbe potuto prendere una strada diversa. Ad esempio, se fosse inevitabile che emergessero gli esseri umani, o se fossimo il prodotto di una serie di eventi naturali che non sarebbero potuti accadere, dando vita a un mondo alternativo. Non esiste una risposta definitiva, ma oggi l’intelligenza artificiale (AI) può intraprendere esperimenti evolutivi. Uno di questi, pubblicato questa settimana sulla rivista Scienzarivela che nella progettazione di un tipo di proteina c’erano altri possibili percorsi che la natura non ha esplorato. E questa tecnologia può fornire indizi preziosi per la creazione di nuove terapie e altre applicazioni.
Nel suo libro del 1989 La vita meravigliosail biologo evoluzionista Stephen Jay Gould ha proposto un esperimento mentale: se si potesse riavvolgere il nastro dell’evoluzione della vita terrestre per tornare all’inizio e ricominciare da capo, il risultato sarebbe lo stesso che conosciamo, o completamente diverso? Gould si pronunciava a favore della seconda: in un nuovo gioco, usando la similitudine dei videogiochi, l’evoluzione avrebbe preso una strada molto diversa e gli esseri umani non esisterebbero. “Riproduci il nastro un milione di volte… e dubito che qualcosa del genere Un uomo saggio potrebbe evolversi di nuovo”, ha scritto.
Da allora la tesi di Gould è stata ampiamente dibattuta, con opinioni a favore del determinismo e altre a favore della contingenza. Nella sua storia del 1952 Il rumore del tuonol’autore di fantascienza Ray Bradbury ha raccontato come un viaggiatore del tempo che calpestò una farfalla nell’era dei dinosauri cambiò il corso del futuro. Gould espresse la stessa idea: “Modifica qualsiasi evento iniziale, anche se molto lieve e di nessuna importanza apparente in quel momento, e l’evoluzione scorre in un canale completamente diverso”.
Parla il linguaggio delle proteine
Gli scienziati hanno studiato questo problema attraverso esperimenti che cercano di ricreare l’evoluzione in laboratorio o in natura, o confrontando specie nate in condizioni simili. Oggi c’è una nuova strada: l’AI. A New York, un gruppo di ex ricercatori di Meta, la società madre di social network come Facebook, Instagram e WhatsApp, ha fondato EvolutionaryScale, una startup di intelligenza artificiale focalizzata sulla biologia. Il sistema ESM3 (EvolutionaryScale Model 3), creato da questa azienda, è un modello di linguaggio generativo; il tipo di piattaforma a cui appartiene il noto ChatGPT, ma ESM3 non genera testi, bensì proteine, i mattoni fondamentali della vita.
L’ESM3 riceve dati di sequenza, struttura e funzione da proteine esistenti per apprendere il linguaggio biologico di queste molecole e crearne di nuove. I suoi creatori lo hanno addestrato con 771 miliardi di pacchetti di dati creati da 3,15 miliardi di sequenze, 236 milioni di strutture e 539 milioni di tratti funzionali, per un totale di più di un trilione di teraflop (una misura delle prestazioni computazionali), la più grande potenza di calcolo mai utilizzata in biologia, secondo l’azienda stessa.
“ESM3 fa un passo avanti verso un futuro della biologia, in cui l’intelligenza artificiale è uno strumento per costruire, partendo dai principi primi, il modo in cui costruiamo strutture, macchine e microchip”, afferma il co-fondatore e capo scienziato di EvolutionaryScale e direttore del nuovo studio, Alessandro Rives. La sua visione è che la biologia sia la tecnologia più avanzata mai creata e che sia programmabile, poiché utilizza un alfabeto comune, il codice genetico che viene tradotto in aminoacidi, i mattoni delle proteine. “ESM3 comprende tutti questi dati biologici, li traduce e li parla fluentemente per usarli come strumento generativo”.
La proteina che non lo era
Rives e i suoi collaboratori hanno applicato l’ESM3 al problema della creazione di una nuova proteina fluorescente verde (GFP). La GFP è una proteina naturale che si illumina di verde sotto la luce ultravioletta e viene utilizzata nella ricerca come marcatore. Il primo è stato scoperto in una medusa, ma ne esistono altre versioni nei coralli o negli anemoni. Gli scienziati hanno addestrato ESM3 a creare una nuova GFP, e il risultato li ha sorpresi: una proteina fluorescente, che hanno chiamato esmGFP, che assomiglia solo al 58% a quella più simile, che secondo i ricercatori equivale a simulare 500 milioni di anni dell’evoluzione. ESM3 è ora disponibile alla comunità scientifica come un nuovo strumento per la progettazione di nuove proteine con usi terapeutici, di bonifica ambientale e altri usi.
L’intelligenza artificiale ha così trovato una nuova strada che la natura avrebbe potuto intraprendere 500 milioni di anni fa, ma che, per ragioni sconosciute, ha ignorato. Rives e i suoi collaboratori spiegano che solo poche mutazioni della GFP possono distruggere la fluorescenza; e che, però, ESM3 ha trovato un nuovo spazio di proteine fluorescenti che avrebbero potuto esserci, ma non lo erano: “Sotto queste sequenze c’è un linguaggio fondamentale della biologia delle proteine che può essere compreso utilizzando modelli linguistici”.
Secondo Jonathan Losos, professore all’Università di Washington che lavora sulla questione del riavvolgimento dell’evoluzione studiando le specie in natura, “questo studio è un brillante esempio del fatto che esistono molti modi in cui l’evoluzione avrebbe potuto procedere”. Losos valuta i risultati del lavoro come una conferma della contingenza difesa da Gould. Lo vede anche Zachary Blount, professore alla Michigan State University, che ha mostrato la contingenza dell’evoluzione in un famoso esperimento di coltivazione di batteri iniziato nel 1988 dal suo ex supervisore, Richard Lenski, e che continua ancora dopo più di 80.000 generazioni.
“Lo studio mostra che esistono possibilità biologiche praticabili che non si sono evolute (crediamo) sulla Terra, suggerendo percorsi autentici che l’evoluzione avrebbe potuto prendere, ma non lo ha fatto perché non si è verificata la storia necessaria”, dice Blount, avvertendo che anche lì c’è un certo determinismo in natura; Nell’esperimento ESM3 c’è una somiglianza del 42% con altri GFP. Blount non pensa che l’intelligenza artificiale risolverà il problema del riavvolgimento, ma crede che aiuterà a capire cosa è contingente, cosa non lo è e perché: “Ci dà modo di sondare il regno delle possibilità biologiche, permettendoci di confrontare cosa “È biologicamente possibile con ciò che esiste o è esistito”.