Le case farmaceutiche stanno iniziando a usare algoritmi per l’apprendimento automatico per sondare l’immenso universo della chimica e individuare tra milioni di composti in vitro, con rapidità e a costi contenuti, i migliori candidati per lo sviluppo di nuovi farmaci. Ma alcuni esperti sonoscettici e gli gli approcci computazionali hanno ancora molto da dimostrare: la soluzione potrebbe essere nella collaborazione tra uomo e macchina (di Asher Mullard)
Nel 2016 la casa farmaceutica Sunovion ha affidato a un gruppo di esperti dipendenti un incarico insolito. Alla sede dell’azienda a Marlborough, nel Massachusetts, tutti i chimici sono stati invitati a competere per vedere chi avrebbe scoperto i migliori potenziali nuovi farmaci. Sulle loro postazioni di lavoro hanno trovato una griglia di centinaia di strutture chimiche, dieci delle quali con informazioni sui loro effetti biologici. Gli esperti dovevano selezionare altre molecole che avrebbero potuto essere candidate a diventare farmaci, ricorrendo alle loro conoscenze sulle strutture chimiche e di biologia. Degli 11 sfidanti, 10 si sono impegnati nel lavoro per diverse ore. Uno si è impegnato per alcuni millisecondi, perché era un algoritmo.
Quel programma informatico è opera di Willem van Hoorn, responsabile della divisione di chemioinformatica di Exscientia, una start up che usa l’intelligenza artificiale (IA) per la progettazione di farmaci. La società, con sede a Dundee, in Inghilterra, ha voluto ampliare un partenariato con la Sunovion, alzando la posta in gioco. “C’era di mezzo la mia credibilità”, dice van Hoorn. Dopo venti round della competizione ha controllato il suo punteggio. E tirato un sospiro di sollievo. L’algoritmo padroneggiava molto bene almeno alcune delle oscure arti della chimica: un solo esperto farmacologo aveva battuto la macchina.
Exscientia è solo uno dei sempre più numerosi gruppi industriali e universitari che si rivolgono ai computer per esplorare l’enormemente complessità dell’universo chimico.
I chimici stimano che possano essere creati 1060 composti con caratteristiche simili a farmaci, ossia un numero di piccole molecole superiore a quello degli atomi nel sistema solare. La speranza è che gli algoritmi cataloghino, caratterizzino e confrontino le proprietà di milioni di composti in vitro per aiutare i ricercatori a trovare rapidamente ed economicamente i migliori candidati a farmaco per un bersaglio terapeutico. I fautori di questa strategia sostengono che potrebbe rendere più sicure le medicine, assicurare che meno farmaci falliscano i test degli studi clinici e consentire la scoperta di nuove classi di farmaci. Potrebbe anche aiutare ad aprire nuovi campi della chimica finora inesplorati o presunti sterili.
Ma molti farmacologi rimangono scettici, per nulla convinti che l’ineffabile complessità della chimica possa essere ridotta a semplici linee di codice. Anche i sostenitori dell’IA riconoscono che molti tentativi sono falliti: i composti generati dal computer possono essere infarciti di componenti difficili da produrre, come anelli a 3 o 4 atomi, o infestati da gruppi reattivi che porrebbero problemi di sicurezza del farmaco. “Alcuni approcci computazionali possono andare male quando i ricercatori non conoscono il campo”, dice van Hoorn. “I composti che propongono sono semplicemente ridicoli”. Ma afferma che un tocco umano esperto potrebbe comunque addomesticare questi ingegnosi designer digitali. “Penso che alcune di queste idee potrebbero funzionare se gli esperti informatici collaborassero con persone che vivono davvero la chimica”.
Esplorare lo spazio chimico
Per navigare nell’universo chimico, è importante disporre di una mappa. Nel 2001, il chimico Jean-Louis Reymond, dell’Università di Berna, in Svizzera, ha iniziato a usare il computer per mappare quanto più spazio chimico possibile. Dopo 16 anni, ha raccolto il più grande database di molecole di piccole dimensioni del mondo, una gigantesca raccolta virtuale di 166 miliardi di composti. Il database, chiamato GDB-17, comprende tutte le molecole organiche chimicamente realizzabili fino a 17 atomi, il massimo di quanto potessero fare i computer di Reymond. “Solo per compilare un elenco dei composti nel database un computer impiegherebbe più di 10 ore”, dice Reymond.
Per ogni farmaco commercializzato, esistono milioni di composti chimicamente quasi identici, che differiscono magari solo per un idrogeno in più qui o un doppio legame là. E alcuni di questi funzioneranno meglio del farmaco approvato. I chimici non possono concepire tutte queste varianti senza un aiuto. “Non c’è modo di ottenere questi isomeri usando carta e penna”, dice Reymond.
Ma Reymond e il suo gruppo possono identificare sostanze terapeuticamente promettenti “molto vicine” a farmaci testati ricercando somiglianze tra i composti. Usando un particolare farmaco come punto di partenza, il team può scorrere in soli 3 minuti tutti i 166 miliardi di composti presenti nel database alla ricerca di candidati a farmaco. In un saggio di prova, Reymond ha iniziato con una molecola nota che lega il recettore nicotinico dell’acetilcolina, un utile bersaglio per disturbi che coinvolgono il sistema nervoso o la funzione muscolare, e ha compilato una lista di 344 composti correlati. Il team ne ha sintetizzati tre, scoprendo che due potrebbero attivare potentemente il recettore e rivelarsi utili per trattare l’atrofia muscolare dovuta all’invecchiamento. E’ un po’ come usare una mappa geologica per capire dove scavare alla ricerca dell’oro, dice Reymond. “Serve un modo per scegliere dove scavare”, dice.
Un approccio alternativo usa i computer per setacciare molti punti di ricerca dell’oro senza preoccuparsi troppo della posizione di partenza. In termini di caccia al farmaco, significa setacciare grandi biblioteche chimiche in vitro per trovare piccole molecole che si legano a una determinata proteina. In primo luogo, i ricercatori devono prendere un’istantanea di una proteina usando la cristallografia a raggi X così da determinare la forma del suo sito di legame. Quindi, usando gli algoritmi di legame molecolare, i chimici computazionali possono scorrere le collezioni di composti per trovare le migliori corrispondenze per qualsiasi specifico sito di legame.
In provetta, sette di questi candidati hanno mostrato l’attività desiderata. Un ulteriore sviluppo ha trasformato uno di questi in PZM21, un composto che agisce sul recettore μ-opioide senza attivare la β-arrestina. La società biotecnologica Epiodyne – con sede a San Francisco, in California, e co-fondata da Shoichet – sta ora cercando di sviluppare un antidolorifico più sicuro basato su questi risultati. Shoichet prevede di usare lo stesso approccio per trovare composti che modulino altri recettori accoppiati a proteine G (GPCR), una famiglia di proteine che rappresenta circa il 40 per cento degli obiettivi del farmaco.
La sua squadra sta eseguendo anche esperimenti simili con una nebulosa virtuale di 100 milioni di composti che non sono mai stati prodotti prima ma che dovrebbero essere di facile sintesi. Gli sviluppatori di farmaci dell’industria del settore stanno verificando anche questo approccio: la società biotecnologica Nimbus Therapeutics, con sede a Cambridge, in Massachusetts, incorpora nei suoi screening di legame composti virtuali con caratteristiche proprie di sostanze chimiche naturali che di solito devono essere faticosamente ricavate da ambienti naturali come il suolo. Se questo procedimento potrà portare a farmaci è ancora sub iudice, ma Don Nicholson, direttore generale della società, dice che per almeno un programma di progettazione farmacologica “è da qui che vengono tutti i nostri colpi”.
I risultati preliminari di screening virtuale stanno scuotendo una delle assunzioni di base di Shoichet riguardanti lo spazio chimico: che valga la pena di esaminare solo regioni consolidate e ricche di farmaci. Le galassie di molecole ben caratterizzate sono così colme di composti biologicamente attivi che alcuni sostengono che sia uno spreco di tempo cercare altrove. “Per tutta la mia carriera ho seguito questa linea di pensiero. Aveva senso, anche se non c’erano molte prove a sostenerla “, dice Shoichet. Ma gli inaspettati risultati dei suoi screening su 100 milioni di composti stanno aumentando il suo interesse per le regioni meno esplorate dello spazio chimico. “Sto cominciando a pensare che quelle galassie siano piene d’oro”.
In vitro
Questi approcci di ricerca sono provati e testati, ma i computer coinvolti possono seguire solo le istruzioni scritte. L’ultima frontiera nella scoperta computazionale di farmaci è l’apprendimento automatico, in cui gli algoritmi usano dati ed esperienze per apprendere quali composti si legano a quali bersagli, trovando modelli invisibili all’occhio umano. Una dozzina di aziende sono sorte proprio per creare algoritmi di ricerca di farmaci, che possono testare in collaborazione con grandi aziende farmaceutiche.
Andrew Hopkins, direttore generale di Exscientia, indica un caso indicativo della potenza di questi approcci. Ci vogliono mediamente 4,5 anni per scoprire e ottimizzare i candidati farmaci per i test preclinici e i chimici spesso sintetizzano migliaia di composti per arrivare a una sostanza promettente (che persino a quel punto ha solo una piccola probabilità di arrivare alla commercializzazione). L’approccio di Exscientia, che utilizza vari algoritmi, incluso quello che ha impressionato i dirigenti della divisione ricerca e sviluppo della Sunovion, potrebbe ridurre questa linea temporale a un solo anno, e ridurre il numero di composti presi in considerazione in una tipica campagna di scoperta di farmaci.
Oltre a individuare i migliori candidati, gli algoritmi di apprendimento automatico possono anche aiutare gli sviluppatori di farmaci a decidere rapidamente quali composti eliminare, afferma Brandon Allgood, direttore della divisione tecnologica della Numerate, azienda di progettazione farmacologica basata sull’IA con sede a San Bruno, in California. Non c’è motivo di sintetizzare e testare un composto che nel giro di pochi mesi non riesca a superare i test di tossicità o di assorbimento, dice. Con l’IA, “ci vuole solo un millisecondo per decidere dentro o fuori”, afferma Allgood, che si era formato come cosmologo prima di iniziare a usare gli strumenti dell’IA per studiare il cosmo chimico. Quest’anno la Numerate ha messo a segno due accordi con aziende farmaceutiche, tra cui uno con la Servier, con sede a Suresnes, in Francia, per sottoporre farmaci scoperti con l’IA a studi clinici che ne testino l’efficacia nell’insufficienza cardiaca e nelle aritmie.
Gli investimenti delle industrie fioriscono, ma gli approcci computazionali hanno ancora molto da dimostrare. La collezione di sostanze de Reymond è gigantesca rispetto ad altre biblioteche, ma copre la frazione minima dell’universo chimico (vedi l’infografica di “Nature”). Nonostante i 166 miliardi di composti presenti nel suo data base, deve ancora andare alla ricerca di un astronomo che cerchi di contare tutte le stelle del cielo notturno, ma finora ne ha trovato solo uno. Gli screening che fanno affidamento sulla corrispondenza fra proteine e farmaci richiedono la definizione di strutture cristalline molto precise per produrre i migliori risultati e questi dati richiedono tempo, denaro e competenza per essere ottenuti. Questi metodi inoltre faticano a trattare le proteine in movimento e i loro suggerimenti non sono molto soddisfacenti. Gli algoritmi di apprendimento meccanico, da parte loro, funzionano bene solo nella misura in cui sono buoni i set di dati usati per il loro addestramento, mentre funzionano particolarmente male quando incontrano composti che sembrano diversi dalle molecole che hanno già incontrato. Inoltre, i programmi funzionano come scatole nere e non possono indicare perché prevedono che un composto sarà buono.
Molti approcci computazionali hanno anche un’abitudine fastidiosa: suggerire candidati che sono un vero e proprio incubo da creare in laboratorio. I chimici devono faticosamente definire una ricetta per il composto suggerito, e questo può richiedere mesi o più. Anche allora, non c’è garanzia che la molecola funzioni una volta prodotta. L’approccio di Reymond predice correttamente un profilo di attività del composto solo il 5-10 per cento delle volte, e ciò significa che i chimici devono affannarsi a produrre fino a 20 composti per trovarne uno che funzioni come previsto. “Direi che il collo di bottiglia nella nostra esplorazione dello spazio chimico è la capacità di produrre composti”, dice Reymond. Per questo, di recente ha scremato il suo universo chimico fino a una lista di 10 milioni di molecole di facile realizzazione, pur coprono ancora una vasta gamma di proprietà.
Mark Murcko, direttore scientifico della Relay Therapeutics a Cambridge, in Massachusetts, pensa che i chimici computazionali dovrebbero concentrarsi meno sulle nuove strategie algoritmiche e più sul miglioramento dei set di dati da cui apprendono. “Uno dei modi migliori di rendere più efficace un modello predittivo è continuare a nutrirlo sempre di più, e sempre meglio, di dati”, dice. La Relay, come atre società, hanno chimici operativi che lavorano a stretto contatto con gli informatici, sintetizzando i composti proposti sia dagli esseri umani che dagli algoritmi e usando i risultati ottenuti per migliorare le decisioni future.
Per Hopkins, queste collaborazioni sono la chiave. Ci sono voluti decenni perché gli informatici riuscissero a scrivere programmi in grado di competere con i grandi maestri di scacchi. Poi, nel 1997, Deep Blue della IBM ha battuto Garry Kasparov. Ma la sconfitta non ha segnato la fine degli scacchi. Invece, Kasparov ha creato una versione del gioco in cui si fronteggiano due squadre, ciascuna composta da un giocatore umano e una IA. “Insieme l’uomo e l’IA possono sovrastare qualsiasi uomo, ma possono anche superare qualsiasi algoritmo”, dice Hopkins. Lui vuole lo stesso mix di macinazione dei dati, creatività e buon senso per trasformare la scoperta dei farmaci. “Credo che siamo all’incontri Kasparov-Deep Blue”.
(L’originale di questo articolo è stato pubblicato su Nature il 26 settembre 2017. Traduzione ed editing a cura di Le Scienze. Riproduzione autorizzata, tutti i diritti riservati.)