Google DeepMind ha presentado una nueva versión de AlphaFold, su transformador modelo de aprendizaje automático que predice la forma y el comportamiento de las proteínas. AlphaFold 3 no solo es más preciso, sino que también predice las interacciones con otras biomoléculas, convirtiéndolo en una herramienta de investigación mucho más versátil. Y la compañía está ofreciendo una versión limitada del modelo de uso gratuito en línea.
Desde el debut de la primera versión de AlphaFold en 2018, el modelo ha seguido siendo el método líder para predecir la estructura de las proteínas a partir de la secuencia de aminoácidos que las componen.
Aunque parezca una tarea bastante específica, es fundamental para casi toda la biología entender las proteínas —que realizan una variedad casi infinita de tareas en nuestros cuerpos— a nivel molecular. En los últimos años, las técnicas de modelado computacional como AlphaFold y RoseTTaFold han reemplazado a los costosos métodos de laboratorio, acelerando el trabajo de miles de investigadores en muchos campos.
Pero la tecnología sigue siendo un trabajo en progreso, con cada modelo “sólo un paso en el camino”, como dijo el fundador de DeepMind, Demis Hassabis, en una conferencia de prensa sobre el nuevo sistema. La compañía adelantó el lanzamiento a finales del año pasado, pero este marca su debut oficial.
Dejaré que los blogs científicos se adentren en cómo exactamente el nuevo modelo mejora los resultados, pero basta decir aquí que una variedad de mejoras y técnicas de modelado han hecho que AlphaFold 3 no solo sea más preciso, sino también más ampliamente aplicable.
Una de las limitaciones del modelado de proteínas es que, incluso si conoces la forma que tomará una secuencia de aminoácidos, eso no significa necesariamente que sepas a qué otras moléculas se unirá y cómo. Y si realmente quieres hacer cosas con estas moléculas, como la mayoría, necesitabas averiguarlo a través de un modelado y pruebas más laboriosos.
“La biología es un sistema dinámico, y tienes que entender cómo las propiedades de la biología surgieron a través de las interacciones entre diferentes moléculas en la célula. Y puedes pensar en AlphaFold 3 como nuestro primer gran paso hacia eso”, dijo Hassabis. “Es capaz de modelar proteínas que interactúan, por supuesto, con otras proteínas, pero también con otras biomoléculas, incluyendo, de manera importante, hebras de ADN y ARN”.
AlphaFold 3 permite simular múltiples moléculas a la vez, por ejemplo, una hebra de ADN, algunas moléculas que se unen al ADN y quizás algunos iones para darle sabor. Aquí está lo que obtienes para una combinación así, con las cintas de ADN subiendo por el medio, las proteínas aglomerándose a un lado, y creo que esos son los iones anidados en el medio como pequeños huevos:
Esto, por supuesto, no es un descubrimiento científico en sí mismo. Pero incluso averiguar que una proteína experimental se uniría en absoluto, o de esta manera, o se contorsionaría para adoptar esta forma, generalmente era cuestión de días como mínimo o quizás semanas o meses.
Si bien es difícil exagerar la emoción en este campo en los últimos años, los investigadores han estado en gran medida limitados por la falta de modelado de interacción (del cual la nueva versión ofrece una forma) y la dificultad de implementar el modelo.
Este segundo problema es quizás el mayor de los dos, ya que si bien las nuevas técnicas de modelado eran “abiertas” en cierto sentido, como otros modelos de IA, no son necesariamente sencillas de implementar y operar. Es por eso que Google DeepMind está ofreciendo AlphaFold Server, una aplicación web gratuita y totalmente alojada que pone el modelo a disposición para uso no comercial.
Es gratis y bastante fácil de usar: lo hice en otra ventana durante la llamada mientras lo explicaban (así es como obtuve la imagen anterior). Solo necesitas una cuenta de Google, y luego le proporcionas tantas secuencias y categorías como pueda manejar (hay algunos ejemplos proporcionados) y lo envías; en unos minutos tu trabajo debería estar listo y se te dará una molécula 3D en vivo coloreada para representar la confianza del modelo en la conformación en esa posición. Como puedes ver en la de arriba, las puntas de las cintas y esas partes más expuestas a átomos rebeldes son más claras o rojas para indicar menos confianza.
Pregunté si había alguna diferencia real entre el modelo disponible públicamente y el que se está utilizando internamente; Hassabis dijo que “Hemos puesto a disposición la mayoría de las nuevas capacidades del modelo”, pero no elaboró más allá de eso.
Es claramente Google haciendo gala de su peso, manteniendo lo mejor para sí mismos, lo cual por supuesto es su prerrogativa. Hacer una herramienta gratuita y alojada como esta implica dedicar considerables recursos a la tarea: no se equivoquen, esto es un pozo sin fondo, una costosa (para Google) versión de shareware para convencer a los investigadores del mundo de que AlphaFold 3 debería ser, al menos, una flecha en su carcaj.
Está bien, aunque, porque la tecnología probablemente imprimirá dinero a través de la subsidiaria de Alphabet (lo que la convierte en… prima de Google), Isomorphic Labs, que está poniendo herramientas computacionales como AlphaFold a trabajar en el diseño de fármacos. Bueno, todos están usando herramientas computacionales estos días, pero Isomorphic tuvo la primera oportunidad con los últimos modelos de DeepMind, combinándolos con “algunas cosas más propietarias relacionadas con el descubrimiento de fármacos”, como señaló Hassabis. La compañía ya tiene asociaciones con Eli Lilly y Novartis.
AlphaFold no es el todo y el fin de la biología, aunque sí una herramienta muy útil, como muchos investigadores estarán de acuerdo. Y les permite hacer lo que Max Jaderberg de Isomorphic llamó “diseño racional de fármacos”.
“Si pensamos en el día a día, en cómo esto tiene un impacto en Isomorphic Labs: permite a nuestros científicos, nuestros diseñadores de fármacos, crear y probar hipótesis a nivel atómico, y luego en segundos producir predicciones de estructura altamente precisas… para ayudar a los científicos a razonar sobre cuáles son las interacciones a realizar y cómo avanzar en esos diseños para crear un buen fármaco”, dijo. “Esto se compara con los meses o incluso años que podría tomar hacerlo experimentalmente”.
Mientras muchos celebrarán el logro y la amplia disponibilidad de una herramienta gratuita y alojada como AlphaFold Server, otros señalarán con razón que esto realmente no es una victoria para la ciencia abierta.
Como muchos modelos de IA proprietarios, el proceso de entrenamiento de AlphaFold y otra información crucial para replicarlo – una parte fundamental del método científico – son en gran parte retenidos y cada vez más restringidos. Si bien el artículo publicado en Nature aborda los métodos de su creación con cierto detalle, faltan muchos detalles e información importantes. Esto significa que los científicos que deseen utilizar la herramienta más poderosa de biología molecular en el planeta tendrán que hacerlo bajo la mirada atenta de Alphabet, Google y DeepMind (quién sabe cuál realmente tiene las riendas).
Los defensores de la ciencia abierta han afirmado durante años que, si bien estos avances son notables, a largo plazo es mejor compartir abiertamente este tipo de información. Después de todo, así es como avanza la ciencia, e incluso cómo ha evolucionado gran parte del software más importante del mundo.
Hacer que AlphaFold Server sea gratis para cualquier uso académico o no comercial es, en muchos sentidos, un acto muy generoso de parte de Google. Pero la generosidad de esta compañía rara vez viene sin ataduras. Sin duda, muchos investigadores aprovecharán este período de gracia para utilizar el modelo tanto como sea humanamente posible antes de que lleguen mayores restricciones.
Más noticias
¿Windows 11 en un celular? Así lo lograron con éxito
Meta revoluciona la IA: Conoce el nuevo Llama 3.3 70B
¿Qué pasa con Bitcoin? Análisis de su reciente volatilidad