¿Quién hará que AlphaFold3 sea de código abierto? Los científicos corren para romper el paradigma de la inteligencia artificial


Modelo AlphaFold3 de una quinasa de unión química.Crédito: Laboratorios isomórficos

Cuando Google DeepMind presentó AlphaFold31 – el La última versión de la revolucionaria IA para la predicción de la estructura de proteínas – en naturaleza Este mes, llegó con un problema. A diferencia de la versión anterior2no había ningún código informático que describiera el progreso que acompañaba al artículo.

La empresa con sede en Londres cambió de rumbo días después y prometió publicar el código antes de fin de año. Pero esta omisión hace que investigadores de todo el mundo se apresuren a desarrollar sus propias versiones de código abierto de AlphaFold3, un modelo de inteligencia artificial (IA) que puede… Predicción de la estructura de las proteínas., así como otras moléculas, incluidos posibles nuevos fármacos. Otros científicos están haciendo todo lo posible para piratear la versión web de AlphaFold3 lanzada por DeepMind para evitar sus limitaciones.

“Sería malo si esto terminara siendo muy básico para nuestra capacidad de descubrir medicamentos y otras cosas relevantes para la salud humana”, dice Mohammed Al-Quraishi, biólogo computacional de la Universidad de Columbia en la ciudad de Nueva York. Su equipo “OpenFold” ya ha comenzado3 Están codificando una versión de código abierto de AlphaFold3 y esperan completarla este año.

Los científicos estaban decepcionados

El bloqueo inicial de DeepMind del código AlphaFold3, así como la publicación del 9 de mayo en naturalezaMuchos eruditos estaban confundidos (naturalezaSu equipo de noticias es independiente del equipo de revista. naturalezaLas políticas de Estados Unidos establecen que normalmente se debe proporcionar el código asociado con los estudios, reconociendo que pueden existir limitaciones.

“Esto es inconsistente con los principios del progreso científico, que dependen de la capacidad de la sociedad para evaluar, utilizar y aprovechar el trabajo existente”, decía la publicación del 11 de mayo. Carta abierta a naturaleza Fue coescrito por Stephanie Wankovich, bióloga estructural computacional de la Universidad de California en San Francisco, y otros nueve científicos, y desde entonces ha sido firmado por más de 600 investigadores.

See also  Los científicos han descubierto por primera vez un campo eléctrico dipolo invisible alrededor de la Tierra, según un nuevo estudio

en Editorial Publicado el 22 de mayo de naturaleza Dijo que agradecía la conversación provocada por la publicación de AlphaFold3 y que estaba buscando las opiniones de los lectores sobre cómo fomentar la apertura en la ciencia. Añadió que sus políticas apoyan la ciencia abierta, pero reconoce que el sector privado financia la mayor parte de la investigación global y que muchos de los resultados de ese trabajo siguen siendo propietarios. “estamos en naturaleza Creo que es importante que las revistas interactúen con el sector privado y trabajen con sus científicos para que puedan enviar sus investigaciones para revisión por pares y publicación. La revista dijo que actualizará el artículo con el código cuando DeepMind lo publique.

En lugar del código y los parámetros obtenidos del entrenamiento de AlphaFold3 llamados Model Weights, DeepMind creó un sitio web donde los investigadores pueden acceder a la herramienta. Pero este servidor AlphaFold3 tiene limitaciones: sólo se puede utilizar para investigaciones no comerciales y no es posible obtener estructuras de proteínas asociadas con fármacos potenciales. El artículo que describe AlphaFold3 también contiene un “pseudocódigo” detallado que explica cómo funciona el modelo.

Reentrenamiento Alpha Fold

Roland Dunbrack, biólogo estructural computacional del Fox Chase Cancer Center en Filadelfia, Pensilvania, quien dice que revisó el artículo AlphaFold3 para naturalezaDice que se sintió decepcionado porque DeepMind no publicó el código, ni para su revisión ni para su publicación. La disponibilidad del código AlphaFold2 ha ampliado su alcance y ha permitido a los investigadores adaptar y mejorar la herramienta. “Quería el código descargable por la ciencia que sucedería si yo y otros tuviéramos acceso a él”, dice Dunbrack, coautor de la carta abierta.

See also  Revisión de Alienware m16 R2: la mejor computadora portátil para juegos RTX 4070

El 13 de mayo, días después de que comenzara la reacción violenta, DeepMind cambió su postura y Anunciar Harán que el código AlphaFold3 y los pesos del modelo estén disponibles para uso académico dentro de seis meses.

Pero quedan dudas sobre si esta versión de AlphaFold3 tendrá toda la gama de capacidades, especialmente la capacidad de predecir la estructura de las proteínas junto con posibles moléculas o ligandos de fármacos, dicen los científicos. “No creo que nos den la capacidad de producir ningún ligando”, dice Dunbrack. Dice que el modelo OpenFold3 que el equipo de Quraishi está desarrollando no tendrá tales restricciones ni restricciones de uso comercial.

Hay otras razones para que los científicos busquen versiones de código abierto de AlphaFold3. Uno de ellos, afirma Al-Quraishi, es la capacidad de volver a entrenar el modelo para formular mejor las interacciones entre proteínas y fármacos potenciales. Su equipo volvió a entrenar su versión de AlphaFold2 utilizando los mismos conjuntos de datos disponibles públicamente que utilizó DeepMind. Pero Al Quraishi espera que muchas compañías farmacéuticas, que tienen acceso a conjuntos de estructuras de proteínas determinadas experimentalmente asociadas con medicamentos potenciales, estén interesadas en tener una versión de AlphaFold3 que puedan volver a entrenar utilizando sus datos patentados, lo que podría mejorar el rendimiento del modelo.

Al-Quraishi no es el único científico que intenta descubrir los secretos de AlphaFold3. David Becker, biofísico computacional de la Universidad de Washington en Seattle, quiere ver qué se puede aplicar a un modelo de predicción química y de proteínas de código abierto que desarrolló su equipo llamado RoseTTAFold-All-Atom, que aún no está operativo. Y también AlphaFold3.

Phil Wang, un ingeniero de software independiente de San Francisco, ha iniciado un esfuerzo en equipo para replicar el último modelo de DeepMind. Wang, que también tiene un título en medicina, ha desarrollado versiones de código abierto de docenas de modelos de IA, incluida la herramienta de generación de imágenes DALL-E. Wang ha recibido apoyo financiero para su trabajo de empresas para hacer esto en el pasado, pero aún no ha recibido ofertas para trabajar en el desbloqueo de AlphaFold3.

See also  Palabra del día: respuestas y sugerencias para el 13 de octubre

Versiones pirateadas

Wang dice que su equipo de tres personas espera completar el código que describe el modelo AlphaFold3 dentro de un mes. Pero el paso que llevará más tiempo será entrenar los modelos sobre estructuras de proteínas determinadas experimentalmente y otros conjuntos de datos, afirma Al-Quraishi. “El código es, con diferencia, la pieza más sencilla. Eso representa el 5% del esfuerzo”.

También es probable que sean costosos, afirma Sergei Ovchinnikov, biólogo evolutivo del Instituto Tecnológico de Massachusetts en Cambridge. Entrenar AlphaFold3 de la misma manera que DeepMind podría costar hasta $ 1 millón en recursos de computación en la nube, aunque es posible reducir los costos sin comprometer el rendimiento.

La versión de código totalmente abierto de AlphaFold3 permitirá a los investigadores comprender mejor cómo funciona el modelo y ampliar sus capacidades. Pero algunos científicos ya están intentando hacerlo utilizando el servidor AlphaFold3. “Ya se han realizado algunos trucos en línea”, dice Ovchinnikov, por ejemplo, para obtener modelos más precisos de proteínas incrustadas en la membrana celular, donde interactúan con las moléculas de grasa. Otro hackeo al servidor reveló una conformación alternativa adoptada por una de las proteínas.

Al-Quraishi espera que los esfuerzos para desarrollar versiones de código abierto de AlphaFold3 sirvan como una “advertencia” para los académicos sobre los peligros de depender de empresas de tecnología como DeepMind para desarrollar y distribuir herramientas como AlphaFold. “Es bueno que lo hayan hecho, pero no debemos confiar en ello”, dice. “Necesitamos crear infraestructura en el sector público para poder hacer esto en el mundo académico”.



Source Article Link

Leave a Comment