Categories
Life Style

La herramienta de predicción de proteínas con IA AlphaFold3 ahora es de código abierto

[ad_1]

Estructura proteica del complejo 7PZA Clr-cAMP-ADN.

AlphaFold3 puede predecir la estructura de las proteínas cuando interactúan con el ADN.Crédito: Ferrell et al./Sociedad Estadounidense de Microbiología,mol*, RCSB PDB

AlphaFold3 finalmente está abierto. Seis meses después de Google DeepMind El código fue bloqueado polémicamente De un Un artículo que describe un modelo de predicción de la estructura de las proteínas.Los científicos ahora pueden Descarga el código del programa Y el uso de la herramienta de inteligencia artificial (IA) para aplicaciones no comerciales, como anunció el 11 de noviembre la compañía, con sede en Londres.

“Estamos muy emocionados de ver qué hace la gente con esto”, dijo el mes pasado John Jumper, quien dirige el equipo AlphaFold de DeepMind, junto con el director ejecutivo Demis Hassabis. Ganó una parte del Premio Nobel de Química 2024 Por su trabajo en la herramienta de inteligencia artificial.

AlphaFold3, a diferencia de sus predecesores, es Capaz de modelar proteínas en coordinación con otras moléculas.. Pero en lugar de publicar su código central, como sucedió con Pliegue alfa 2 DeepMind proporcionó acceso a través de un servidor web, restringiendo la cantidad y los tipos de predicciones que los científicos podían hacer.

Lo más importante es que el servidor AlphaFold3 impidió que los científicos predijeran cómo se comportarían las proteínas en presencia de posibles fármacos. Pero ahora, la decisión de DeepMind de publicar el código significa que los científicos académicos pueden predecir tales interacciones ejecutando el modelo ellos mismos.

Inicialmente, la compañía dijo que hacer que AlphaFold3 esté disponible solo a través de un servidor web logra el equilibrio adecuado entre permitir el acceso para la investigación y proteger las ambiciones comerciales. Isomorphic Labs, una filial londinense de DeepMind, está aplicando AlphaFold3 al descubrimiento de fármacos.

Pero implementar AlphaFold3 sin su código o pesos de modelo (parámetros obtenidos entrenando el programa en estructuras de proteínas y otros datos) Provocó críticas de los académicos.quien dijo que la medida socavaba el potencial reproductivo. DeepMind rápidamente cambió de rumbo y dijo que proporcionaría una versión de código abierto de la herramienta dentro de medio año.

Ahora cualquiera puede descargar el código del software AlphaFold3 y utilizarlo de forma no comercial. Pero actualmente, sólo los académicos con afiliación académica pueden acceder a las pesas de entrenamiento previa solicitud.

Versiones accesibles

DeepMind se ha enfrentado a la competencia: en los últimos meses, varias empresas se han enfrentado a ella Se presentan herramientas de predicción de estructuras de proteínas de código abierto basadas en AlphaFold3basado en las especificaciones descritas en el artículo original conocido como pseudocódigo.

Dos empresas chinas, el gigante tecnológico Baidu y el desarrollador de TikTok ByteDance, han lanzado sus propios modelos inspirados en Alpha Fold 3, al igual que una startup en San Francisco, California, llamada Zhai Discovery.

Una limitación importante de estos modelos es que, al igual que AlphaFold3, ninguno de ellos tiene licencia para aplicaciones comerciales, como el descubrimiento de fármacos, afirma Mohammed Al-Quraishi, biólogo computacional de la Universidad de Columbia en la ciudad de Nueva York. Sin embargo, el prototipo de Chai Discovery, Chai-1, podría utilizarse a través de un servidor web para este tipo de trabajo, afirma Jack Dent, uno de los fundadores de la empresa.

Otra empresa, Ligo Biosciences, con sede en San Francisco, ha lanzado una versión sin conexión de AlphaFold3. Pero todavía no tiene toda la gama de capacidades, incluida la capacidad de modelar fármacos y moléculas distintas de las proteínas.

Otros equipos están trabajando en versiones de AlphaFold3 que no tengan tales límites: Al-Quraishi espera tener disponible un modelo de código completamente abierto llamado OpenFold3 para fin de año. Esto permitiría a las empresas farmacéuticas volver a entrenar sus propias versiones del modelo utilizando datos patentados, como las estructuras de las proteínas unidas a diferentes fármacos, lo que podría conducir a un mejor rendimiento.

La apertura es importante

El año pasado se produjo una avalancha de nuevos modelos biológicos de IA lanzados por empresas con diferentes enfoques de apertura. Anthony Jeter, biólogo computacional de la Universidad de Wisconsin-Madison, no tiene ningún problema con que empresas con fines de lucro se unan a su campo, siempre y cuando sigan las mismas reglas que otros científicos cuando comparten su trabajo en revistas y servidores de preimpresión.

Jeter añade que si DeepMind hace afirmaciones sobre AlphaFold3 en una publicación científica, “yo y otros también esperaríamos que compartieran información sobre cómo hace predicciones y diseñaran sus modelos y códigos de IA de una manera que podamos examinar”. “Mi grupo no se basará en herramientas que no podamos examinar y utilizar”.

El hecho de que ya hayan surgido tantas copias de AlphaFold3 muestra que el modelo era replicable, incluso sin código fuente abierto, dice Pushmeet Kohli, jefe de IA para ciencia en DeepMind. Añade que en el futuro le gustaría ver más debates sobre los estándares de publicación en un campo donde el número de investigadores académicos y empresariales está aumentando.

La naturaleza de código abierto de AlphaFold2 ha dado lugar a una avalancha de innovaciones por parte de otros científicos. Por ejemplo, los ganadores de un reciente concurso de diseño de proteínas utilizaron una herramienta de inteligencia artificial para el diseño. Nuevas proteínas capaces de unirse al objetivo del cáncer. El reciente hack AlphaFold2 favorito de Jumper fue el de un equipo que usó la herramienta para Identificar la proteína clave que ayuda a los espermatozoides a unirse a los óvulos.

Jumper no puede esperar a que lleguen tales sorpresas después de la participación de AlphaFold3, incluso si no siempre se materializan. “La gente lo utilizará de formas extrañas”, predice. “A veces fracasarás y otras veces triunfarás”.

[ad_2]

Source Article Link

Categories
Life Style

¿Quién hará que AlphaFold3 sea de código abierto? Los científicos corren para romper el paradigma de la inteligencia artificial

[ad_1]

Vista de primer plano de los detalles de una representación por computadora de un diagrama de la proteína PI5P4Kγ.

Modelo AlphaFold3 de una quinasa de unión química.Crédito: Laboratorios isomórficos

Cuando Google DeepMind presentó AlphaFold31 – el La última versión de la revolucionaria IA para la predicción de la estructura de proteínas – en naturaleza Este mes, llegó con un problema. A diferencia de la versión anterior2no había ningún código informático que describiera el progreso que acompañaba al artículo.

La empresa con sede en Londres cambió de rumbo días después y prometió publicar el código antes de fin de año. Pero esta omisión hace que investigadores de todo el mundo se apresuren a desarrollar sus propias versiones de código abierto de AlphaFold3, un modelo de inteligencia artificial (IA) que puede… Predicción de la estructura de las proteínas., así como otras moléculas, incluidos posibles nuevos fármacos. Otros científicos están haciendo todo lo posible para piratear la versión web de AlphaFold3 lanzada por DeepMind para evitar sus limitaciones.

“Sería malo si esto terminara siendo muy básico para nuestra capacidad de descubrir medicamentos y otras cosas relevantes para la salud humana”, dice Mohammed Al-Quraishi, biólogo computacional de la Universidad de Columbia en la ciudad de Nueva York. Su equipo “OpenFold” ya ha comenzado3 Están codificando una versión de código abierto de AlphaFold3 y esperan completarla este año.

Los científicos estaban decepcionados

El bloqueo inicial de DeepMind del código AlphaFold3, así como la publicación del 9 de mayo en naturalezaMuchos eruditos estaban confundidos (naturalezaSu equipo de noticias es independiente del equipo de revista. naturalezaLas políticas de Estados Unidos establecen que normalmente se debe proporcionar el código asociado con los estudios, reconociendo que pueden existir limitaciones.

“Esto es inconsistente con los principios del progreso científico, que dependen de la capacidad de la sociedad para evaluar, utilizar y aprovechar el trabajo existente”, decía la publicación del 11 de mayo. Carta abierta a naturaleza Fue coescrito por Stephanie Wankovich, bióloga estructural computacional de la Universidad de California en San Francisco, y otros nueve científicos, y desde entonces ha sido firmado por más de 600 investigadores.

en Editorial Publicado el 22 de mayo de naturaleza Dijo que agradecía la conversación provocada por la publicación de AlphaFold3 y que estaba buscando las opiniones de los lectores sobre cómo fomentar la apertura en la ciencia. Añadió que sus políticas apoyan la ciencia abierta, pero reconoce que el sector privado financia la mayor parte de la investigación global y que muchos de los resultados de ese trabajo siguen siendo propietarios. “estamos en naturaleza Creo que es importante que las revistas interactúen con el sector privado y trabajen con sus científicos para que puedan enviar sus investigaciones para revisión por pares y publicación. La revista dijo que actualizará el artículo con el código cuando DeepMind lo publique.

En lugar del código y los parámetros obtenidos del entrenamiento de AlphaFold3 llamados Model Weights, DeepMind creó un sitio web donde los investigadores pueden acceder a la herramienta. Pero este servidor AlphaFold3 tiene limitaciones: sólo se puede utilizar para investigaciones no comerciales y no es posible obtener estructuras de proteínas asociadas con fármacos potenciales. El artículo que describe AlphaFold3 también contiene un “pseudocódigo” detallado que explica cómo funciona el modelo.

Reentrenamiento Alpha Fold

Roland Dunbrack, biólogo estructural computacional del Fox Chase Cancer Center en Filadelfia, Pensilvania, quien dice que revisó el artículo AlphaFold3 para naturalezaDice que se sintió decepcionado porque DeepMind no publicó el código, ni para su revisión ni para su publicación. La disponibilidad del código AlphaFold2 ha ampliado su alcance y ha permitido a los investigadores adaptar y mejorar la herramienta. “Quería el código descargable por la ciencia que sucedería si yo y otros tuviéramos acceso a él”, dice Dunbrack, coautor de la carta abierta.

El 13 de mayo, días después de que comenzara la reacción violenta, DeepMind cambió su postura y Anunciar Harán que el código AlphaFold3 y los pesos del modelo estén disponibles para uso académico dentro de seis meses.

Pero quedan dudas sobre si esta versión de AlphaFold3 tendrá toda la gama de capacidades, especialmente la capacidad de predecir la estructura de las proteínas junto con posibles moléculas o ligandos de fármacos, dicen los científicos. “No creo que nos den la capacidad de producir ningún ligando”, dice Dunbrack. Dice que el modelo OpenFold3 que el equipo de Quraishi está desarrollando no tendrá tales restricciones ni restricciones de uso comercial.

Hay otras razones para que los científicos busquen versiones de código abierto de AlphaFold3. Uno de ellos, afirma Al-Quraishi, es la capacidad de volver a entrenar el modelo para formular mejor las interacciones entre proteínas y fármacos potenciales. Su equipo volvió a entrenar su versión de AlphaFold2 utilizando los mismos conjuntos de datos disponibles públicamente que utilizó DeepMind. Pero Al Quraishi espera que muchas compañías farmacéuticas, que tienen acceso a conjuntos de estructuras de proteínas determinadas experimentalmente asociadas con medicamentos potenciales, estén interesadas en tener una versión de AlphaFold3 que puedan volver a entrenar utilizando sus datos patentados, lo que podría mejorar el rendimiento del modelo.

Al-Quraishi no es el único científico que intenta descubrir los secretos de AlphaFold3. David Becker, biofísico computacional de la Universidad de Washington en Seattle, quiere ver qué se puede aplicar a un modelo de predicción química y de proteínas de código abierto que desarrolló su equipo llamado RoseTTAFold-All-Atom, que aún no está operativo. Y también AlphaFold3.

Phil Wang, un ingeniero de software independiente de San Francisco, ha iniciado un esfuerzo en equipo para replicar el último modelo de DeepMind. Wang, que también tiene un título en medicina, ha desarrollado versiones de código abierto de docenas de modelos de IA, incluida la herramienta de generación de imágenes DALL-E. Wang ha recibido apoyo financiero para su trabajo de empresas para hacer esto en el pasado, pero aún no ha recibido ofertas para trabajar en el desbloqueo de AlphaFold3.

Versiones pirateadas

Wang dice que su equipo de tres personas espera completar el código que describe el modelo AlphaFold3 dentro de un mes. Pero el paso que llevará más tiempo será entrenar los modelos sobre estructuras de proteínas determinadas experimentalmente y otros conjuntos de datos, afirma Al-Quraishi. “El código es, con diferencia, la pieza más sencilla. Eso representa el 5% del esfuerzo”.

También es probable que sean costosos, afirma Sergei Ovchinnikov, biólogo evolutivo del Instituto Tecnológico de Massachusetts en Cambridge. Entrenar AlphaFold3 de la misma manera que DeepMind podría costar hasta $ 1 millón en recursos de computación en la nube, aunque es posible reducir los costos sin comprometer el rendimiento.

La versión de código totalmente abierto de AlphaFold3 permitirá a los investigadores comprender mejor cómo funciona el modelo y ampliar sus capacidades. Pero algunos científicos ya están intentando hacerlo utilizando el servidor AlphaFold3. “Ya se han realizado algunos trucos en línea”, dice Ovchinnikov, por ejemplo, para obtener modelos más precisos de proteínas incrustadas en la membrana celular, donde interactúan con las moléculas de grasa. Otro hackeo al servidor reveló una conformación alternativa adoptada por una de las proteínas.

Al-Quraishi espera que los esfuerzos para desarrollar versiones de código abierto de AlphaFold3 sirvan como una “advertencia” para los académicos sobre los peligros de depender de empresas de tecnología como DeepMind para desarrollar y distribuir herramientas como AlphaFold. “Es bueno que lo hayan hecho, pero no debemos confiar en ello”, dice. “Necesitamos crear infraestructura en el sector público para poder hacer esto en el mundo académico”.

[ad_2]

Source Article Link

Categories
Life Style

AlphaFold3 – ¿Por qué Nature lo publicó sin su código?

[ad_1]

Vista aérea del MIT, Cambridge, Boston.  En primer plano está el Strata Centre, diseñado por el arquitecto Frank Gehry.

Un grupo tecnológico en Cambridge, Massachusetts, permite a investigadores de diferentes sectores colaborar fácilmente.Crédito: Brooks Craft LLC/Corbis/Getty

La última versión del algoritmo de predicción de la estructura de proteínas AlphaFold ha generado un gran interés desde su lanzamiento, acompañada de un artículo en naturalezaa principios de este mes1. A diferencia de su predecesor AlphaFold2, AlphaFold3 puede predecir no sólo las estructuras de los complejos de proteínas, sino también cuándo las proteínas interactúan con otros tipos de moléculas, incluidos el ADN y el ARN. La herramienta de IA será importante tanto en la investigación básica como en el descubrimiento de fármacos.

Pero su lanzamiento también generó preguntas y críticas tanto del equipo AlphaFold de Google DeepMind en Londres como… naturaleza. Cuando se publicó AlphaFold22El código central completo ahora es accesible para todos los investigadores. Pero AlphaFold3 viene con un “pseudocódigo”: una descripción detallada de lo que el código puede hacer y cómo funciona.

Esta no fue una decisión que tomamos a la ligera y este editorial explica sucintamente nuestras razones. Creemos que la investigación, independientemente del sector en el que se realice, debe evaluarse mediante revisión por pares y publicarse en beneficio de la sociedad y la ciencia. Al mismo tiempo, no queremos que ésta sea la última palabra. Esta es una oportunidad para mantener una conversación importante entre todas las partes interesadas en la investigación en un momento en que la mayoría de la investigación mundial recibe financiación privada.

Los conceptos básicos de cómo la comunidad utilizará la nueva versión de AlphaFold siguen siendo los mismos: cualquier persona con una cuenta de Google puede utilizar la herramienta de forma gratuita para aplicaciones no comerciales. Pero existen diferencias importantes entre la última versión y las versiones anteriores. Vale la pena señalar que para AlphaFold2, el equipo de DeepMind trabajó con el Instituto Europeo de Bioinformática del Laboratorio Europeo de Biología Molecular, una organización de investigación intergubernamental (y financiada con fondos públicos) con sede en Cambridge, Reino Unido. Los investigadores de DeepMind entrenaron sus programas en miles de registros publicados de estructuras de proteínas y sus conformaciones conocidas.

Ahora, DeepMind se ha asociado con Isomorphic Labs, una empresa de desarrollo de fármacos con sede en Londres propiedad de Alphabet, la empresa matriz de Google. Además de la falta de disponibilidad del código completo, existen otras limitaciones en el uso de la herramienta, por ejemplo, en el desarrollo de fármacos. También existen límites diarios en la cantidad de predicciones que pueden hacer los investigadores individuales.

Muchos investigadores están decepcionados por estas limitaciones. En una carta abierta a naturaleza (ser visto go.nature.com/3k9acav), sus autores señalan que la falta de código fuente abierto limita los esfuerzos de verificación y replicación. El mensaje tuvo impacto. Poco después de su publicación, el vicepresidente de investigación de DeepMind, Pushmeet Kohli, publicó en la plataforma de redes sociales Éste es un paso importante y naturaleza La hoja publicada se actualizará una vez que se publique el código.

Pero, ¿por qué permitimos que se restrinjan todos los datos y el código en el momento de la implementación? naturalezaLas políticas editoriales de se desarrollaron para apoyar la ciencia y el estado abiertos: “Se solicita a los autores que pongan los materiales, datos, códigos y protocolos asociados inmediatamente a disposición de los lectores sin calificaciones indebidas”. Una forma de capacitar a los investigadores para que hagan esto es asociándonos con Code Ocean, una plataforma de ciencia computacional que hace que la información sea repetible y rastreable. Pero nuestras políticas también reconocen la posibilidad de limitaciones, que “deben revelarse a los editores en el momento de la presentación” y acordarse con los editores. La política también establece: “Cualquier motivo que impida la necesidad de compartir código o algoritmo será evaluado por los editores, quienes se reservan el derecho de rechazar el artículo si el código crítico no está disponible”.

Las razones de las limitaciones incluyen la falta de estándares de presentación de datos a nivel disciplinario o la infraestructura tecnológica necesaria para depositar datos abiertamente y en repositorios estructurados. En otros casos, es posible que sea necesario proteger la confidencialidad o que los datos se retengan por motivos legales o de seguridad. Se aplican principios similares a la disponibilidad del código, y he aquí por qué naturalezaNuestras políticas incluyen la opción de publicar el modelo de entrenamiento y el pseudocódigo o código limitado, como lo demuestran los estudios de ejemplo que hemos publicado en Chemistry.3Cambio climático4 y virología5.

La mayoría de los proyectos de I+D en todo el mundo están financiados por el sector privado y muchos de los resultados de dichos trabajos no se publican en revistas revisadas por pares. estamos en naturaleza Creo que es importante que las revistas interactúen con el sector privado y trabajen con sus científicos para que puedan enviar sus investigaciones para revisión por pares y publicación. Esto mejora el intercambio de conocimientos, la validación de la investigación y la reproducibilidad que los investigadores se esfuerzan por lograr. También beneficia la seguridad y eficacia del producto. El progreso necesita más, no menos, datos abiertos, código, algo naturaleza Seguirá apoyando.

Pero este objetivo no se logrará en un solo paso. Requerirá una operación. Esto requiere participación y diálogo entre todas las partes interesadas. Repito: no queremos que nuestra opinión sea la última palabra, sino el inicio de la conversación. ¿Qué medidas adicionales podemos tomar para garantizar la apertura de todas las partes del ecosistema de investigación? Nos gustaría escuchar a todas las partes interesadas, no sólo a investigadores de universidades y empresas privadas, sino también a formuladores de políticas, ONG y editores. Escríbanos a [email protected]. Usaremos estas páginas para actualizar a los lectores.

[ad_2]

Source Article Link