Categories
Life Style

El premio de química es para los desarrolladores de AlphaFold AI, que predice estructuras de proteínas

[ad_1]

Imagen compuesta de fotografías de David Baker, Demis Hassabis y John Jumper.

David Becker, Demis Hassabis y John Gumper (de izquierda a derecha) ganaron el Premio Nobel de Química por desarrollar herramientas computacionales que pueden predecir y diseñar estructuras de proteínas.Crédito: Fundación BBVA

Por primera vez, y quizás no la última, un avance científico posible gracias a la inteligencia artificial ha sido reconocido con el Premio Nobel. El Premio Nobel de Química 2024 fue otorgado a John Gamper y Demis Hassabis de Google DeepMind en Londres, por desarrollar un sistema revolucionario. Una herramienta de inteligencia artificial para predecir estructuras de proteínas se llama AlphaFoldy David Becker, de la Universidad de Washington en Seattle, por su trabajo en diseño computacional de proteínas, que se completó Al lo ha reforzado en los últimos años.

“Espero que cuando miremos a AlphaFold, sea la primera prueba del asombroso potencial de la inteligencia artificial para acelerar los descubrimientos científicos”, dijo Hassabis en una conferencia de prensa en DeepMind el 9 de octubre. “Es irreal en este momento”.

El efecto AlphaFold que fue Fue revelado hace sólo unos años.Fue nada menos que transformador. Esta herramienta ha puesto a disposición de los investigadores estructuras de proteínas (a menudo, pero no siempre, extremadamente precisas) con solo tocar un botón, y ha permitido experimentos que habrían sido inimaginables hace una década. “Es una gran revolución”, dice Christine Orengo, bióloga computacional del University College de Londres, cuyo laboratorio ha utilizado estructuras predichas por AlphaFold para revelar nuevas proteínas.

“Ha sido un sueño desde hace mucho tiempo que aprendamos a predecir la estructura tridimensional de las proteínas conociendo sus secuencias de aminoácidos”, dijo Heiner Linke, jefe del Comité Nobel, que investiga la nanociencia en la Universidad de Lund en Suecia. Durante varias décadas, esto se consideró imposible”. Durante el anuncio del premio. Añadió que los ganadores de este año “lograron descifrar el código”. Los tres ganadores comparten un premio acumulado de 11 millones de coronas suecas (1 millón de dólares).

Inteligencia artificial premiada

DeepMind lanzó AlphaFold por primera vez en 2018, cuando ganó un concurso de predicción de la estructura de proteínas llamado Evaluación crítica de la predicción de la estructura de proteínas (CASP). Pero fue la segunda iteración de la red neuronal de aprendizaje profundo, Fue presentado a finales de 2020.Esto realmente ha revolucionado las ciencias de la vida. Muchas de las predicciones de AlphaFold2 en CASP fueron tan precisas que no se podían distinguir de las estructuras proteicas resueltas experimentalmente.

Hassabis, cofundador y director ejecutivo de DeepMind, y Jumper, jefe del equipo AlphaFold, lideraron el desarrollo de AlphaFold2. Para predecir las estructuras de las proteínas, una red neuronal combina datos de bibliotecas de cientos de miles de estructuras y millones de secuencias de proteínas relacionadas, que contienen información sobre sus formas.

En particular, el éxito de AlphaFold se debe en gran parte al Protein Data Bank, un depósito de acceso gratuito de más de 200.000 estructuras de proteínas determinadas mediante métodos que incluyen cristalografía de rayos X y microscopía crioelectrónica. “Es una lección de humildad cada vez que entrenamos [AlphaFold] A lo largo de años de esfuerzo. “Cada punto de datos son años de esfuerzo por parte de alguien”, dijo Jumper en la conferencia de prensa de DeepMind.

En 2021, Mente profunda Hizo que el código base para AlphaFold2 esté disponible gratuitamenteAdemás de los datos necesarios para entrenar el modelo. eso Base de datos AlphaFoldcreado en colaboración con el Instituto Europeo de Bioinformática del Laboratorio Europeo de Biología Molecular en Hinxton, Reino Unido, ahora Contiene las estructuras de casi todas las proteínas de todos los organismos representados en bases de datos genéticas.alrededor de 214 millones de predicciones en total. Este año, la compañía dio a conocer La tercera versión de AlphaFoldque puede diseñar otras moléculas que interactúen con proteínas como medicamentos.

La revolución lanzada por Jumper, Hassabis y sus colegas aún está en sus inicios, y es posible que no se conozca el impacto total de AlphaFold en la ciencia hasta dentro de años. De hecho, esta herramienta ayuda a los científicos a obtener nuevos conocimientos.

Un equipo pionero utilizó esta herramienta, combinada con datos experimentales, para dibujar un mapa. Complejo de poros nuclearesuna de las máquinas más grandes de nuestras células que mueve moléculas dentro y fuera del núcleo. El año pasado, dos equipos exploraron toda la base de datos AlphaFold para descubrir los rincones más oscuros del mundo de las proteínas, identificando nuevas familias de proteínas y pliegues y conexiones sorprendentes en la maquinaria de la vida.

Muchos investigadores esperan que AlphaFold y otras herramientas de inteligencia artificial que inspiró transformen la medicina, pero ese ya es el caso. no esta claro aun Cómo, o si, AlphaFold simplificará el costoso proceso de varios pasos para desarrollar medicamentos seguros. Los científicos que sientan las bases para nuevas vacunas encuentran que AlphaFold es increíblemente útil Y en algunos casos, un cambio de juego. Pero AlphaFold complementa los estudios experimentales y otros enfoques para mapear y modificar la estructura de proteínas virales para su uso en vacunas.

Para la mayoría de los investigadores, la estructura predicha es el comienzo de un estudio, no el final, dice Jan Kosinski, modelador estructural del Laboratorio Europeo de Biología Molecular (EMBL) en Hamburgo, Alemania. “Al principio se temía que sustituyera a la biología estructural, que la gente perdiera su empleo, etc. De hecho, ocurrió todo lo contrario”, añade.

Uno de los mayores impactos de la herramienta ha sido un cambio en la mentalidad de los biólogos, “que dicen que las computadoras son cosas que pueden producir hipótesis útiles”, dice David Jones, bioinformático de la University College London que colaboró ​​con DeepMind en la primera versión de AlphaFold a partir de en 2016. Que se puede probar en el laboratorio.

Creando nuevas proteínas

Más de dos décadas antes de que DeepMind comenzara a trabajar en AlphaFold, el biofísico computacional David Becker y sus colegas desarrollaron una herramienta de software llamada Rosetta que modelaba estructuras de proteínas utilizando principios físicos. La herramienta compara pequeñas partes de múltiples estructuras y secuencias de proteínas existentes para determinar qué secuencias de proteínas pueden plegarse en una conformación específica.

Inicialmente, Rosetta se aplicó para predecir estructuras de proteínas y estuvo entre las principales entradas en muchos CASP, antes de que AlphaFold dominara. Pero Becker pronto se dio cuenta de que se podía invertir el paradigma para diseñar proteínas completamente nuevas.

La herramienta tuvo un éxito temprano Diseñar nuevas proteínasincluidos nuevos tipos de enzimas, proteínas que pueden unirse estrechamente a otras moléculas y nanopartículas de proteínas autoensambladas que se asemejan a los virus (una de las cuales sirvió de base para una vacuna COVID-19 aprobada).

Cuando se anunció AlphaFold2, pero aún no se lanzó, Baker y su equipo, incluido el químico computacional Minkyung Baek, ahora en la Universidad Nacional de Seúl en Corea del Sur, se propusieron comprender el programa y aplicar algunos de sus trucos a una versión anterior basada en IA. del software. Rashid. El rendimiento de la primera versión de la red RoseTTAFold resultante fue casi idéntico al de AlphaFold2. Desde 2021, sus desarrolladores y otros científicos han mejorado continuamente ambas redes para afrontar nuevos desafíos, como predecir la estructura de complejos de múltiples y diferentes proteínas que interactúan.

En los últimos años, el equipo de Becker ha sido particularmente prolífico en la aplicación del aprendizaje automático a la razón de ser de su laboratorio: Creando nuevas proteínas nunca antes vistas en la naturaleza. La herramienta desarrollada recientemente por el equipo de Baker, que combina RoseTTAFold con redes neuronales omnipresentes generadoras de imágenes, ha supuesto un cambio radical en la capacidad de los investigadores para diseñar proteínas.

Avance rápido

Estas herramientas fueron un tremendo acelerador y democratizador, dice Sergei Ovchinnikov, biólogo evolutivo del Instituto Tecnológico de Massachusetts en Cambridge, que hizo su doctorado en el laboratorio de Becker. Rosetta solía tardar semanas en ejecutarse en cientos de procesadores para llegar a un diseño de proteína, una tarea que las herramientas más nuevas basadas en inteligencia artificial pueden realizar en segundos. “Ahora todo el mundo puede diseñar una proteína”, afirma.

“Me siento profundamente inspirado por otros en este campo y por la gente con la que he trabajado”, dijo Becker, hablando por teléfono durante el anuncio del Premio Nobel. “Me he subido a hombros de gigantes”.

Martin Steiniger, biólogo computacional de la Universidad Nacional de Seúl en Corea del Sur, compara el impacto de AlphaFold, RoseTTAFold y otras herramientas de inteligencia artificial biológica con el de las misiones Apolo a la Luna, al mostrar lo que la ingeniería puede lograr. “Es un momento similar para la predicción de estructuras y el campo de la biología estructural, donde simplemente se ve lo que es posible”, dice.

Pocos se sorprendieron por la decisión del Comité Nobel. En cuanto a Baker, Jones dice: “La mayoría de la gente pensó que tenía que ver con la cantidad de trabajo que había realizado en esta área”. Gamper, que sabía que él y Hassabis estaban en las listas de muchas personas, dijo en la rueda de prensa que no había podido dormir la noche anterior al anuncio de hoy.

Para Jumper, las estructuras predecibles que ofrece AlphaFold crean nuevas oportunidades para el descubrimiento científico. Millones de científicos ya han utilizado estas herramientas y espera que no pase mucho tiempo antes de que alguien reciba una llamada de Suecia. “El momento en que sentiré la misma emoción será el Premio Nobel por el trabajo realizado con AlphaFold”, dijo.

[ad_2]

Source Article Link

Categories
Life Style

Ex científicos del MIT crean un modelo masivo para el diseño de proteínas utilizando inteligencia artificial

[ad_1]

Modelo molecular de la proteína fluorescente verde brillante StayGold de Cytaeis uchidae.

Modelo estructural de proteína verde fluorescente, elemento fundamental en biotecnología.Copyright: Biblioteca de imágenes científicas/Laguna Design

a inteligencia artificial (Inteligencia Artificial) modelo parlante El lenguaje de las proteínas. – Una de las mayores aplicaciones desarrolladas hasta la fecha para la biología: se ha utilizado para crear nuevas moléculas fluorescentes.

La oferta de prueba de principio fue anunciada este mes por EvolutionaryScale, con sede en la ciudad de Nueva York, junto con $142 millones en nuevos fondos para aplicar su modelo a… Desarrollo de fármacosLa empresa, fundada por científicos que anteriormente trabajaron en el gigante tecnológico Meta, se especializa en aplicar modelos de aprendizaje automático de vanguardia entrenados en lenguaje e imágenes a datos biológicos.

“Queremos crear herramientas que puedan hacer que la biología sea programable”, dice Alex Reeves, científico jefe de la compañía, quien ha sido parte del esfuerzo de Meta para aplicar inteligencia artificial a datos biológicos.

La herramienta de inteligencia artificial de EvolutionaryScale, llamada ESM3, es lo que se conoce como modelo de lenguaje de proteínas. Fue entrenado en más de 2.700 millones de secuencias y estructuras de proteínas, así como en información sobre las funciones de estas proteínas. El formulario se puede utilizar Creando proteínas Para especificaciones proporcionadas por los usuarios, similar al texto generado por chatbots como ChatGPT.

“Este será uno de los modelos de IA en biología al que todo el mundo prestará atención”, afirma Anthony Jeter, biólogo computacional de la Universidad de Wisconsin-Madison.

brillante

Reeves y sus colegas habían trabajado en iteraciones anteriores del modelo ESM en Meta, pero comenzaron a trabajar por su cuenta el año pasado, después de que Meta terminara su trabajo en esta área. Anteriormente utilizaron el modelo ESM-2 para crear el modelo ESM-2. Una base de datos de libre acceso que contiene 600 millones de estructuras proteicas predichas1Desde entonces, otros equipos han utilizado versiones de ESM-1 para diseñar anticuerpos con actividad mejorada contra patógenos, incluido el SARS-CoV-2.2 y rediseñar proteínas “anti-CRISPR” para mejorar la eficiencia de las herramientas de edición de genes3.

Este año, otra empresa especializada en IA en biología, Profluent en Berkeley, California, utilizó su modelo de lenguaje de proteínas para crear nuevas proteínas de edición de genes inspiradas en CRISPR, y puso una de estas moléculas a disposición de su uso de forma gratuita.

Para probar su último modelo, el equipo de Reeves se propuso probar otra herramienta biotecnológica: la proteína verde fluorescente (GFP), que absorbe la luz azul y brilla en verde. Los investigadores aislaron la proteína verde fluorescente en la década de 1960 a partir de medusas bioluminiscentes. Igual victoriaInvestigaciones posteriores, que recibieron el Premio Nobel con este descubrimiento, mostraron cómo la proteína verde fluorescente podía marcar otras proteínas cuando se observaban al microscopio, explicaron las bases moleculares de la fluorescencia de las proteínas y desarrollaron versiones artificiales de la proteína que brillan más intensamente y en Colores diferentes.

Desde entonces, los investigadores han identificado otras proteínas fluorescentes con una forma similar, todas las cuales comparten un núcleo de “pigmento” emisor y absorbente de luz rodeado por un andamio en forma de barril. El equipo de Reeves pidió a ESM3 que creara ejemplos de proteínas similares a proteínas fluorescentes verdes que contengan un conjunto de aminoácidos clave que se encuentran en el cromóforo de la proteína fluorescente verde.

Los investigadores sintetizaron 88 de los diseños más prometedores y midieron su capacidad de fluorescencia. La mayoría no tuvo éxito, pero un diseño, diferente de las proteínas fluorescentes conocidas, brillaba débilmente, unas 50 veces más débil que las formas naturales de GFP. Utilizando la secuencia de esta molécula como punto de partida, los investigadores encargaron al ESM3 la tarea de mejorar su trabajo. Cuando los investigadores hicieron alrededor de 100 de los diseños resultantes, muchos eran tan brillantes como la GFP natural, que sigue siendo mucho más débil que las variantes diseñadas en laboratorio.

Se prevé que una de las proteínas más brillantes diseñadas por ESM3, llamada esmGFP, tenga una estructura similar a la de las proteínas fluorescentes naturales. Sin embargo, su secuencia de aminoácidos es muy diferente y coincide con menos del 60% de las secuencias de proteínas fluorescentes más estrechamente relacionadas en su conjunto de datos de entrenamiento. Se publicó una preimpresión en el servidor bioRxiv.4Reeves y sus colegas dicen que, basándose en las tasas de mutación naturales, este nivel de variación de secuencia equivale a “más de 500 millones de años de evolución”.

Pero Jeter teme que esta comparación sea una forma inútil y quizás engañosa de describir el producto de un modelo de IA de vanguardia. “Suena aterrador cuando se piensa en la IA y en la aceleración del desarrollo”, afirma. “Siento que sobreestimar lo que hace un modelo puede ser perjudicial para el campo y potencialmente peligroso para el público”.

Reeves sostiene que la generación de nuevas proteínas mediante la duplicación de diferentes secuencias por parte de ESM3 es similar a la evolución. “Creemos que es interesante la perspectiva que necesitaría la naturaleza para poder generar algo como esto”, añade.

Umbral de riesgo

El ESM-3 se encuentra entre los primeros modelos de IA biológica que utiliza suficiente potencia informática durante su entrenamiento para obligar a los desarrolladores a notificar e informar al gobierno de EE. UU. Medidas de mitigación de riesgosSegún una orden ejecutiva presidencial emitida en 2023, EvolutionaryScale dice que ya ha estado en contacto con la Oficina de Política Científica y Tecnológica de EE. UU.

La versión de ESM3 que supera este umbral, que consta de alrededor de 100 mil millones de parámetros o variables que el modelo utiliza para representar relaciones entre secuencias, no está disponible públicamente. Para una versión más pequeña y de código abierto, se excluyeron del entrenamiento ciertas secuencias, como las que pertenecen a virus y la lista de patógenos y toxinas preocupantes del gobierno de EE. UU. ESM3-open, que los científicos pueden descargar y ejecutar de forma independiente en cualquier lugar, tampoco puede generar tales proteínas.

Martin Pachisa, biólogo estructural del Instituto Federal Suizo de Tecnología en Lausana, está entusiasmado de empezar a trabajar con ESM3. Señala que es uno de los primeros modelos biológicos que permite a los investigadores especificar diseños utilizando descripciones en lenguaje natural de sus propiedades y funciones, y está interesado en ver cómo funcionan experimentalmente estas y otras características.

A Basisa le impresionó que EvolutionaryScale lanzara una versión de código abierto de ESM3 y una descripción clara de cómo entrenar la versión más grande. Pero un modelo más grande requeriría vastos recursos informáticos para desarrollarse de forma independiente, afirmó. “Ningún laboratorio académico podrá replicarlo”.

Reeves espera aplicar ESM-3 a otros diseños. Será interesante ver cómo resulta ESM-3, dice Pachesa, quien formó parte del equipo que utilizó un paradigma de lenguaje de proteínas diferente para crear nuevas proteínas CRISPR. Reeves imagina aplicaciones en sostenibilidad (un vídeo en su sitio web muestra el diseño de enzimas que comen plástico) y en el desarrollo de anticuerpos y otros medicamentos basados ​​en proteínas. “Es realmente un modelo a la vanguardia”, afirma.

[ad_2]

Source Article Link

Categories
Featured

Este batido de almendras y canela es una forma fácil y deliciosa de obtener más proteínas

[ad_1]

Rara vez tengo mucho apetito por la mañana, por lo que a menudo me resulta difícil tomar un desayuno abundante. Sin embargo, sé la importancia de alimentar mi cuerpo, por eso los batidos son un gran compromiso para mí. Sin embargo, a menudo voy a la cafetería local a tomar mi batido matutino, que aunque es conveniente, se ha convertido en un hábito costoso.

Tratando de ahorrar dinero, mientras estoy en ello Mejor licuadora Recreé mis favoritos en la cafetería y este batido de leche de almendras y canela fue uno de mis favoritos. La adición de proteína en polvo lo convierte en un excelente tratamiento antes y después del entrenamiento y me mantiene lleno durante horas, lo que significa que evito los refrigerios azucarados.



[ad_2]

Source Article Link