La enorme base de datos de proteínas que generó AlphaFold y la revolución de la IA en biología


La cristalógrafa Helen Berman cofundó el Protein Data Bank en la década de 1960.

Crédito: Universidad de Rutgers

Los premios Nobel eran para 2024

Todo sobre inteligencia artificial
(Amnistía Internacional). Pioneros de las redes neuronales computacionales básicas para la inteligencia artificial

Ganó el Premio de Física
y

La química fue a
Dos científicos que desarrollaron la revolucionaria herramienta de predicción de la estructura de proteínas AlphaFold y uno de los científicos pioneros

Diseño de proteínas
Fue una búsqueda que fue

Cargado de inteligencia artificial
.

Es fácil maravillarse con la magia técnica que hay detrás.

Avances como AlphaFold
. Pero gran parte de este éxito se debe a una base de datos de estructuras de proteínas ideada en la década de 1960 por Helen Berman, cristalógrafa de la Universidad del Sur de California en Los Ángeles, y científicos con ideas afines.

El Banco de Datos de Proteínas (PDB) contiene ahora las estructuras de más de 200.000 proteínas, disponibles gratuitamente para cualquier persona. Estos datos ayudan a AlphaFold

Predecir la estructura de las proteínas a partir de sus secuencias.
Otros dispositivos de inteligencia artificial pueden imaginar nuevas proteínas con solo presionar un botón.

Berman dice

naturaleza
Por qué está contenta con el reconocimiento (los premios Nobel de química David Becker, de la Universidad de Washington en Seattle, y John Jumper, de Google DeepMind en Londres, dieron crédito al PDB) y cómo otros campos científicos pueden allanar el camino para avances en IA con buenos datos. .

¿Cómo compartían los científicos las estructuras de las proteínas antes del PDB?

El PDB Bank nació cuando inicialmente sólo existían unas pocas estructuras. Se compartían mediante tarjetas perforadas (donde cada átomo tenía su propia tarjeta perforada) o cinta magnética. El investigador individual tendría que enviar estos artículos a través del océano si fueran de Inglaterra a Estados Unidos.

¿Qué llevó a la creación del PDB?

Yo era estudiante de cristalografía en la década de 1960 y las estructuras de las proteínas apenas comenzaban a emerger. No era un especialista en cristales de proteínas, pero me sorprendió lo importantes que eran estas estructuras.

Trabajé con algunos otros jóvenes que también estaban interesados ​​en la estructura. Un pequeño grupo de nosotros comenzamos a comunicarnos sobre cómo acceder al Banco de datos de proteínas. No sé si lo llamamos así, pero eso es lo que queríamos: un lugar donde pudieran estar todas estas estructuras.

¿Hacer que estos datos sean abiertos es un principio básico?

Al comienzo de PDB, el objetivo era obtener las coordenadas de la estructura de la proteína y asegurarnos de no perderlas. En la década de 1980, comenzó un movimiento que decía que estas estructuras eran esenciales para la salud pública. Es la clave de la buena ciencia. Tuvo que incluirse en el AP, porque en aquel momento no existía ningún requisito. Requiere cierto estímulo por parte de las agencias de financiación. A las revistas les llevó algún tiempo aceptar la idea de exigir que los datos estuvieran en una PDB. Ahora no puedes publicar la compilación sin que esté en el PDB.

¿Crees que podríamos haber tenido Alpha Fold sin PDB?

Sabiendo lo que creo saber sobre cómo funciona AlphaFold, habría sido muy difícil. Hay dos cosas importantes acerca de los datos de PDB: han sido verificados y validados por curadores expertos. La otra cosa es que los datos son completamente legibles por máquina.

¿Cómo ha sido observar esta revolución en la IA biológica, con herramientas como AlphaFold, RoseTTAFold y software de diseño de proteínas? Todos están capacitados en PDB.

Para mí es emocionante. Lo que pensé en ese momento fue que podríamos comprender mejor las relaciones entre la secuencia y la estructura de las proteínas. Estoy muy contento con los resultados obtenidos con AlphaFold y con todo el trabajo que David Becker ha realizado en el diseño de proteínas.

¿Habla de la importancia de los datos experimentales para respaldar los avances de la IA en la ciencia?

Sí 100%. La gente dirá: “Oh, bueno, los datos del PDB son realmente especiales”. Pero en realidad sabemos por qué son especiales. Nos llevó mucho tiempo descubrir cómo trabajar con datos, cómo representarlos y cómo recopilarlos. Nosotros como comunidad, la comunidad del PDB, sabemos cómo hacer esto.

Creo que otras sociedades pueden y deben hacerlo. Porque de lo contrario no podremos lograr grandes avances. Metodologías que permiten predecir una proteína y diseñarla; lo mismo puede suceder en química. Puede suceder en geología. Puede suceder en física.

Esta entrevista ha sido editada para mayor extensión y claridad.



Source Article Link

See also  Google anuncia un nuevo sistema de equipo rojo para la generación de IA

Leave a Comment