La inteligencia artificial (IA) no existe para reemplazar a los científicos; es simplemente una herramienta poderosa que puede usarse para mejorar su trabajo, según David Kelly, Lauren Takahashi y Aditya Nandy.
Estas estrellas en ascenso se encuentran entre los investigadores iniciales más prolíficos del Nature Index en términos de Productos relacionados con la inteligencia artificial. Aquí analizan cómo se pueden aprovechar nuevos algoritmos y modelos para avanzar en la investigación sobre regulación genética, desarrollo de materiales y dinámica de proteínas.
David Kelly: analista de regulación genética
Cuando el científico en bioinformática David Kelly pasó de la academia a desempeñar un papel en la industria en 2016, sintió como si estuviera entrando en una cultura menos competitiva y más colaborativa. “Todos aquí estamos realmente en el mismo equipo”, dice sobre su lugar de trabajo actual, Calico Lifesciences, una empresa de biotecnología en San Francisco, California. También aprecia el enfoque que proporciona su función en la industria: la misión de la empresa es comprender la biología que controla el envejecimiento humano y utilizar ese conocimiento para guiar el desarrollo de tratamientos para enfermedades relacionadas con la edad. Kelly dice que esto sirve como una “luz guía” para él y sus colegas, ayudándolos a priorizar lo que creen que será el trabajo de mayor impacto.
“Si estuviera en la universidad, creo que me distraería con esta o aquella pregunta”, dice Kelly. “Al estar en la industria, sientes una fuerte atracción hacia: ¿Es esto realmente importante? ¿Es esto realmente lo más importante en lo que puedo trabajar en este momento?”
Kelly investiga la regulación genética como mecanismo subyacente en las enfermedades relacionadas con la edad. La regulación genética es el proceso mediante el cual las células controlan la expresión de sus genes, determinando cuándo, dónde y cuánto de ciertos componentes, como las proteínas o el ARN, se producen. Uno de los grandes desafíos para comprender cómo se controlan los genes es saber cómo interactúan con los genes secuencias específicas de ADN, llamadas regiones potenciadoras. Las regiones mejoradas son como interruptores que pueden activar un gen y activarlo. Sin embargo, estos interruptores pueden ubicarse lejos de los genes que controlan (hasta un millón de pares de bases de ADN), lo que hace que muchas de estas conexiones sean difíciles de encontrar y estudiar.
En un artículo publicado en Los métodos de la naturaleza.1Kelly y sus colegas informan sobre el desarrollo de un modelo de aprendizaje profundo, llamado Enformer, que puede predecir la expresión de variantes genéticas, incluidas aquellas con interacciones de largo alcance con potenciadores. El modelo consta “en realidad de sólo unas pocas líneas de código”, pero se ha convertido en una herramienta poderosa, afirma Kelly. “Es sorprendente y muy profundo el nivel de inteligencia artificial que se puede obtener simplemente con una repetición tras otra de este tipo de operación matemática que permite un aprendizaje muy general”.
Líderes de investigación 2024
Una gran preocupación que tiene Kelly acerca de su campo de trabajo es la falta de diversidad étnica en los conjuntos de datos genómicos. Muchos estudios de regulación genética se basan en datos de secuenciación del genoma completo de fuentes como el Biobanco del Reino Unido, que cuenta con 500.000 participantes, de los cuales aproximadamente el 95% son blancos.2. Con estos conjuntos de datos limitados, afirma, los investigadores están perdiendo pistas importantes sobre la regulación genética. “Lo que realmente deseamos es identificar todas las diferencias del mundo y ver todas las formas en que estas variantes genéticas pueden afectar los fenotipos”.
Otro desafío es el hecho de que el principal conjunto de entrenamiento de IA de Kelly es la secuencia de todo el genoma humano, un recurso limitado de alrededor de tres mil millones de pares de bases. “Si queremos grandes cantidades de datos de entrenamiento adicionales, no está del todo claro dónde encontrarlos”, afirma. Su equipo se volvió creativo trabajando con datos de ratones, así como de humanos, y entrenando modelos en ambas especies simultáneamente. “Esto funciona porque los impulsores reguladores de nuestros tipos de células compartidas están altamente conservados”, dice Kelly. “Identificar más primates u otros mamíferos podría resultar fructífero”.
Lauren Takahashi: ingeniera catalítica
Lauren Takahashi, ingeniera química y científica de la información de la Universidad de Hokkaido en Sapporo, Japón, tomó un camino sinuoso en los primeros años de su carrera. Como estudiante universitaria en la Universidad de Arizona en Tucson, estudió lingüística. Luego me mudé a la Universidad de Gotemburgo en Suecia para completar mi Maestría en Ciencias, que implicó la construcción de un prototipo de motor de búsqueda. El programa está diseñado para responder preguntas como “¿Dónde está esto?” o “¿A dónde puedo ir para conseguir eso?” Utilice mapas y ubicaciones, en lugar de confiar únicamente en los mejores resultados de sus búsquedas, afirma.
Durante su estancia en Suecia, Takahashi asistió a una conferencia del físico Andre Geim, quien ganó una parte del Premio Nobel de Física de 2010 por sus experimentos con grafeno. Sustancia formada por una sola capa de átomos de carbono. Dispuestos en una celosía hexagonal. Esta conferencia inspiró a Takahashi a aplicar su conocimiento de los motores de búsqueda para construir un modelo que los investigadores puedan utilizar para buscar literatura científica y obtener información sobre la creación de grafeno y otros materiales 2D.
Al principio el proyecto era sólo un hobby, pero “evolucionó muy rápidamente”, afirma. A partir de este trabajo, un amigo invitó a Takahashi a unirse a un proyecto de investigación en el Instituto Nacional de Ciencia de Materiales (NIMS) de Japón en Tsukuba, una de las instituciones más grandes del mundo en este campo. Mientras estaba en NIMS, realizó un doctorado en Ingeniería Química en la Universidad de Tokio.
En Hokkaido, Takahashi está estudiando el uso de la robótica y la inteligencia artificial para producir catalizadores de alto rendimiento, materiales que aceleran las reacciones químicas. Una forma en que ella y sus colegas hacen esto es buscar en la literatura científica condiciones experimentales que mejoren el rendimiento de los catalizadores. Introducen esta información en su sistema de inteligencia artificial para que pueda diseñar experimentos para producir compuestos como el eteno (un componente básico en la fabricación de plásticos y otros materiales) a temperaturas más bajas y con rendimientos más altos que los métodos actuales.3.
“Actualmente estamos desarrollando un robot que hace todo por sí solo”, afirma Takahashi. En el futuro, los robots podrían trabajar en coordinación con la inteligencia artificial para realizar experimentos; Recopilar y analizar datos; predecir nuevas condiciones, entornos y conjuntos de estímulos; Luego realice el siguiente experimento, escribieron Takahashi y su colega en un artículo de 2023.4.
Dar cabida a los “robóticos” autodirigidos será un gran ajuste para los laboratorios, dice Takahashi. “Es difícil para un robot operar en un entorno desarrollado por humanos. Si queremos utilizar la IA con éxito, debemos tener en cuenta las necesidades de la IA e integrarlas a medida que desarrollamos los entornos en los que operamos.