El informático Serge Stenkiewicz dice que dentro de las Naciones Unidas existe un gran interés en cómo se puede utilizar la IA para acelerar el progreso hacia los 17 Objetivos de Desarrollo Sostenible.
Como jefe de investigación del Instituto de Macao de la Universidad de las Naciones Unidas (UNU Macao), establecido por las Naciones Unidas en 1992 para realizar investigaciones y capacitación sobre el uso de tecnologías digitales para abordar problemas globales, Stenkiewicz está interesado en cómo la inteligencia artificial puede ayudar. países. Alcanzar los Objetivos de Desarrollo Sostenible en el plazo de 2030.
Sin embargo, cualquier beneficio obtenido utilizando la IA tendrá costos. La IA, un recurso ávido de energía y propenso a sesgos y acceso desigual, plantea sus propios desafíos.
Stenkiewicz habló con Nature Index sobre cómo las organizaciones pueden utilizar las herramientas de inteligencia artificial de manera responsable para respaldar sus investigaciones relacionadas con los Objetivos de Desarrollo Sostenible.
¿Cuál es un ejemplo de cómo se puede utilizar la IA para acelerar el progreso hacia los Objetivos de Desarrollo Sostenible?
La popularidad de los grandes modelos de lenguaje (LLM) ha provocado un rápido aumento en la cantidad de datos utilizados para entrenar sistemas de inteligencia artificial. Actualmente hay una escasez de datos diversos y legibles por máquinas en Internet para entrenar algoritmos de IA. Los datos sintéticos, que se generan mediante algoritmos y simulaciones que imitan escenarios del mundo real, proporcionan una forma de entrenar modelos de IA con más datos de los que normalmente es posible.
Los datos sintéticos pueden ayudar a reequilibrar conjuntos de datos sesgados; por ejemplo, en un conjunto de datos sesgado hacia un género, se pueden agregar datos sintéticos para equilibrar la representación. También pueden ayudar a abordar el problema de la escasez o pérdida de datos. Esto puede resultar especialmente útil en la investigación médica, donde los datos de salud y la información personal de las personas pueden ser difíciles de obtener debido a cuestiones de privacidad.
Este enfoque será cada vez más común. Gartner, una firma de investigación y consultoría con sede en Stamford, Connecticut, predice que para finales de este año, Más del 60% de los datos utilizados para entrenar modelos de aprendizaje automático serán sintéticos.
¿Cuáles son los riesgos de utilizar datos sintéticos?
Los datos sintéticos se crean a partir de conjuntos de datos ya existentes. Por lo tanto, los sesgos en los conjuntos de datos sin procesar pueden propagarse a través de datos sintéticos y, por extensión, a los modelos de IA entrenados en ellos. Nuestro trabajo en la UNM Macao se centra en comprender el impacto de los datos sintéticos utilizados en el aprendizaje automático, incluidos los riesgos para el desarrollo sostenible a través de la investigación.
El año pasado, por ejemplo, Hemos publicado un resumen de tecnología. En él, intentamos identificar los beneficios y riesgos del uso de datos sintéticos en el entrenamiento de IA. A partir de este trabajo, hemos propuesto directrices para el uso responsable de datos sintéticos en investigaciones relacionadas con los Objetivos de Desarrollo Sostenible, especialmente en países pobres. Esto implica utilizar datos diversos al crear conjuntos de datos sintéticos, lo que significa incluir una amplia gama de datos demográficos, entornos y condiciones. También recomendamos divulgar o marcar con marcas de agua todos los datos sintéticos y sus fuentes, divulgar métricas de calidad para los datos sintéticos y priorizar el uso de datos no sintéticos cuando sea posible.
Líderes de investigación 2024
También recomendamos que las instituciones y organizaciones establezcan estándares globales de calidad, medidas de seguridad y pautas éticas para la generación y uso de datos sintéticos.
Esperamos que los Estados miembros y las agencias de la ONU adopten nuestros Principios Rectores para apoyar la formulación de políticas en la gobernanza global de la IA.
¿Qué otras herramientas o recursos de IA están marcando la diferencia en la investigación relacionada con los ODS?
Cuando era investigador en el Instituto Francés de Investigación para el Desarrollo Sostenible (IRD) en Marsella, trabajé en un proyecto llamado Deep2PDE en Camerún. Nuestro equipo, en colaboración con colegas de universidades locales, utilizó herramientas de aprendizaje automático para comprender cómo la competencia por la luz entre especies de plantas afecta a los agrobosques en los que los árboles de cacao se cultivan junto con otros árboles y cultivos. Esto nos ha ayudado a simular, diseñar y probar sistemas para mejorar la producción de cacao.
Hay muchas aplicaciones prácticas de la IA, como ésta, que pueden ayudar a avanzar hacia los Objetivos de Desarrollo Sostenible. La gran ventaja es que estas herramientas pueden ayudar a los equipos a adaptar su trabajo a las necesidades y contextos de las comunidades; Lo que puede funcionar para personas en Europa o América del Norte puede no funcionar en África.
¿Cuáles son otros riesgos del uso de la IA en general para avanzar en la investigación de los ODS?
Necesitamos una importante infraestructura informática para ejecutar sistemas de IA, y esto requiere recursos como agua para los sistemas de refrigeración. Esto tiene implicaciones para la sostenibilidad y, por tanto, para los Objetivos de Desarrollo Sostenible. Entonces, tenemos que tener cuidado. Los impactos ambientales de los sistemas de IA, incluidos los impactos en el uso de minerales y agua y las emisiones de gases de efecto invernadero, son una gran preocupación. Por ejemplo, Algunas investigaciones indican Una formación de MBA, como la que imparte ChatGPT, podría producir emisiones de carbono equivalentes a las de aproximadamente 500 a 600 vuelos entre la ciudad de Nueva York y Los Ángeles, California.
Algunas empresas de tecnología no están interesadas en compartir el costo real de sus sistemas de inteligencia artificial y los recursos que utilizan. Esto dificulta que los investigadores evalúen los impactos ambientales de la IA y asesoren a los gobiernos y a los responsables políticos sobre cómo mitigarlos.
Otro problema importante es la desigualdad: las herramientas y los datos de IA a menudo pertenecen y están controlados por empresas e instituciones de los países más ricos, por lo que los países más pobres tienen limitaciones en cómo pueden utilizarlos para avanzar en sus investigaciones relacionadas con los Objetivos de Desarrollo Sostenible.
¿Cómo se puede abordar el problema de las existencias?
Una de las principales razones de este problema es que la mayor parte del progreso en la creación de LLM se ha producido en los últimos años. Esto lo hicieron empresas privadas, no académicos e instituciones de investigación.. Algunas posibles soluciones incluyen la creación de asociaciones e iniciativas público-privadas para democratizar el acceso a la infraestructura informática.
Por ejemplo, la Red Internacional Suiza sobre Computación e Inteligencia Artificial, dirigida por el Instituto Federal Suizo de Tecnología en Zurich, tiene como objetivo brindar a los investigadores de entornos de bajos ingresos acceso a recursos de supercomputación para que puedan desarrollar herramientas de IA que beneficien al mundo. Se asocian con organizaciones como Data Science Africa, un grupo sin fines de lucro en Nairobi, para capacitar a los jóvenes africanos para que utilicen la ciencia de datos para desarrollar soluciones a problemas locales y ayudar a reducir las desigualdades en la infraestructura de datos y software.
Algunas plataformas en línea, como las administradas por Hugging Face, una empresa de tecnología de la ciudad de Nueva York, hacen que la infraestructura para crear herramientas de inteligencia artificial sea accesible para todos. Es de código abierto, lo que permite a los usuarios compartir y acceder a recursos, incluidos conjuntos de datos y modelos desarrollados por otros. Este enfoque puede ayudar a reducir el consumo de recursos y el impacto ambiental del desarrollo de la IA.
Esta entrevista ha sido editada para mayor extensión y claridad.
El contenido de noticias y los suplementos de Nature Index son editorialmente independientes de su editor, Springer Nature. Para obtener más información sobre el Índice de la Naturaleza, Ver página de inicio.