Mejores conjuntos de datos no resolverán el problema, necesitamos que la IA para África se desarrolle en África


En mayo de 2023, Sam Altman, director ejecutivo de OpenAI en San Francisco, California, se embarcó en una gira mundial por 17 ciudades para promover las herramientas de inteligencia artificial. Una de las paradas de la primera semana de la gira fue Lagos, Nigeria. Sin embargo, una investigación que evalúa el rendimiento de ChatGPT de OpenAI en un conjunto de datos de 670 idiomas muestra que los idiomas africanos tienen el menor apoyo.1. El gran modelo de lenguaje GPT-4, en el que se basa ChatGPT, reconoce oraciones escritas en hausa, el idioma más hablado en Nigeria, en sólo el 10-20% de los casos.

Como científico informático y ex ingeniero de aprendizaje automático en Google AI en Accra, conozco desde hace mucho tiempo las limitaciones de importar herramientas de inteligencia artificial desprovistas de contexto local a África. Debemos dar a los informáticos africanos la oportunidad de desarrollar soluciones locales.

Por ejemplo, en 2018, cuando mis colegas y yo nos propusimos rastrear los cambios en el entorno construido de los municipios históricamente negros de Sudáfrica, descubrimos rápidamente las limitaciones de los modelos de IA que normalmente se utilizan para detectar características como casas y patrones de calles en fotografías aéreas. Debido a que la constitución post-apartheid prioriza el mejoramiento de las comunidades desfavorecidas, nuestro proyecto tuvo como objetivo evaluar si las mejoras en el bienestar son visibles en imágenes de satélite. Desafortunadamente, los modelos de IA disponibles (entrenados en ciudades occidentales y, a menudo, con diseños en forma de cuadrícula) han tenido dificultades para adaptarse al paisaje urbano único del país.

See also  the career costs for scientists battling long COVID

Nos llevó cuatro años desarrollar un modelo de IA adaptado al contexto local. Mientras tanto, investigadores occidentales con acceso a datos satelitales y censales similares se han centrado en utilizar los niveles de iluminación nocturna para estimar las tasas de pobreza en varios países africanos.2 – un enfoque que está condenado al fracaso en las ciudades sudafricanas. Allí, las calles bien iluminadas, un legado de la vigilancia policial discriminatoria de la era del apartheid, pueden fácilmente malinterpretarse como un signo de áreas urbanas económicamente prósperas.

Nuestra desafiante experiencia con modelos de IA “de vanguardia” resalta la importancia del contexto local y la experiencia vivida. Es por eso que los pequeños modelos de lenguaje creados en África, como Lesan AI, una herramienta de traducción y transcripción de idiomas, pueden igualar o incluso superar a sus homólogos occidentales en tareas como convertir voz en texto. Para construir el modelo, Amilash Hadjo, cofundador de Lysan, con sede en Berlín, reclutó hablantes con fluidez en tigrinya y amárico para crear conjuntos de datos únicos y luego los utilizó para entrenar la IA. Como tecnólogo bilingüe, Hadjo pudo crear un rico conjunto de datos centrándose en las partes más descriptivas de su idioma.



Source Article Link

Leave a Comment