Facebook ¿Qué pasa contigo? muerto Google dijo el viernes que lanzará una gama de nuevos modelos de IA desde su división de investigación, incluido un “evaluador de autoaprendizaje” que puede proporcionar un camino hacia una menor participación humana en el proceso de desarrollo de la IA.
El lanzamiento se produce después de que Meta presentara la herramienta en un artículo de investigación en agosto, detallando cómo se basa en la misma tecnología de “cadena de razonamiento” utilizada por los modelos o1 recientemente lanzados por OpenAI para emitir juicios confiables sobre las respuestas del modelo.
Esta técnica implica dividir problemas complejos en pasos lógicos más pequeños y parece mejorar la precisión de las respuestas a problemas difíciles en materias como ciencias, programación y matemáticas.
Los metainvestigadores utilizaron datos enteramente generados por IA para entrenar el modelo evaluador, eliminando también la intervención humana en ese punto.
Dos de los investigadores de Meta detrás del proyecto dijeron a Reuters que la capacidad de utilizar la IA para evaluarla de manera confiable ofrece un vistazo a un camino potencial hacia la construcción de agentes de IA autónomos que puedan aprender de sus errores.
Muchos en el campo de la IA imaginan a estos agentes como asistentes digitales que son lo suficientemente inteligentes como para llevar a cabo una amplia gama de tareas sin intervención humana.
Los modelos de mejora automática podrían eliminar la necesidad de un proceso costoso y a menudo ineficiente que se utiliza hoy en día llamado “aprendizaje reforzado por retroalimentación humana”, que requiere aportes de anotadores humanos que deben tener experiencia especializada para etiquetar datos con precisión y verificar respuestas a consultas matemáticas complejas. escribiendo. Correcto.
“Con suerte, a medida que la IA se vuelva cada vez más sobrehumana, mejorará en la validación de su trabajo, de modo que realmente sea mejor que el humano promedio”, dijo Jason Weston, uno de los investigadores.
“La idea del autoaprendizaje y la capacidad de autoevaluación es fundamental para la idea de alcanzar este tipo de nivel sobrehumano de IA”, dijo.
Otras empresas, incluidas Google y Anthropic, también han publicado investigaciones sobre el concepto de RLAIF, o aprendizaje reforzado a partir de comentarios de IA. A diferencia de Meta, estas empresas tienden a no lanzar sus modelos para uso general.
Otras herramientas de inteligencia artificial que Meta lanzó el viernes incluyeron una actualización de su modelo de identificación de imágenes Segment Anything, una herramienta que acelera los tiempos de generación de respuestas de LLM y conjuntos de datos que pueden usarse para ayudar a descubrir nuevos materiales inorgánicos.
© Thomson Reuters 2024