desencadena Archives - Times Wonderful News

¿Cómo deberíamos probar la IA para la inteligencia humana? El o3 de OpenAI desencadena la búsqueda

[ad_1]

Una cabeza humana en 3D hecha de partículas cúbicas interconectadas. — Algunos investigadores creen que los sistemas de inteligencia artificial pronto alcanzarán el nivel de la inteligencia humana. Otros piensan que está muy lejos.Crédito: Getty

La empresa de tecnología OpenAI fue noticia el mes pasado cuando su último prototipo de chatbot, o3, logró una puntuación alta en una prueba que marcó el progreso hacia… Inteligencia artificial general (vengo). El o3 de OpenAI obtuvo una puntuación del 87,5%, superando la mejor puntuación anterior del sistema de inteligencia artificial (IA) del 55,5%.

¿Qué tan cerca está la inteligencia artificial de la inteligencia humana?

Se trata de “un verdadero avance”, afirma François Cholet, el investigador de IA que creó la prueba, denominada Grupo de Abstracción e Inferencia para la Inteligencia General Artificial (ARC-AGI).¹en 2019 mientras trabajaba en Google, con sede en Mountain View, California. Obtener una puntuación alta en la prueba no significa que se haya logrado la inteligencia artificial general, ampliamente definida como un sistema informático que puede pensar, planificar y aprender habilidades como los humanos, sino que o3 es “absolutamente” capaz de pensar y razonar. , dice Schulet. “Tiene un poder de circulación muy grande”.

Los investigadores quedaron impresionados por el rendimiento de o3 a través de Una variedad de pruebas o estándares.incluida la prueba extremadamente desafiante FrontierMath, que fue anunciada en noviembre por el instituto de investigación virtual Epoch AI. “Es muy impresionante”, dice David Wren, investigador de medición de IA en el Grupo de Investigación de Amenazas y Evaluación de Modelos, con sede en Berkeley, California.

ChatGPT pasó la prueba de Turing y comienza la carrera para encontrar nuevas formas de evaluar la inteligencia artificial

Pero muchos, incluido Ren, advierten que es difícil saber si la prueba ARC-AGI realmente mide la capacidad de una IA para razonar y generalizar. “Hubo muchas medidas que pretendían medir algo básico para la inteligencia, pero resultó que no lo hacían”, dice Ren. Dice que continúa la búsqueda de mejores pruebas que nunca.

OpenAI, con sede en San Francisco, no reveló cómo funcionaría o3, pero el sistema llegó a escena poco después. Formulario de empresa O1que utiliza la lógica de la “cadena de pensamiento” para resolver problemas hablando consigo mismo a través de una serie de pasos de pensamiento. Algunos especialistas creen que o3 puede producir una serie de diferentes trenes de razonamiento para ayudar a delimitar la mejor respuesta entre un conjunto de opciones.

Dedicar más tiempo a refinar una respuesta en el momento del examen marca una gran diferencia en las puntuaciones, dice Chollet, que actualmente vive en Seattle, Washington. Pero o3 tiene un costo enorme: procesar cada tarea en la prueba ARC-AGI, su modo de puntuación alta toma un promedio de 14 minutos y probablemente cueste miles de dólares. (Los costos de computación se basan en cuánto cobra OpenAI a los clientes por símbolo o palabra, lo que depende de factores que incluyen el uso de electricidad y los costos de hardware, dice Chollet). Esto “genera preocupaciones sobre la sostenibilidad”, dice Xiang Yu de la Universidad Carnegie Mellon en Pittsburgh, Pensilvania, que estudia modelos de lenguaje grande (LLM) que impulsan los chatbots.

Generalmente inteligente

Aunque el término inteligencia artificial general (AGI) se utiliza a menudo para describir un sistema informático que cumple o supera las capacidades cognitivas humanas en una amplia gama de tareas, no existe una definición técnica para ello. Como resultado, no hay consenso sobre cuándo las herramientas de IA pueden lograr AGI. Algunos dicen que ya llegó el momento; Otros dicen que aún queda un largo camino por recorrer.

Se están desarrollando muchas pruebas para seguir el progreso hacia el AGI. Algunos de ellos, incluido el cuestionario de preguntas y respuestas a prueba de Google de 2023 de Rein²Tiene como objetivo evaluar el desempeño de un sistema de inteligencia artificial sobre problemas científicos a nivel de doctorado. El asiento MLE 2024 de OpenAI enfrenta a la IA con 75 desafíos alojados en Kaggle, una plataforma de competencia de ciencia de datos en línea. Los desafíos incluyen problemas del mundo real, como la traducción de manuscritos antiguos y el desarrollo de vacunas.³.

Antes y después: ejemplo de una prueba en la que el usuario debe extrapolar una línea diagonal que rebota en una pared roja. ARC-AGI es una prueba destinada a determinar hasta qué punto han progresado las herramientas de inteligencia artificial hacia el pensamiento y el aprendizaje a nivel humano, y muestra al usuario un conjunto de imágenes de antes y después. Luego se les pide que infieran el caso. — Fuente: Referencia. 1

Las buenas normas deben evitar una serie de problemas. Por ejemplo, es esencial que la IA no vea las mismas preguntas durante su entrenamiento, y las preguntas deben diseñarse de tal manera que la IA no pueda hacer trampa tomando atajos. “Los estudiantes de maestría son expertos en aprovechar señales textuales sutiles para extraer respuestas sin pensar realmente”, dice Yu. Añade que se supone que las pruebas serán tan caóticas y ruidosas como las condiciones del mundo real, y al mismo tiempo establecerán objetivos de eficiencia energética.

Yue dirigió el desarrollo de una prueba llamada Escala multidisciplinaria de comprensión y razonamiento integral para inteligencia artificial general experta (MMMU), que pide a los chatbots que realicen tareas visuales de nivel universitario, como interpretar notas musicales, gráficos y diagramas de circuitos.⁴. O1 de OpenAI tiene el récord actual de MMMU del 78,2% (se desconoce el puntaje de o3), en comparación con un desempeño humano de alto nivel del 88,6%, dice Yue.

Por el contrario, ARC-AGI se basa en matemáticas básicas y habilidades de reconocimiento de patrones que los humanos suelen desarrollar en la primera infancia. Proporciona a los examinados un conjunto ilustrativo de diseños de antes y después, y les pide que infieran el estado “después” de un nuevo diseño “antes” (consulte “Antes y después”). “Me gusta la prueba ARC-AGI por su perspectiva complementaria”, dice Yu.

[ad_2]

Source Article Link

El suicidio de Foxconn desencadena una investigación sobre Apple

Condiciones laborales en las fábricas de Foxconn

Las condiciones laborales en Foxconn sacudieron a Apple bajo Jobs. Las operaciones de las fábricas chinas se han convertido en una de las mayores controversias en Cupertino, junto con el proceso de fabricación. Problema de “Antennagate” en iPhone 4Censura en la App Store, Empleos de opciones sobre acciones retroactivas granizo A veces, un enfoque duro del periodismo.

Lo que todas estas situaciones tienen en común es que no sacaron lo mejor de Jobs. Era un líder visionario, pero a veces parecía espontáneo en público. Esto resultó especialmente cierto cuando se trataba de abordar cuestiones con las que no se sentía cómodo desafiando.

Esto es lo que pasó con el suicidio de Foxconn. De hecho, Apple no es la única empresa tecnológica que fabrica sus productos en China. Sin embargo, su alto nivel de visibilidad –y el hecho de que logró promocionarse como una rebelde luchadora por la libertad motivada por hacer del mundo un lugar mejor– significó que Cupertino se convirtiera en sinónimo de malas noticias.

Según los informes, un trabajador se suicidó después de perder un prototipo de iPhone de cuarta generación y posteriormente fue intimidado por agentes de seguridad de Foxconn.

La opinión de muchos fue resumida por los autores del libro de 2016. Convertirse en Steve Jobs: “¿Cómo podría una empresa con el talento de marketing de Apple fabricar sus dispositivos en fábricas de Foxconn donde el trabajo duro y las difíciles condiciones laborales llevaron al suicidio de más de una docena de trabajadores de la línea de montaje?”

Steve Jobs responde al suicidio de Foxconn

Jobs era indiscutiblemente brillante a la hora de vender productos. Pero su naturaleza directa hizo que sus comentarios sobre la situación de Foxconn parecieran malos. Defendió a Foxconn poco después de que se conociera la noticia del suicidio, calificando sus fábricas como un ambiente “muy agradable” y “no una fábrica de explotación”. Pero la frase que más falló fue su comentario: “Ya hemos superado esto por completo”. A mucha gente le pareció indiferente.

De hecho, manzana Él era Por todo el problema. Después de los informes sobre el suicidio de Foxconn, organizó un grupo de trabajo para hacer frente a la situación. La empresa rápidamente tomó medidas para evitar que volviera a suceder lo mismo.

Desde entonces, Apple ha ido mejorando constantemente su cadena de suministro. Sin embargo, todavía enfrenta críticas ocasionales por parte de activistas de derechos laborales y otras organizaciones.

Mientras tanto, el director ejecutivo de Apple, Tim Cook, era lo opuesto a Jobs en muchos sentidos. Aunque no era un visionario de productos, Cook fue más expresivo en cuanto a hacer de Apple una “empresa emblemática”.Poder para el bien“No tiene las asperezas de Jobs. El comportamiento de Cook ayuda a Apple a navegar en terrenos difíciles como las condiciones laborales en su cadena de suministro.

Esta publicación sobre la respuesta de Apple a los suicidios de Foxconn se publicó originalmente el 25 de mayo de 2018. Hemos actualizado el contenido.