OperadorHa llegado un agente OpenAI que puede realizar tareas de varios pasos de forma autónoma.
el El creador de ChatGPT ha introducido un modo de vista previa para el jugador el jueves, detallando cómo funciona y de qué es capaz. El operador puede navegar por la web, realizar tareas como calcular reembolsos de un pedido cancelado y encontrar clientes con criterios específicos en la base de datos de ventas interna. También puede comprar alimentos y enviar correos electrónicos.
En una PC, el reproductor puede realizar diversas tareas, como descargar archivos, fusionar archivos PDF, analizar hojas de cálculo y exportar imágenes.
OpenAI es Cumpliendo su promesa a Haga de 2025 el año de la IA del agente. La empresa lanzó la semana pasada. Tareas para ChatGPT, que permite a los usuarios automatizar mensajes futuros, como enviar un resumen diario de noticias tecnológicas o programar recordatorios. Si bien muchas de estas tareas ya son posibles a través de herramientas básicas como Google Alerts y Calendars, este es un ejemplo temprano de robots de IA que hacen el trabajo en nombre del usuario. Combinado con el lanzamiento de Operador y su capacidad para realizar tareas más complejas de forma independiente, puedes empezar a ver que La visión de OpenAI es hacer de ChatGPT una herramienta indispensable Aprovechando su producto principal.
Velocidad de la luz triturable
El modelo subyacente al operador es el Computer Usage Agent (CUA) que combina un modo de visión GPT-4o para “ver” lo que hay en la pantalla del usuario a través de capturas de pantalla con interfaces gráficas de usuario (GUI) que permiten al operador interactuar con la pantalla ( hacer clic en botones, escribir, desplazarse, etc.).
Operador en el trabajo, explorando un campamento de Yosemite con mesas de picnic.
Crédito: OpenAI
El enfoque de seguridad de OpenAI con el operador
Claramente, la seguridad es una preocupación importante para un agente de IA semiautónomo como el operador. OpenAI dice que tiene en cuenta los riesgos de varias maneras diferentes. El operador mitiga el abuso bloqueando tareas maliciosas o ilegales y no puede acceder a sitios incluidos en la lista negra, como sitios de apuestas, sitios de entretenimiento para adultos y minoristas de drogas o armas.
Y OpenAI te monitorea mientras usas el iniciador. El anuncio decía que “las interacciones de los usuarios son revisadas en tiempo real por auditores de seguridad automatizados que están diseñados para garantizar el cumplimiento de las políticas de uso y tienen la capacidad de emitir advertencias o bloqueos para actividades prohibidas”, y que la empresa ha desarrollado “detección y control automatizados”. escucha.” Tuberías de revisión humana para identificar el uso prohibido en áreas políticas prioritarias, incluida la seguridad infantil y las actividades engañosas.
Debido a que el operador puede cometer errores costosos sin supervisión humana, el formulario solicitará confirmación “antes de realizar un pedido, enviar un correo electrónico, etc., para que el usuario pueda verificar que el formulario esté funcionando antes de que se vuelva permanente”. Actualmente, el operador también está restringido a “tareas de alto riesgo, como transacciones bancarias”.
Disponibilidad del operador
Ahora estamos empezando a ver la nueva suscripción de nivel premium de OpenAI. Chat GPT Pro. El reproductor en modo de vista previa solo está disponible en los EE. UU. para aquellos que pagan $200 por mes como usuarios Pro. Pero con el tiempo, OpenAI espera ampliar la disponibilidad para los usuarios Plus, Team y Enterprise.