OpenAI ha comenzado a obtener una vista previa de una nueva herramienta llamada Operador que puede navegar dentro de un navegador web. Según una publicación de blog Publicado el juevesEl software es ejecutado por lo que la empresa llama un agente de uso de computadora. “CUA está capacitado para interactuar con interfaces gráficas de usuario (GUI) (los botones, menús y campos de texto que las personas ven en la pantalla) tal como lo hacen los humanos”, dice OpenAI sobre el modelo. “Esto le da la flexibilidad de realizar tareas digitales sin utilizar el sistema operativo o las API web”.
La versión actual de Operador se basa en el modelo GPT-4o de OpenAI. Combina las capacidades de visión de ese algoritmo con una “inferencia avanzada” entrenada mediante aprendizaje por refuerzo. El operador tiene la capacidad de “dividir las tareas en planes de varios pasos y autocorregirlas de forma adaptativa cuando surgen desafíos”. Según OpenAI, esta capacidad representa la siguiente etapa en el desarrollo de la inteligencia artificial.
Al igual que con avances de investigaciones anteriores, OpenAI advierte que Operador “aún es temprano y tiene limitaciones” y que todavía no “funcionará de manera confiable en todos los escenarios”. Por ejemplo, dependiendo de la complejidad de la tarea y la interfaz en cuestión, el agente se beneficia enormemente de que el usuario dedique unos minutos adicionales a redactar un reclamo más detallado. por Bordeel iniciador le dará control al usuario si se queda atascado en una tarea. También se controlará cuando un sitio web solicite información confidencial, incluidas las credenciales de inicio de sesión. La compañía dice que diseñó la herramienta para “rechazar solicitudes maliciosas y bloquear contenido no autorizado”.
OpenAI pondrá por primera vez el reproductor a disposición de los usuarios por 200 dólares al mes Suscripción ChatGPT Pro. También coopera con empresas como Instacart Para ofrecer el proxy en sus plataformas, nuevamente necesitará una suscripción a ChatGPT Pro para probar la integración.
El iniciador se une a una lista cada vez mayor de agentes de IA que pueden navegar por todo su navegador web o sistema operativo. Anthropic fue el primero en introducir la posibilidad con su lanzamiento. Modelo Claude 3.5 Sonnet en octubreseguido recientemente por Google con Géminis 2.0 modelo f Proyecto marinero.
Si compra algo a través del enlace de este artículo, es posible que ganemos una comisión.