AbiertoAI Presentó GPT-4o, un nuevo modelo de inteligencia artificial que combina texto, visión y voz.
Entonces El muy esperado evento de transmisión en vivo, Mira Murati, CTO de OpenAI, dijo que GPT-4o puede procesar texto, audio y visión en un solo modelo. GPT-4o estará disponible gratuitamente para todos los usuarios de ChatGPT. También está disponible en la API, cuesta la mitad de precio y es 2 veces más rápido que GPT -4 Turbo. La “o” del nombre significa “omni”, en referencia a sus modalidades combinadas en un único modelo.
Capacidades de audio GPT-4o
Anuncio confirmado Rumores anteriores sobre un asistente de voz. Anteriormente existían modelos separados para las modalidades de audio y vídeo. Pero GPT-4o es “multimedia nativa”, Él dijo El director ejecutivo de OpenAI, Sam Altman, habla sobre X.
Es posible que el tweet haya sido eliminado.
Ahora, GPT-4o combina los métodos, reduciendo la latencia y haciéndolo receptivo en tiempo real. Esto significa que puede interrumpir el formulario. También puede sentir y expresar emociones y tonos, lo que le hace parecer demasiado dramático o robótico. Incluso puede cantar (si quieres).
La suave voz femenina utilizada en la demostración se parece mucho al personaje asistente de voz de Scarlett Johansson en la película. Ja.
Velocidad de la luz triturable
Capacidades de visión GPT-4o
Otra demostración demostró la capacidad de GPT-4o para ayudar a resolver problemas matemáticos utilizando su método de visión. Puede guiar al usuario a través de un problema matemático básico al resolver un problema.
A través de consultas de usuarios, ChatGPT con GPT-4o ha demostrado su capacidad para traducir en tiempo real y comprender sentimientos.
Es posible que el tweet haya sido eliminado.
Murati inició el evento compartiendo la disponibilidad de una nueva aplicación de escritorio.
Anteriormente, se rumoreaba que OpenAI anunciaría un motor de búsqueda ChatGPT o un nuevo modelo de compilador GPT-5 antes. E/S de Google. El director ejecutivo Sam Altman desmintió estos rumores antes del evento del lunes, pero se cree que todavía están en desarrollo.