Han pasado casi dos meses desde entonces. Abierto AI presumir El nuevo e impresionante modo de audio de ChatGPT (Y entré Desacuerdo público con Scarlett Johansson), pero la función ya está lista para implementarse para los suscriptores Plus, o al menos para un pequeño grupo de ellos.
chat gbt Los fanáticos han estado molestando a OpenAI sobre el modo de audio casi a diario, y el CEO Sam Altman ahora ha proporcionado una actualización sobre X (anteriormente Twitter). En una breve respuesta a alguien que preguntó sobre el modo de audio reproducido, Altman dijo: “¡La versión beta comenzará a implementarse para más suscriptores la próxima semana!”.
La naturaleza informal de la respuesta sugiere que no se trata de un anuncio completo, por lo que es probable que se produzcan más retrasos. Pero señala que un nuevo modo de audio ahora es inminente, para un grupo selecto de suscriptores de ChatGPT Plus (un nivel que cuesta $20/£16/AU$28 por mes).
Es probable que el nuevo modo no se lance por completo la semana del 29 de julio, como dijo anteriormente OpenAI. X (anteriormente Twitter) “Comenzará la fase beta con un pequeño grupo de usuarios para recopilar comentarios y ampliarlos en función de lo que aprendamos”.
Inicialmente, OpenAI planeaba comenzar a implementar esta versión pequeña para los usuarios beta a fines de junio, pero dijo que necesitaba “otro mes para alcanzar el lanzamiento máximo”. Bueno, parece que el tiempo adicional que tomó mejorar la “capacidad del modelo para detectar y rechazar contenido específico” ha valido la pena y estará disponible para todos en unos días.
Esto puede volver a ser frustrante para los suscriptores de ChatGPT Plus que no están en el grupo Alpha designado, pero OpenAI dice que “planea permitir que todos los usuarios Plus tengan acceso en el otoño”. Este todavía parece ser el cronograma planificado para el nuevo modo Voz, pero probablemente recibamos una actualización más importante la próxima semana.
¿Qué es el nuevo modo de audio en ChatGPT?
OpenAI ha estado generando entusiasmo en torno al modo de voz de ChatGPT en las semanas posteriores a su debut, lanzando varios videos (como el de arriba) que muestran su capacidad para realizar movimientos de improvisación en las voces de diferentes personajes, ayudando a los usuarios a interpretar entrevistas y ayudando en el aprendizaje. nuevos idiomas.
Cuando miras estas demostraciones, es fácil ver por qué el nuevo modo de sonido ha sido tan esperado. tal vez lo vimos Siri recibió una actualización de IA más tardePero ningún otro asistente de voz ha podido demostrar una capacidad similar a lo que OpenAI llama “conversaciones naturales en tiempo real con IA”.
El elemento añadido a estas interacciones de voz es que el último GPT-4o también puede configurar sus respuestas en función de una combinación de audio, texto y vídeo, lo que significa conversaciones de ciencia ficción como las que se encuentran en Este es un vídeo explicativo..
Si el nuevo modo de audio de ChatGPT es capaz o no de alcanzar este nivel de fluidez y consistencia en el mundo real es algo que descubriremos muy pronto. OpenAI también revela un prototipo de su motor de búsqueda SearchGPT, y se perfila como otro mes lleno de acontecimientos. La empresa de inteligencia artificial más famosa del mundo..