AbiertoAI Acaba de celebrar su tan esperado evento de actualización de primavera, donde realizó una serie de anuncios interesantes y demostró las increíbles capacidades de sus últimos modelos de IA GPT. Ha habido cambios en la disponibilidad del modelo para todos los usuarios, y en el centro de expectación y atención: GPT-4o.
Llegó hace sólo 24 horas E/S de Googlepone el lanzamiento GoogleGéminis desde una nueva perspectiva. Si GPT-4o es tan impresionante como parece, es mejor que Google y su esperada actualización Gemini sean igualmente impresionantes.
¿Qué es todo este alboroto? Profundicemos en todos los detalles de lo que anunció OpenAI.
1. Se anuncia y ofrece GPT-4o y estará disponible para todos los usuarios de forma gratuita.
El mayor anuncio sobre streaming fue la presentación de GPT-4o (la 'o' significa 'omni'), que combina procesamiento de audio, imágenes y texto en tiempo real. En última instancia, esta versión de la tecnología GPT de OpenAI estará disponible para todos los usuarios de forma gratuita, con límites de uso.
Por ahora, sin embargo, se ha implementado en ChatGPT Usuarios Plus, que obtendrán hasta cinco veces los límites de mensajería de los usuarios gratuitos. Los usuarios de Team y Enterprise también obtendrán límites más altos y pronto podrán acceder a ellos.
GPT-4o tendrá la inteligencia de GPT-4, pero será más rápido y con mayor capacidad de respuesta en el uso diario. Además, podrás proporcionarle o pedirle que cree cualquier combinación de texto, imágenes y audio.
En la transmisión, Mira Moratti, CTO de OpenAI, y los investigadores Mark Chen y Barrett Zoff demostraron la respuesta en tiempo real de GPT-4o a la conversación mientras usaban sus funciones de voz.
La demostración comenzó con una conversación sobre el estado mental de Chan, con GPT-4o escuchando y respondiendo a su respiración. Luego le contó a Barrett un cuento antes de dormir con niveles cada vez mayores de dramatismo en su voz a pedido; incluso le pidieron que hablara como un robot.
Continuó con una demostración de Barret “mostrando” a GPT-4o un problema matemático y el modelo guiando a Barret a través de su solución ofreciéndole sugerencias y estímulo. Chan se preguntó por qué era útil este concepto matemático en particular y respondió extensamente.
Siguieron mostrando algo de código GPT-4o, explicado en inglés sencillo, y proporcionaron comentarios sobre la trama generada por el código. El modelo hablaba de eventos importantes, etiquetas de ejes y un conjunto de entradas. Esto fue para demostrar la convicción continua de OpenAI en mejorar la interacción de los modelos GPT con las bases de código y mejorar sus capacidades matemáticas.
La penúltima exhibición fue una demostración impresionante de las capacidades lingüísticas del GPT-4o, traduciendo simultáneamente dos idiomas (inglés e italiano) en voz alta.
Finalmente, OpenAI brindó una breve demostración de la capacidad de GPT-4o para reconocer emociones a partir de una selfie enviada por Barrett, y señaló que parecía feliz y alegre.
Si el modelo de IA funciona como se describe, podrá hablar con él de forma más natural que con muchos modelos de voz de IA y otros asistentes digitales actuales. Podrás interrumpirlos en lugar de tener una conversación por turnos, y aún así procesarán y responderán, de forma similar a como nos hablamos naturalmente entre nosotros. Además, se ha reducido significativamente el tiempo entre la consulta y la respuesta, que antes era de dos o tres segundos.
ChatGPT equipado con GPT-4o se lanzará en las próximas semanas y se puede probar de forma gratuita. Esto se produce apenas unas semanas después de que Open AI pusiera ChatGPT a disposición para probar sin necesidad de registrarse para obtener una cuenta.
2. Los usuarios gratuitos tendrán acceso a la tienda GPT, la función de memoria, la función de navegación y el análisis de datos avanzado.
Los GPT son chatbots personalizados creados por usuarios de OpenAI y ChatGPT Plus para ayudar a permitir conversaciones y tareas más específicas. Ahora, más usuarios pueden acceder a él en la Tienda GPT.
Además, los usuarios gratuitos podrán utilizar la función de memoria de ChatGPT, convirtiéndola en una herramienta más útil y beneficiosa al darle una sensación de permanencia. Las capacidades de visibilidad de ChatGPT también se agregan al plan gratuito, lo que le permite hablar con el bot sobre los elementos cargados, como imágenes y documentos. La función de navegación le permite buscar conversaciones pasadas más fácilmente.
Las capacidades de ChatGPT han mejorado en calidad y velocidad en 50 idiomas, respaldando el objetivo de OpenAI de hacer que sus poderes estén disponibles para la mayor cantidad de personas posible.
3. GPT-4o estará disponible en la API para desarrolladores
El último modelo de OpenAI estará disponible para que los desarrolladores lo integren en sus aplicaciones de IA como modelo de texto y visión. Próximamente se lanzará soporte para las capacidades de video y audio de GPT-4o y se ofrecerá a un pequeño grupo de socios API confiables.
4. Nueva aplicación de escritorio ChatGPT
OpenAI está lanzando una aplicación de escritorio para macOS para promover su misión de hacer que sus productos sean lo más fáciles y sencillos posible, esté donde esté y sea cual sea el modelo que esté usando, incluido el nuevo GPT-4o. Podrás asignar atajos de teclado para realizar operaciones más rápidamente.
Según OpenAI, la aplicación de escritorio ya está disponible para los usuarios de ChatGPT Plus y estará disponible para más usuarios en las próximas semanas. También presenta un diseño similar a la interfaz actualizada de la aplicación móvil.
5. Interfaz de usuario de ChatGPT actualizada
ChatGPT tiene una interfaz de usuario más natural e intuitiva y se ha actualizado para que la interacción con el formulario sea más fácil y menos confusa. OpenAI quiere llegar al punto en el que la gente apenas se centre en la IA y que ChatGPT se sienta más amigable. Esto significa una nueva pantalla de inicio, diseño de mensajes y otros cambios.
6. OpenAI aún no está terminado
La misión es audaz, ya que OpenAI busca desmitificar la tecnología y al mismo tiempo crear algunas de las tecnologías más sofisticadas accesibles para la mayoría de las personas. Moratti concluyó diciendo que pronto seremos informados de lo que OpenAI se prepara para mostrarnos a continuación y le agradecemos. NVIDIA Proporcionar las unidades de procesamiento de gráficos más avanzadas para hacer posible la visualización.
Decidida a dar forma a nuestras interacciones con los dispositivos, OpenAI estudia de cerca cómo los humanos interactúan entre sí e intenta aplicar lo aprendido a sus productos. La latencia para procesar todos los matices de la interacción es parte de lo que dicta cómo nos comportamos con productos como ChatGPT, y OpenAI ha trabajado arduamente para reducirla. Como dice Moratti, sus habilidades seguirán evolucionando y podrá ayudarte mejor con exactamente lo que estás haciendo o preguntando en el momento exacto.