Microsoft Build 2024: qué puede hacer GPT-4o en Azure AI


Modelo multimodal OpenAI GPT-4o Ahora disponible para desarrolladores en Microsoft Azure AI.

en Microsoft construye 2024En la conferencia de desarrolladores de la compañía, Microsoft compartió que aquellos que estén ansiosos por tener GPT-4o ahora pueden acceder a él a través de Azure AI Studio y como una interfaz de programación de aplicaciones (API).

Azure AI Studio de Microsoft es un campo de juego para que los desarrolladores prueben las últimas herramientas impulsadas por Azure, que incluyen modelos OpenAI como GPT-4 Turbo y ahora GPT-4o.

Las capacidades de imagen y visión de GPT-4o ya están disponibles a través de OpenAI y la API de ChatGPT. Pero todavía faltan algunas semanas para el tan esperado modo de voz. Lo mismo ocurre con el acceso a GPT-4o a través de Azure AI Studio y la API de Microsoft: todavía no hay modo de audio. Centro técnico comunitario de Microsoft Entrada en el blogLas capacidades de voz llegarán “en el futuro”, afirmó.

No está claro si las capacidades de voz están disponibles actualmente a través de Azure AI, pero el CEO de Microsoft, Satya Nadella, compartió algunas formas en que las personas pueden (eventualmente) usar GPT-4o a través de Copilot. Esto incluye compartir su pantalla o sesión con su copiloto GPT-4o y solicitarla. ayuda para jugar minecraft. Como señala Alex Perry de Mashable, si tienes dificultades con Minecraft, “puedes jugar durante 10 minutos o simplemente buscarlo en Google”.

Velocidad de la luz triturable

Nadella también habló sobre lo que los desarrolladores pueden hacer con GPT-4o en Azure AI.

“Una de las cosas más interesantes es cómo cualquier aplicación o sitio web puede convertirse básicamente en un tablero de conversación bidireccional, multimedia y completo”, dijo Nadella. Esto significa que los desarrolladores pueden crear agentes que ayuden a las personas a navegar entre aplicaciones y sitios web. Para un hombre que tenía prisa y estaba a punto de irse de campamento durante la noche, el agente le mostró cómo podía ayudarlo a elegir los zapatos adecuados y agregarlos a su carrito de compras.

Hombre sujetando sandalias de senderismo frente a su computadora

GPT-4o, como agente de compras, puede ayudar a los excursionistas despistados a encontrar el calzado adecuado.
Crédito: Microsoft

Más adelante en la conferencia, el CTO de Microsoft, Kevin Scott, demostró cómo GPT-4o puede ayudar con el código, enfocándose en cómo los modelos continúan cambiando de manera más rápida y sólida. Al apuntar su teléfono a la pantalla de códigos, un bot estilo ChatGPT que usa GPT-4o lee el código y ayuda a la ingeniera principal Jennifer Marsman a solucionar el problema en tiempo real.

La pantalla del iPhone apunta a la pantalla del ordenador y muestra el icono que aparece en la pantalla.

GPT-4o puede ayudar a solucionar problemas de código.
Crédito: Microsoft

En Build, Microsoft implementó GPT-4o en muchos de sus anuncios, incluido… copiloto, diferenciaY más. Pero GPT-4o en Azure AI pone el paradigma multimedia en manos de los desarrolladores, lo que significa que seguramente habrá muchas más aplicaciones y herramientas multimedia pronto.





Source Article Link

Leave a Comment