Google Finalmente lanzó el miércoles sus últimos modelos para generación de imágenes y videos con IA. Ambos modelos de inteligencia artificial eran así quitar el velo en Google I/O como el último avance del gigante tecnológico en IA generativa. Ahora, más de seis meses después, la empresa con sede en Mountain View ha presentado este sistema en Vertex AI a sus clientes empresariales. Vale la pena señalar que, aunque Imagen 3 aún no está disponible como plataforma independiente, se ha utilizado en varias plataformas y herramientas como Google Docs, Gemini y una herramienta experimental llamada GenChess.
Imagen de Google 3, veo modelos de IA
en un Publicación de blogEl gigante tecnológico ha anunciado la introducción de dos nuevos modelos de IA en Vertex AI. La plataforma Vertex AI de Google es una plataforma administrada de aprendizaje automático (ML). Nube de Google Permite a los desarrolladores y organizaciones crear, implementar y gestionar modelos de IA. Es similar a Amazon Bedrock y Microsoft Azure y ofrece herramientas y soluciones de flujo de trabajo de IA integradas.
El gigante tecnológico dijo que el modelo de creación de videos Veo ahora está disponible en Vertex AI en vista previa privada y las empresas pueden crear videos usando mensajes de texto o imágenes. Por otro lado, Imagen 3 estará disponible a partir de la próxima semana. Se necesitan indicaciones de texto y las organizaciones pueden utilizarlas para crear imágenes que reflejen el estilo y los logotipos de su marca.
En cuanto a las capacidades de Veo, Google dice que puede crear videos de alta calidad basados en mensajes de texto o imágenes. Los vídeos se pueden crear en una amplia gama de estilos visuales y cinematográficos. Desarrollado por mente profundaSe dice que el modelo de IA tiene un compromiso extremadamente rápido y puede crear tomas consistentes de objetos, personas e incluso capturar movimientos de manera realista.
Imagen 3, que estará disponible en Vertex AI a partir de la próxima semana, puede crear imágenes fotorrealistas en una amplia gama de estilos. Al describirlo como “nuestro modelo de generación de imágenes más capaz hasta el momento”, Google afirmó que el modelo de generación de imágenes puede comprender indicaciones en lenguaje natural y los usuarios no tienen que describir elementos técnicos para obtener el resultado deseado.
El modelo Imagen 3 AI también estará disponible con herramientas de edición para dibujo interior y dibujo exterior. Las empresas también pueden incorporar los colores, patrones, logotipos y otros elementos de su marca en las imágenes creadas.
Para la privacidad y la seguridad, el gigante tecnológico ha agregado varias herramientas. SynthID, tecnología de marca de agua sofisticado DeepMind lo integrará en cada imagen y cuadro de video producido por estos modelos de IA para combatir los deepfakes y la desinformación. Google también afirmó que los modelos de IA no se entrenarán con los datos de los clientes y que las herramientas funcionarán bajo los controles de privacidad y gobernanza de datos de Google Cloud.