Empecé Google Ofrecer acceso privado Para los modelos de IA generativa Veo e Imagen 3, a partir de hoy, los clientes de la suite Vertex AI Google Cloud de la empresa pueden comenzar a utilizarlos. Espectáculo Para crear videos a partir de mensajes de texto e imágenes. Luego, a partir de la próxima semana, Google pondrá Imagen 3, su último marco de conversión de texto a imagen, a disposición de esos mismos usuarios.
Con la introducción de Veo, Google dice que es el primer proveedor de nube a gran escala que ofrece un modelo de conversión de imagen a video. Hasta este punto, OpenAI sora El modelo todavía solo está disponible para artistas, académicos e investigadores seleccionados, aunque eso podría cambiar rápidamente con la empresa. Emocionantes 12 días de demostraciones de productos A partir del 5 de diciembre.
En cuanto a Veo, Google dice que el modelo crea imágenes de 1080p que son “consistentes y cohesivas” y pueden reproducirse durante “más de un minuto”. La herramienta también puede trabajar tanto con mensajes de texto como con imágenes. En el último caso, es posible utilizar imágenes generadas por IA o por humanos como punto de partida para el vídeo.
Al observar las instantáneas de muestra compartidas por Google, queda claro que Veo, como todos los modelos de IA, puede sufrir de causa y efecto. Por ejemplo, en el clip de malvaviscos asados, el caramelo no se vuelve amarillo ni se carboniza cuando se expone al calor de la llama de una fogata. La fabricación también es un problema, como resulta evidente si se observan de cerca las manos en las imágenes de los conciertos.
En cuanto a Imagen 3, Google dice que el modelo genera “las imágenes más realistas y de mayor calidad a través de mensajes de texto simples, superando a las versiones anteriores de Imagen en detalle, iluminación y reducción de artefactos”. Una vez más, sin embargo, no es necesario mirar de cerca para ver que Google tiene más trabajo por hacer.
En el primer ejemplo de un grupo de amigos sentados en el maletero de un automóvil, el mensaje original incluye una referencia a la “fotografía con flash”, pero los sujetos están claramente a contraluz. Se podría argumentar que se utilizó flash para crear una intensa luz de fondo, pero si la idea detrás del vector era crear algo que representara la fotografía con flash de la década de 1960, entonces esta imagen no lo es.
Sin embargo, Google desea atraer a más clientes empresariales que utilicen IA generativa. Citando su propia investigaciónEl gigante tecnológico dice que entre las empresas que utilizan IA generativa en la producción, el 86 por ciento informó un aumento en los ingresos. Sin embargo, un La última encuesta de Abyan Encontró que el retorno de la inversión de proyectos de IA cayó 4,6 puntos porcentuales de 2023 a 2024.
Si compra algo a través del enlace de este artículo, es posible que ganemos una comisión.