Google I/O 2024: Google presenta AI Video Generator Veo, compitiendo con Sora de OpenAI



E/S de Google La sesión magistral de 2024 fue una sesión de 112 minutos en la que la empresa realizó varios anuncios clave centrados en inteligencia artificial (Amnistía Internacional). Los anuncios abarcaron desde nuevos modelos de IA hasta la integración de la IA en los productos de Google, pero quizás una de las presentaciones más interesantes fue Veo, un modelo de generación de vídeo impulsado por IA que puede crear vídeos de 1080p. El gigante tecnológico dijo que la herramienta de inteligencia artificial puede crear videos de más de un minuto de duración. En particular, OpenAI también quitar el velo Llamó a su modelo de vídeo AI Sora en febrero.

Durante el evento, Demis Hassabis, cofundador y director ejecutivo de Google DeepMind, dijo: quitar el velo Vista. Al anunciar el modelo de IA, dijo: “Hoy, me complace anunciar nuestro modelo de video generativo más nuevo y más capaz llamado Veo. Veo crea videos de alta calidad de 1080p con mensajes de texto, imágenes y video. Puede capturar el Detalles de tus instrucciones de forma visual.” Y diferentes cinemáticas.

El gigante tecnológico afirma que Veo puede seguir de cerca las afirmaciones para comprender los matices y el tono de una frase y luego crear un vídeo que se parezca a ella. El modelo de IA puede crear videos en diferentes estilos, como tomas a intervalos, primeros planos, tomas de seguimiento rápido, tomas aéreas, iluminación variada y tomas de profundidad de campo. Además de crear el video, el modelo de IA también puede editar videos cuando el usuario le proporciona un video inicial y un mensaje para agregar o eliminar algo. Además, también puede crear vídeos más allá de la marca de un minuto, ya sea mediante un único mensaje o mediante varios mensajes secuenciales.

See also  Me niego a hacerme ilusiones con Piratas del Caribe 6 a pesar de las recientes actualizaciones positivas.

Para resolver el problema de coherencia en los modelos de generación de vídeo, Veo utiliza transformadores de difusión latente. Esto ayuda a reducir los casos en que los personajes, objetos o toda la escena parpadean, saltan o cambian inesperadamente entre fotogramas. Google Destacó que los videos creados por Veo tendrán una marca de agua utilizando SynthID, la herramienta interna de identificación y marca de agua de la compañía para contenido generado por IA. El modelo pronto estará disponible para creadores seleccionados a través de la herramienta VideoFX de Google Labs.

Similitudes entre Veo y Sora de OpenAI

Aunque ninguno de los modelos de IA está disponible todavía para el público, ambos comparten muchas similitudes. Veo puede crear vídeos de 1080p de hasta un minuto de duración Abierto AI Sora puede crear videos de hasta 60 segundos de duración. Ambos modelos pueden crear videos a partir de mensajes de texto, imágenes y videos. Basados ​​en modelos de difusión, ambos son capaces de crear videos a partir de múltiples planos, estilos y técnicas cinematográficas. Tanto Sora como Veo también vienen con etiquetas de contenido generadas por IA. Sora usa el estándar Coalition for Content Provenance and Authenticity (C2PA), mientras que Veo usa su propio SynthID nativo.


Los enlaces de afiliados pueden generarse automáticamente; consulte nuestro sitio web Declaración de ética Para detalles.



Source Article Link

Leave a Comment