El nuevo modelo de vídeo con IA de Google está menos absorto en la física

[ad_1]

Es posible que Google haya comenzado recientemente a implementar su aplicación Espectáculo Inteligencia artificial generativa para Clientes empresarialespero la compañía no pierde el tiempo lanzando una nueva versión de la herramienta de video para los primeros evaluadores. Google anunció el lunes Vista previa 2. Según la empresa, Veo 2 “entiende el lenguaje cinematográfico”. En la práctica, esto significa que puedes indicar un tipo específico de película, efecto cinematográfico o lente al solicitar el formulario.

Además, Google dice que el nuevo modelo tiene una mejor comprensión de la física y el movimiento humano del mundo real. Modelar correctamente a los humanos en movimiento es algo que todos los modelos generativos luchan por lograr. Así que la afirmación de la compañía de que el Veo 2 es mejor en ambos puntos es digna de mención. Por supuesto, las muestras proporcionadas por la empresa no son suficientes para saberlo con seguridad; La verdadera prueba de las capacidades del Veo 2 llegará cuando alguien lo pida Crea un vídeo de la rutina de una gimnasta. Hablando de las cosas que sufren los modelos de vídeo, Google dice que Veo producirá artefactos como dedos adicionales “con menos frecuencia”.

Muestra de imagen de ardilla creada con Google Imagen 3. — Google

Por otra parte, Google está implementando mejoras en Imagen 3. En cuanto al modelo de texto a imagen, la compañía dice que la última versión genera imágenes más brillantes y mejor compuestas. Además, puede representar estilos artísticos más diversos con mayor precisión. Al mismo tiempo, también es mejor seguir más fielmente las instrucciones. El compromiso inmediato fue un tema que destacó cuando la compañía puso Imagen 3 a disposición de los clientes de Google Cloud a principios de este mes, por lo que, al menos, Google es consciente de las áreas donde sus modelos de IA deben funcionar.

Veo 2 se implementará gradualmente para… laboratorios de google Usuarios en Estados Unidos. Por ahora, Google limitará la capacidad de los evaluadores para producir hasta ocho segundos de metraje con una resolución de 720p. Para el contexto, sora Puede crear hasta 20 segundos de metraje a 1080p, aunque hacerlo requiere 200 dólares al mes. Suscripción ChatGPT Pro. En cuanto a las últimas mejoras de Imagen 3, están disponibles para los usuarios de Google Labs en más de 100 países a través… imagenfx.

[ad_2]

Source Article Link

By lisa nichols

Leave a Reply Cancel reply