El nuevo modelo de vídeo con IA de Google está menos absorto en la física


Es posible que Google haya comenzado recientemente a implementar su aplicación Espectáculo Inteligencia artificial generativa para Clientes empresarialespero la compañía no pierde el tiempo lanzando una nueva versión de la herramienta de video para los primeros evaluadores. Google anunció el lunes Vista previa 2. Según la empresa, Veo 2 “entiende el lenguaje cinematográfico”. En la práctica, esto significa que puedes indicar un tipo específico de película, efecto cinematográfico o lente al solicitar el formulario.

Además, Google dice que el nuevo modelo tiene una mejor comprensión de la física y el movimiento humano del mundo real. Modelar correctamente a los humanos en movimiento es algo que todos los modelos generativos luchan por lograr. Así que la afirmación de la compañía de que el Veo 2 es mejor en ambos puntos es digna de mención. Por supuesto, las muestras proporcionadas por la empresa no son suficientes para saberlo con seguridad; La verdadera prueba de las capacidades del Veo 2 llegará cuando alguien lo pida Crea un vídeo de la rutina de una gimnasta. Hablando de las cosas que sufren los modelos de vídeo, Google dice que Veo producirá artefactos como dedos adicionales “con menos frecuencia”.

El nuevo modelo de vídeo con IA de Google está menos absorto en la física

Google

Por otra parte, Google está implementando mejoras en Imagen 3. En cuanto al modelo de texto a imagen, la compañía dice que la última versión genera imágenes más brillantes y mejor compuestas. Además, puede representar estilos artísticos más diversos con mayor precisión. Al mismo tiempo, también es mejor seguir más fielmente las instrucciones. El compromiso inmediato fue un tema que destacó cuando la compañía puso Imagen 3 a disposición de los clientes de Google Cloud a principios de este mes, por lo que, al menos, Google es consciente de las áreas donde sus modelos de IA deben funcionar.

See also  Revisión de Beam Pro: un dispositivo similar a un teléfono que se combina con gafas XREAL para una imitación de Vision Pro

Veo 2 se implementará gradualmente para… laboratorios de google Usuarios en Estados Unidos. Por ahora, Google limitará la capacidad de los evaluadores para producir hasta ocho segundos de metraje con una resolución de 720p. Para el contexto, sora Puede crear hasta 20 segundos de metraje a 1080p, aunque hacerlo requiere 200 dólares al mes. Suscripción ChatGPT Pro. En cuanto a las últimas mejoras de Imagen 3, están disponibles para los usuarios de Google Labs en más de 100 países a través… imagenfx.



Source Article Link

Leave a Comment