Odyssey crea un modelo de inteligencia artificial para convertir texto en videos de 'nivel Hollywood' para competir con Sora y Gen-3 Alpha



Odisea, inteligencia artificial OpenAI, una startup fundada el año pasado, anunció el lunes los detalles de su primer producto de IA. La compañía reveló que está construyendo un modelo de video de IA que puede crear efectos visuales al nivel de Hollywood, al igual que la herramienta Sora de OpenAI que la compañía aún no ha lanzado. El cofundador de Odyssey dice que el modelo de IA permitirá a los usuarios editar y controlar la salida a un nivel granular, y agrega que la compañía está trabajando con múltiples modelos de lenguaje grandes (LLM) para crear diferentes capas del video resultante, que pueden controlarse por separado.

Cómo funciona el modelo visual de IA de Odyssey

En una serie de publicaciones en It, se entregarán videos de alta calidad que los usuarios pueden personalizar y editar.

Cameron también compartió detalles sobre la tecnología de inteligencia artificial de Odyssey y afirmó que fue diseñada para generar videos con “calidad de Hollywood”. El CEO también dijo que la startup estaba entrenando cuatro modelos generativos para que los usuarios tomaran “el control total de las capas subyacentes de la narrativa visual”.

Cameron destacó un problema con los modelos actuales de IA para convertir texto en video, que es la falta de herramientas u opciones para controlar o editar la salida. “Como narrador, tienes poca capacidad para dirigir tu entorno o tus personajes, o repetir los detalles minuciosos de una toma hasta que sea perfecta. Se necesitan modelos más sólidos”, añadió.

See also  Según se informa, Apple, Anthropic y otras empresas de inteligencia artificial han entrenado modelos de inteligencia artificial en miles de videos de YouTube.

Para solucionar este problema, la empresa utiliza múltiples modelos de IA que generan una única capa de vídeo compuesto. Según Cameron, cuatro modelos generan de forma independiente geometría, materiales, iluminación y movimiento. Estas cuatro capas se generarán simultáneamente en función de un único mensaje de texto y luego se combinarán para ofrecer el vídeo final.

La compañía afirma que los usuarios tendrán la opción de configurar cada capa individualmente para tener un mayor control sobre la salida. Odyssey también integrará su producción de vídeo en las herramientas y sistemas existentes de Hollywood utilizados para generar efectos visuales.

Actualmente, el modelo de vídeo impulsado por IA aún se encuentra en una etapa inicial de desarrollo. No hay fecha de lanzamiento para el modelo de inteligencia artificial. Sin embargo, la compañía ha confirmado que seguirá compartiendo actualizaciones periódicas sobre su progreso. En particular, Cameron trabajó anteriormente en Cruise y Voyage, dos nuevas empresas que trabajan en el campo de los vehículos autónomos.

Jeff Hawk, el otro cofundador y director de tecnología de la empresa, trabajó anteriormente como vicepresidente de tecnología en Wayve, una empresa de inteligencia artificial que desarrolla sistemas de conducción autónoma.


Los enlaces de afiliados pueden generarse automáticamente; consulte Declaración de ética Para detalles.





Source Article Link

Leave a Comment