Odisea, inteligencia artificial OpenAI, una startup fundada el año pasado, anunció el lunes los detalles de su primer producto de IA. La compañía reveló que está construyendo un modelo de video de IA que puede crear efectos visuales al nivel de Hollywood, al igual que la herramienta Sora de OpenAI que la compañía aún no ha lanzado. El cofundador de Odyssey dice que el modelo de IA permitirá a los usuarios editar y controlar la salida a un nivel granular, y agrega que la compañía está trabajando con múltiples modelos de lenguaje grandes (LLM) para crear diferentes capas del video resultante, que pueden controlarse por separado.
Cómo funciona el modelo visual de IA de Odyssey
En una serie de publicaciones en It, se entregarán videos de alta calidad que los usuarios pueden personalizar y editar.
Cameron también compartió detalles sobre la tecnología de inteligencia artificial de Odyssey y afirmó que fue diseñada para generar videos con “calidad de Hollywood”. El CEO también dijo que la startup estaba entrenando cuatro modelos generativos para que los usuarios tomaran “el control total de las capas subyacentes de la narrativa visual”.
Individualmente, cada modelo le permitirá configurar con precisión los finos detalles de su escena.
Cuando se combinan, estas plantillas producirán vídeos o escenas, pero exactamente como usted desee.
Además, los resultados de nuestro modelo se integran con los oleoductos existentes utilizados en Hollywood y más allá. pic.twitter.com/jHZoevLV9n
-Oliver Cameron (@olivercameron) 8 de julio de 2024
Cameron destacó un problema con los modelos actuales de IA para convertir texto en video, que es la falta de herramientas u opciones para controlar o editar la salida. “Como narrador, tienes poca capacidad para dirigir tu entorno o tus personajes, o repetir los detalles minuciosos de una toma hasta que sea perfecta. Se necesitan modelos más sólidos”, añadió.
Para solucionar este problema, la empresa utiliza múltiples modelos de IA que generan una única capa de vídeo compuesto. Según Cameron, cuatro modelos generan de forma independiente geometría, materiales, iluminación y movimiento. Estas cuatro capas se generarán simultáneamente en función de un único mensaje de texto y luego se combinarán para ofrecer el vídeo final.
La compañía afirma que los usuarios tendrán la opción de configurar cada capa individualmente para tener un mayor control sobre la salida. Odyssey también integrará su producción de vídeo en las herramientas y sistemas existentes de Hollywood utilizados para generar efectos visuales.
Actualmente, el modelo de vídeo impulsado por IA aún se encuentra en una etapa inicial de desarrollo. No hay fecha de lanzamiento para el modelo de inteligencia artificial. Sin embargo, la compañía ha confirmado que seguirá compartiendo actualizaciones periódicas sobre su progreso. En particular, Cameron trabajó anteriormente en Cruise y Voyage, dos nuevas empresas que trabajan en el campo de los vehículos autónomos.
Jeff Hawk, el otro cofundador y director de tecnología de la empresa, trabajó anteriormente como vicepresidente de tecnología en Wayve, una empresa de inteligencia artificial que desarrolla sistemas de conducción autónoma.