- Los investigadores han desarrollado un nuevo generador de vídeo impulsado por IA
- El generador crea varias etapas de baja resolución antes de generar una final de alta resolución.
- El generador de IA ahora es completamente de código abierto para uso individual y comercial.
Un equipo de investigadores de la Universidad de Pekín, Kuaishu Technology Corporation y la Universidad de Correos y Telecomunicaciones de Beijing han logrado grandes avances en el campo de la generación de vídeos con inteligencia artificial.
Han desarrollado algo nuevo. Amnistía Internacional El modelo Pyramid Flow es capaz de generar imágenes de vídeo virtuales de alta resolución con una resolución de 768p.
A diferencia de muchos modelos patentados de IA desarrollados en los últimos años, los creadores de Pyramid Flow hicieron que su modelo fuera de código abierto, brindando a los desarrolladores y usuarios acceso gratuito a la tecnología subyacente.
¿Un gran avance en la generación de videos con IA?
El modelo Pyramid Flow adopta un enfoque diferente al de muchos de sus predecesores al crear videos en múltiples etapas de baja resolución antes de producir una salida final de alta resolución.
Este método reduce la potencia informática necesaria para ejecutar el modelo, lo que lo hace más rentable para los usuarios. El equipo afirma que el modelo puede producir un vídeo de cinco segundos con una resolución de 384p en sólo 56 segundos.
Flujo piramidal también está disponible Software de código abierto Los desarrolladores hacen que el modelo sea de libre acceso bajo la licencia MIT, lo que significa que cualquiera puede descargar, modificar y usar el código para fines personales o comerciales.
Además del modelo en sí, los investigadores publicaron varios vídeos de muestra que demuestran la calidad de la producción de Pyramid Flow. Los resultados muestran imágenes muy detalladas y realistas, incluidos ejemplos como explosiones submarinas que crean burbujas y salpicaduras de agua. Además, los conjuntos de datos utilizados para entrenar Pyramid Flow, que constan de aproximadamente 10 millones de vídeos cortos, también están disponibles públicamente.
El uso de conjuntos de datos de código abierto en la creación de vídeos con IA ha sido un tema controvertido, y algunos críticos afirman que tales prácticas violan los derechos de los titulares de derechos de autor.
El equipo de investigación detrás de Pyramid Flow no ha abordado estas preocupaciones específicamente, pero sugiere que el modelo podría ser una herramienta útil para ajustar los materiales de código abierto, lo que podría reducir la necesidad de depender de fuentes externas.
a través de Explorar tecnología