Empresa
Tecnología
IA generativa

Sora, la inteligencia artificial de OpenAI para la creación de vídeos realistas

La nueva herramienta de IA generativa lanzada por la compañía que capitanea Sam Altman puede crear escenas realistas e imaginativas a partir de instrucciones de texto. ¿Desbancará a ChatGPT?

Vídeo Sora
Extracto de un vídeo generado por Sora, el nuevo modelo de OpenAI.

La compañía detrás del popular ChatGPT, OpenAI, continúa pisando el acelerador en la carrera por la inteligencia artificial (IA) generativa. Y es que la organización que capitanea Sam Altman ha lanzado Sora, un nuevo modelo de IA generativa capaz de crear escenas realistas e imaginativas a partir de instrucciones de texto. “Estamos enseñando a la IA a comprender y simular el mundo físico en movimiento con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieren interacción con el mundo real”, aseguran desde la compañía. Y a la luz de los resultados, meta conseguida.

Fue el director ejecutivo de la firma, Altman, el encargado de presentar en sociedad a través de X la última innovación de la compañía: un nuevo modelo de texto a vídeo. En este sentido cabe destacar que Sora puede generar videos de hasta un minuto de duración manteniendo la calidad visual y el cumplimiento de las indicaciones del usuario. Además, cómo no, de alargar vídeos ya existentes cumpliendo con las características.

Por el momento Sora no está disponible para el público general, solo para un reducido grupo de "artistas visuales, diseñadores y cineastas para obtener comentarios sobre cómo hacer avanzar el modelo para que sea más útil para los profesionales creativos". También tiene acceso al modelo el ‘equipo rojo’ de OpenAI para evaluar áreas críticas en busca de daños o riesgos. “Estamos compartiendo el progreso de nuestra investigación desde el principio para brindarle al público una idea de las capacidades de IA que hay en el horizonte”.

 

Así avanza el modelo: capacidades y debilidades

A pesar de que Sora acaba de dar los primeros pasos de su más tierna infancia, sus capacidades son sorprendentes. Ya es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo. El modelo comprende no sólo lo que el usuario ha pedido en el mensaje, sino también cómo existen esas cosas en el mundo físico. Para lograrlo, el modelo cuenta con un profundo conocimiento del lenguaje, lo que le permite interpretar indicaciones con precisión y generar personajes convincentes que expresan emociones vibrantes. Sora también puede crear múltiples tomas dentro de un solo video generado donde persisten con precisión los personajes y el estilo adoptado.

Sin embargo, el modelo también presenta debilidades. “Es posible que tenga dificultades para simular con precisión la física de una escena compleja y es posible que no comprenda casos específicos de causa y efecto”. Por ejemplo, una persona puede darle un mordisco a una galleta, pero después, es posible que la galleta no tenga la marca del mordisco. “El modelo también puede confundir los detalles espaciales de un mensaje, por ejemplo, mezclando izquierda y derecha, y puede tener dificultades con descripciones precisas de eventos que tienen lugar a lo largo del tiempo, como seguir una trayectoria de cámara específica.

 

Seguridad, el gran reto

En lo relativo a la seguridad, la compañía ha avanzado que tomarán “varias medidas importantes” antes de que Sora esté disponible en los productos de OpenAI. “Estamos trabajando con los miembros del 'equipo rojo' (expertos en áreas como desinformación, contenido que incita al odio y prejuicios) que probarán el modelo de manera adversa”. Asimismo, están creando herramientas para ayudar a detectar contenido engañoso, como un clasificador de detección que puede indicar cuándo Sora generó un video. 

“Además de desarrollar nuevas técnicas para prepararnos para el despliegue, estamos aprovechando los métodos de seguridad existentes que creamos para nuestros productos que utilizan DALL·E 3, que también son aplicables a Sora”. Por último, aseguran que involucrarán a formuladores de políticas, educadores y artistas de todo el mundo para comprender sus preocupaciones e identificar casos de uso positivos para esta nueva tecnología. 



Contenido Patrocinado

Forma parte de nuestra comunidad

 

¿Te interesan nuestras conferencias?

 

 
Cobertura de nuestros encuentros
 
 
 
 
Lee aquí nuestra revista de canal

DealerWorld Digital