líderes en noticias de marketing, publicidad y marcas

Qué es y cómo funciona Sora, la nueva inteligencia artificial de OpenAI

Inteligencia ArtificialFrame de un vídeo creado por Sora

Sora puede crear vídeos de calidad óptima a partir de texto

Qué es y cómo funciona Sora, la nueva inteligencia artificial de OpenAI

María Alhambra

Escrito por María Alhambra

¿Qué es Sora? Descubre cómo funciona la nueva inteligencia artificial de OpenAI. Una tecnología que puede crear vídeos a partir de texto.

OpenAI, la compañía especializada en inteligencia artificial anunciaba este mes el lanzamiento de Sora, su nuevo modelo de IA. Se trata de una herramienta prometedora que puede generar vídeos de altísima calidad a partir de indicaciones en texto. OpenAI ya revolucionó en 2022 el mercado de la IA al lanzar ChatGPT, seduciendo a figuras tan icónicas del sector tecnológico como Bill Gates.

A estas alturas, ChatGPT se ha consagrado como la IA más famosa del momento. Ahora, la empresa responsable del popular chatbot y DALL-E, anuncia una herramienta que promete revolucionar no solo el mercado de la IA, sino también la industria audiovisual.

Sora permitiría a sus usuarios la creación de vídeos de óptima calidad a partir de prompts. ¿Aún no sabes qué es un prompt? Pues bien, se trata de las indicaciones que los humanos brindan a la IA, en formato de texto, para obtener una respuesta acorde a sus intereses. En definitiva, los prompts se podrían definir como la forma en la que los humanos se comunican con la IA.

En las primeras demostraciones, Sora demuestra que puede crear secuencias dignas de estar en una película, dotando a los protagonistas del vídeo de emociones y expresiones totalmente reales. ¿Imaginas poder crear películas a partir prompts? El futuro de la inteligencia artificial promete ser sorprendente a la par que inquietante.

¿De qué es capaz Sora?

Sora es capaz de generar escenas complejas con varios personajes o figuras en movimiento, incluyendo datos precisos del sujeto y del escenario que le rodea. De manera que la IA comprende no solo lo que el usuario le pide, sino que entiende la existencia de esas cosas en el mundo. Por lo tanto, Sora tiene la capacidad de generar vídeos enteros de una sola vez o de ampliar los vídeos generados para hacerlos más largos.

Por lo tanto, Sora puede generar un vídeo partiendo únicamente de instrucciones en texto, pero también es capaz de crear un vídeo a partir de una imagen fija ya existente, prestando atención a los pequeños detalles.

El propio CEO de OpenAI, Sam Altman, quiso dar al público la oportunidad de probar Sora. Lo hizo a través de Twitter (X) pidiendo a sus seguidores que le respondieran con las indicaciones de aquello que quisieran que Sora crease. La demostración dio lugar a secuencias tan impresionantes como esta:

Gracias a su conocimiento del lenguaje, esta IA puede interpretar con precisión las indicaciones, generando figuras convincentes capaces de expresar emociones. Además, Sora también puede crear varias tomas dentro de un mismo vídeo generado, en el que perduren con precisión los personajes y el estilo visual.

¿Cómo es posible? OpenAI ha desvelado su funcionamiento a través del blog de la compañía. La herramienta utilizaría la técnica de recapitulación de DALL-E 3, que consiste en generar subtítulos muy descriptivos para los datos visuales de entrenamiento. Como resultado, el modelo es capaz de seguir más fielmente las instrucciones de texto del usuario en el vídeo generado. Tal y como explican desde la compañía, Sora utiliza una arquitectura de transformadores, igual que los modelos GPT, lo que le proporciona un rendimiento de escalado superior.

Sin embargo, Sora presenta limitaciones en cuanto a la duración de sus vídeos, ya que solo genera vídeos con una duración máxima de un minuto.

Sora, una IA «casi» perfecta

Pese a que las demostraciones de Sora que sus creadores han publicado en los últimos días han dejado a todo el mundo boquiabierto, todavía tienen que pulir algunos detalles. Los de OpenAI aseguran que su herramienta presenta algunas debilidades (casi insignificantes si tenemos en cuenta su enorme potencial). Por ejemplo, aún están en proceso de perfeccionar las interacciones complejas entre los objetos y las personas. Aprender sobre los efectos de la interacción de los humanos con los diferentes objetos sería uno de los aspectos a mejorar de Sora. Además, también puede confundir detalles determinantes como las indicaciones izquierda y derecha.

Sora IA
Frame de un vídeo creado por Sora

No obstante, sus creadores han confirmado que están enseñando a la IA a simular y a comprender el mundo físico en movimiento. Por lo tanto, y teniendo en cuenta las primeras demostraciones, parece que cada vez será más difícil diferenciar lo real de lo creado con IA. 

Al mismo tiempo, la compañía tecnológica trata de solventar otros asuntos relacionados con la seguridad de su uso. En ese sentido, un clasificador de texto comprobará y rechazará aquellas entradas de texto que soliciten violencia extrema, contenido sexual, imágenes que inciten al odio, o que incluyan imágenes de famosos o la propiedad intelectual de terceros.

¿Cuándo se podrá usar en España?

Por el momento, los de OpenAI no se han pronunciado sobre cuándo saldrá al mercado esta herramienta, ya que aún siguen trabajando en mejorarla

A día de hoy, Sora está a disposición de un equipo encargado de evaluar áreas críticas en busca de posibles fallos o riesgos. Asimismo, también han dado acceso a algunos artistas visuales y cineastas para obtener su feedback sobre este modelo, para hacerlo más útil a los creativos.

El objetivo de su reciente anuncio no es otro que preparar al público sobre lo que llegará próximamente en materia de inteligencia artificial. Con esta herramienta, OpenAI sigue avanzando hacia la inteligencia artificial general (AGI), la inquietante tecnología que superará al ser humano en conocimiento.

Alternativas a Sora

A finales de enero, Google presentó Lumiere, una herramienta que definieron como un modelo de difusión espacio-temporal para la generación de vídeo. Este generador de vídeos con inteligencia artificial prometía ser el más avanzado del mercado, hasta que apareció Sora. Sus vídeos tienen buena calidad y ofrecen múltiples opciones de creación, pero su duración está limitada a 5 segundos. La herramienta puede generar vídeos a partir de texto, pero también animar imágenes y alterar o completar vídeos ya existentes.

Newsletter ¡Suscríbete a nuestra newsletter! WhatsApp Sigue a MarketingDirecto.com en WhatsApp

 

El 36% de los usuarios de los servicios de vídeo en streaming pasa por caja para regatear la publicidadAnteriorSigueinteVML se convierte en la nueva agencia creativa de ALDI

Contenido patrocinado