líderes en noticias de marketing, publicidad y marcas

Lo que supone la irrupción de Sora para el marketing y la publicidad

El tsunami marketero que provoca la erupción de Sora, el nuevo y volcánico prodigio de OpenAI

Esther Lastra

Escrito por Esther Lastra Actualizado el

La industria del marketing y la publicidad hallará una amplísima miríada de aplicaciones prácticas en Sora (incluso en su versión más primigenia).

Desde hace algunos días la red de redes anda afanada diseccionado el nuevo y revolucionario prodigio nacido de las entrañas de OpenAI: la herramienta de IA para generar vídeos a partir de «prompts» Sora.

El nuevo invento de la matriz de ChatGPT es un modelo de IA capaz de alumbrar vídeos de hasta un minuto de duración sin partir de ninguna imagen de base y utilizando única y exclusivamente «prompts» de texto.

Para dar cuenta de las fenomenales virtudes de Sora, Sam Altman, CEO de OpenAI, tomó el pasado jueves un puñado de sugerencias de los usuarios en X (antes Twitter) y no tardó en metamorfosearlas con asombrosa celeridad en vídeos tan realistas como pródigos en detalles. Al bueno de Sam Altman le llevó, eso sí, al menos 20 minutos transformar en vídeos los «prompts» sugeridos por los usuarios de X.

Conviene, no obstante, tener en consideración que Sora es un modelo de IA en fase experimental y que la velocidad de la que da cuenta ahora no será necesariamente la misma de la que haga gala en el futuro, cuando a esté a disposición del público general.

Sora es un sistema capaz de simular aspectos del mundo físico en movimiento gracias a su arquitectura, que amalgama la tecnología de difusión con un motor basado en transformadores.

A la hora de generar imágenes en movimiento, Sora se aprovisiona de vídeos en su resolución original y a continuación los divide en pequeñas secciones o parches visuales. Para lograr este proceso los vídeos se simplifican en el denominado espacio latente, donde los clips empleados por Sora como materia prima se comprimen tanto temporal como espacialmente.

Y es precisamente en ese espacio latente donde Sora se entrena para generar imágenes en movimiento. La herramienta de OpenAI examina, por ejemplo, en ese espacio latente la correcta apariencia de una gota de agua sobre el suelo en una secuencia y a continuación utiliza diferentes secuencias espaciotemporales para representar correctamente la lluvia en ese espacio latente. «Entrenamos una red que reduce la dimensionalidad de los datos visuales. Esta red toma video sin procesar como entrada y genera una representación latente que se comprime tanto temporal como espacialmente. Sora se entrena y posteriormente genera videos dentro de este espacio comprimido. Entrenamos un modelo decodificador correspondiente que asigna las latentes generadas al espacio de píxeles», asevera OpenAI.

Diseccionando el funcionamiento de Sora

«Al unificar la forma en que representamos los datos, entrenamos a los transformadores de difusión con una gama de datos visuales más amplia de lo que era posible antes, abarcando diferentes duraciones, resoluciones y relaciones de aspecto», subraya OpenAI.

La división de los vídeos en secciones más pequeñas (o parches espaciotemporales) se traduce en la creación de una retícula tridimensional que se llena progresivamente con datos visuales comprimidos.

Un modelo asociado de decodificación vincula a continuación los parches espaciotemporales (que no son sino pequeñas unidades que agrupan información) a datos de píxeles, que son los que se utilizan en último término para generar vídeos de apariencia realista.

El modelo de difusión en el que echa anclas Sora se nutre de parches con ruido (fragmentos de imagen en bruto) y se entrena para predecir cómo serán esos parches emancipados de ningún tipo de ruido. «Sora es un modelo de difusión. Al recibir parches ruidosos de entrada e información condicionante como ‘prompts’ de texto está entrenado para predecir los ‘patches’ limpios originales», subraya OpenAI.

Como otros grandes modelos de lenguaje, Sora se apoya en una ingente cantidad de datos para entrenarse. Y los vídeos utilizados para ese entrenamiento son procesados con su resolución y su ratio originales. Ello permite que el modelo se aprovisione de «insights» del mundo físico y pueda remedar de manera increíblemente certera detalles presentes en personas, animales y todo tipo de entornos reales.

Cuanto más se profundiza en el entrenamiento de la herramienta de OpenAI, mejores resultados es capaz de poner sobre la mesa Sora. O lo que es lo mismo: aquello que es capaz de lograr Sora es en buena medida deudor de los progresos efectuados en su entrenamiento.

En este sentido, lo mostrado hasta ahora por OpenAI es solo la punta del iceberg de una herramienta que en el futuro podría generar películas completas con argumentos sólidos y coherentes y personajes principales específicos.

La industria del marketing y la publicidad tiene mucho que ganar con Sora (incluso en su versión más primigenia)

El séptimo arte deberá aguardar aún bastante tiempo para extraer todo su jugo a Sora, pero la industria del marketing y la publicidad hallará casi con toda seguridad múltiples aplicaciones prácticas ya a la primera versión de este modelo.

Al fin y al cabo, Sora puede no solo generar vídeos completamente nuevos sino también convertir en vídeos imágenes ya existentes o cambiar determinados aspectos en un clip previamente grabado.

Las marcas podrán utilizar, por ejemplo, fotografías de sus productos para alumbrar vídeos. Y una marca de bicicletas podría convertir fácilmente, si así lo deseara, una imagen estática de su producto en un vídeo que diera cuenta de su funcionamiento.

Sora tiene además capacidad de reemplazar con suma facilidad a los protagonistas en entornos específicos. En una de las «demos» de la herramienta un dron sobrevuela, por ejemplo, unas ruinas romanas y en la siguiente sección del vídeo ese dron se transforma en una mariposa revoloteando sobre el agua.

Llevando este ejemplo a un contexto de naturaleza marketera, un fabricante de equipamiento de buceo podría reemplazar fácilmente un pez en el agua por un buceador para mostrar sus productos en acción e ilustrar su funcionamiento.

A la hora de generar vídeos con IA, hay que tener en cuenta toda una plétora de consideraciones (los «deepfakes» y el correcto etiquetado de este material, por ejemplo), pero herramientas como Sora logran que la creación de vídeos de calidad sea accesible para empresas de toda clase y condición (al margen de sus recursos). Y ello se traduce también a la postre en la democratización de la publicidad en formato vídeo.

Newsletter ¡Suscríbete a nuestra newsletter! WhatsApp Sigue a MarketingDirecto.com en WhatsApp

 

Los 6 infalibles que necesitas para poner en marcha tu web en 2024AnteriorSigueinteMás allá del logo: el branding como palanca del mundo del marketing

Contenido patrocinado