líderes en noticias de marketing, publicidad y marcas

Por qué la inteligencia artificial zafa a la inteligencia artificial de los límites

El "boom" de DALL-E 2 y Midjourney o cómo derribar los límites de la creatividad

Esther Lastra

Escrito por Esther Lastra

La inteligencia artificial está abocada a tener un rol protagonista en el futuro en la industria creativa porque expande la creatividad humana.

En los últimos meses la industria creativa ha descubierto herramientas de inteligencia artificial (IA) generativa como DALL-E 2, Midjourney o Stable Diffusion y ha podido constatar de primera mano el asombroso potencial alojado en las entrañas de las redes neuronales artificiales. Da igual si hablamos de fotografías, ilustraciones, logos o iconos, la creatividad nacida del vientre de la IA es tan asombrosamente buena que casi cualquiera puede alcanzar («ipso facto» y sin apenas esfuerzo) el estatus de artista, ilustrador o diseñador gráfico.

Sin embargo, la inteligencia artificial generativa es también deudora de una fuerte polarización. Para algunos programas como Midjourney son perversos porque han sido entrenados previamente con ingentes cantidades de datos puestos sobre la mesa por diseñadores, fotógrafos y artistas (por lo que no son en modo alguno ajenos al plagio). Además, estas herramientas (todavía rudimentarias) no son aún suficientemente flexibles a ojos de muchos. Así y todo, otros muchos están convencidos de que la IA está sentando los cimientos de una nueva era en la industria de la creatividad.

Al fin y al cabo, programas como DALL-E 2 y Midjourney podría trocarse en absolutamente indispensables en este ramo de actividad, en particular en las fases más primigenias de los proyectos creativos, enfatiza Michael Katzlberger en un artículo para Horizont.

La industria creativa tiene mucho que ganar con la IA a su vera

Ideas, bocetos y «storyboards» pueden de repente ser alumbrados a la velocidad de la luz y ser fácilmente implementados en presentaciones, campañas y «pitches». Estamos, por lo tanto, ante una ventaja competitiva de primerísimo orden para la industria creativa.

«Stable Diffusion» (SD), la tecnología que está parapetada tras herramientas como DALL-E y Midjourney debutó por primera vez en el mercado en 2022. Y comparada con GAN (Red Generativa Antagónica), SD es una tecnología mucho más democrática y perfectamente accesible a través de un modelo «open source».

SD es un modelo de «deep learning» que se usa primordialmente para generar imágenes basadas en descripciones textuales. Sin embargo, esta tecnología puede emplearse también técnicas como el «inpainting» (restaurar partes destruidas o perdidas de una imagen) o el «outpainting» (continuar imágenes más allá de sus límites originales).

Conviene hacer notar, eso sí, que las imágenes alumbradas por la inteligencia artificiales que tienen de verdad la vitola de excelentes son solo posible mediante textos muy depurados que requieren mucho tiempo y paciencia. Quizás por ello uno de los trabajos más demandados en los años venideros en la industria creativa podría ser el de «prompt designer». Al fin y cabo, cuanto más detalladas sean las descripciones de texto con que se alimenta a DALL-E y compañía, mejores y más excitantes serán los resultados. Esto es una buena noticia para quienes de desenvuelven en la industria de la creatividad y se ufanan de contar con un vocabulario muy amplio y también para quienes tienen conocimientos avanzados en el ámbito de la fotografía y el vídeo (para así dar pistas a la IA sobre la lente y la iluminación más adecuada a la hora de alumbrar imágenes, por ejemplo).

Pese a que los programas que se apoyan en el modelo SD dan cuenta de fenomenales «superpoderes», bregan también con problemas similares a los se enfrenta la más veterana tecnología GAN. Estos programas pecan, por ejemplo, muy a menudo de engendrar imágenes de muy baja resolución. Y a veces resulta igualmente complicado describir de manera realista las extremidades de los seres humanos y otros seres vivos, razón por la cual por la que en DALL-E 2 y compañía abundan las imágenes de personas con más de diez dedos, dos lenguas y hasta cuatro hileras de dientes.

En el futuro la IA podría hacer palidecer a otras invenciones nacidas de la mano del hombre

La generación de imágenes es, de todos modos, solo una las posibilidades de los modelos SD, que con las descripciones textuales pertinentes pueden emplearse asimismo para la generación de vídeos y modelos 3D.

Además, en 2023 podría salir del cascarón la inteligencia artificial más avanzada hasta la fecha de OpenAI: GPT-4. Esta IA estará pertrechada de habilidades multimodales, por lo que tendrá la capacidad no solo de escribir textos sino también de generar imágenes y componer música.

La creación de imágenes mediante las descripciones textuales es meramente una pieza en puzle para completar la búsqueda del Santo Grial, la denominada inteligencia artificial fuerte o IAG, que podría trocándose en una realidad en el transcurso de las próximas décadas y zafar a la IA de los silos en los que actualmente está anclada.

Esta tecnología amalgamaría los progresos efectuados por la inteligencia artificial en el transcurso de las últimas décadas y eclipsaría inevitablemente a otros inventos humanos. Por primera vez en la historia de la humanidad los «role models» de los niños podrían ser inteligencias artificiales y no sus padres o sus profesores.

Aunque está a menudo revestida de una pátina sumamente inquietante, la inteligencia artificial está abocada a tener un rol protagonista en el futuro de la industria creativa porque libera a los humanos de sus ataduras en el plano genético y expande la creatividad dinamitando todos los límites, concluye Katzlberger.

 

La publicidad programática o cómo impulsar la visibilidad de las marcas en el medio exteriorAnteriorSigueinteTwitter quiere exterminar las apps de terceros (y las ha "desenchufado" ya de sus sistemas)

Contenido patrocinado