líderes en noticias de marketing, publicidad y marcas

Así es Voice Engine, la herramienta para clonar voces de OpenAI

OpenAI crea una IA que clona tu voz en apenas 15 segundos (pero la guarda bajo llave por los riesgos que entraña)

Esther Lastra

Escrito por Esther Lastra

Pese a los portentos alojados en las entrañas de Voice Engine, la nueva herramienta para clonar voces de OpenAI, la compañía ha preferido no lanzarla al público general por los riesgos que entraña.

OpenAI ha presentado en sociedad una nueva herramienta de IA, Voice Engine, que se ufana de clonar de manera increíblemente realista la voz de cualquier persona partiendo de una muestra de audio de apenas 15 segundos de duración. Sin embargo, y pese a lo asombrosa que resulta la herramienta de marras, la matriz de ChatGPT ha preferido guardarla bajo llave y no ponerla a disposición del público general por los enormes riesgos que entraña, máxime cuando estamos a las puertas de citas con las urnas absolutamente decisivas en todo el mundo.

Voice Engine comenzó a desarrollarse en realidad a finales de 2022 y una versión inicial de esta herramienta se empleó, de hecho, en ChatGPT, la aplicación de cabecera de OpenAI. Sin embargo, se trata de una herramienta que jamás ha estado a disposición del público general, en buena medida debido el «enfoque cauto e informado» por el que está apostando la empresa liderada por Sam Altman a la hora de emprender un lanzamiento más amplio de la app.

«Esperamos iniciar un diálogo sobre el desarrollo responsable de las voces sintéticas y sobre la forma que la sociedad puede adaptarse a estos nuevos avances», explica OpenAI en un post en su blog corporativo. «Basándonos en esas conversaciones y en los resultados de tests a pequeña escala, tomaremos decisiones más informada acerca de la manera de desplegar esta tecnología a más gran escala», añade la startup estadounidense.

En el post publicado en su blog corporativo OpenAI comparte varios ejemplos reales de uso de partners que han tenido ya acceso a Voice Engine y han podido integrar esta tecnología en sus aplicaciones y en sus productos.

La empresa especializada en tecnología enfocada a la educación Age of Learning utiliza, por ejemplo, Voice Engine para generar locuciones guionizadas, mientras que HeyGen, una aplicación con el foco puesto en el «storytelling», hace uso del software de OpenAI para generar traducciones de contenido previamente grabado de tal forma que se conserve el acento y la voz del locutor original.

OpenAI ha preferido no efectuar un lanzamiento masivo de la herramienta Voice Engine

Por su parte, un equipo de investigación del Instituto de Neurociencias Norman Prince en Rhode Island empleó un fragmento de audio de 15 segundos de duración de una joven (que era notablemente huérfano de calidad) para restaurar la voz de la protagonista, que esta había perdido debido a un tumor cerebral.

«Hemos elegido no efectuar por ahora un lanzamiento masivo de esta tecnología reforzar la resiliencia de la sociedad contra los retos planteados por modelos de inteligencia artificial generativa cuyos resultados son cada vez más convincentes», argumenta OpenAI. «Y alentamos que se tomen medidas como la retirada progresiva de métodos de autentificación basados en la voz para acceder a cuentas bancarias y otras fuentes que alberguen información potencialmente sensible», asevera la compañía.

OpenAI exhorta además a la exploración de «políticas dirigidas específicamente a proteger el uso de voces individuales en la IA» y a la «educación del público general en la adecuada comprensión de las capacidades y las limitaciones de la IA, incluyendo la posibilidad de generar contenido engañoso con esta tecnología».

El contenido generado por Voice Engine está provisto en todo caso de marcas de agua, lo cual permite rastrear el origen de cualquier audio de generado de manera artificial, enfatiza OpenAI. «Nuestros términos de uso con los ‘partners’ que ya tienen acceso a Voice Engine requieren el consentimiento explícito e informado del locutor original y no permitimos a los desarrolladores con los que colaboramos que se apoyen en voces de usuarios individuales para crear voces de manera artificial», señala OpenAI.

Aun cuando OpenAI ha preferido no poner Voice Engine a disposición de todo el mundo, las herramientas de generación de voz de empresas como ElevenLabs sí son, en cambio, de libre acceso para todo el mundo. Con todo, ElevenLabs se ha provisto de salvaguardias para evitar la creación de voces que imiten a candidatos involucrados activamente en procesos electorales.

Newsletter ¡Suscríbete a nuestra newsletter! WhatsApp Sigue a MarketingDirecto.com en WhatsApp

 

Amazon Prime Video destituye a Koro Castellano, directora la plataforma en EspañaAnteriorSigueinteErnest refuerza su equipo anunciando nuevas incorporaciones

Contenido patrocinado