QR Nueva Economía

La clonación de voz ya es posible y tiene su lugar en la industria del entretenimiento

Los avances son enormes y cada día miles de especialistas trabajan para perfeccionar sus técnicas.

14 Julio de 2022

Sonantic
Sonantic — QR Nueva Economía.

Es cierto que en los últimos años hemos visto múltiples avances en la inteligencia artificial (IA) y sus aplicaciones, sin embargo, esta tecnología no nos deja de sorprender. A través de esta disciplina, ahora también se puede clonar la voz de una persona. Es difícil analizar el impacto de la IA en la sociedad. Pero cabe destacar que no se trata de una mala tecnología, sino del uso que le damos. 

Sonantic es una startup que trabaja en el desarrollo de voces con IA, haciendo que una voz de un sistema suene muy realista y generando la emoción cautivadora que produce escuchar la voz de otro ser humano querido.

Se trata de una startup fundada en 2018 por John Flynn y Zeena Qureshi. Su inspiración viene de los CGI (Imágenes Generadas por Computadoras) del cine y promete revolucionar el campo de la tecnología.

Sonantic
Sonantic

 

 "Lo que el CGI ha hecho por el aspecto visual es lo que la tecnología de Sonantic está haciendo por el audio", comenta Qureshi.


Esta IA es capaz de generar voces que suenan humanas y puede ser empleada en la industria del cine o de los videojuegos sin que el oyente detecte su origen artificial. Hasta ahora lo que conocíamos de voces artificiales eran los asistentes virtuales de nuestros smartphones como puede ser Siri en el caso de Apple o Alexa, la voz de Amazon.

Sin embargo, Sonantic está logrando que esta tecnología sea capaz de expresar un abanico de emociones y rasgos de la voz humana. En este video se puede ver como ejemplo una voz generada con inteligencia artificial sobre la imagen de una actriz. Se aprecia una voz sensual con las pausas entre palabras, suspiros y risas, propio de una voz humana.

 


"Escogimos el amor como tema, pero el objetivo de nuestra investigación es ver si podemos modelar emociones sutiles. Las emociones más obvias son algo más fácil de capturar", expresa Flynn, fundador de Sonantic. 

 

Esta tecnología genera la voz artificial a partir de modelos de voces humanas reales que procesa. El software que utiliza permite introducir los diálogos que se quieren reproducir con la voz de la inteligencia artificial, especificando aspectos como el estado de ánimo, la manera de decirlo, emociones como felicidad, alegría, ira, miedo y tristeza; y rasgos y actitudes como bromear, jactarse, coquetear o timidez.

Si bien actualmente esta tecnología se centra en la industria del entretenimiento, la empresa considera que el mercado de la voz de IA es enorme y sus usos pueden llegar a la publicidad, asistencia al público y audiolibros, por ejemplo.

 

Clonación de voz en el cine

El caso más reciente que se conoció de clonación de voz con inteligencia artificial fue el del actor Val Kilmer para la película Top Gun Maverick. Kilmer padeció un cáncer de garganta que lo dejó con dificultades en la voz, pero la inteligencia artificial le ofreció una solución para volver a la pantalla grande.

Val Kilmer y Tom Cruise en Top Gun (1986)
Val Kilmer y Tom Cruise en Top Gun (1986)

 

Sonantic utilizó su inteligencia artificial para recrear la voz de Kilmer basándose en grabaciones del actor antes de su enfermedad. El sistema puede leer cualquier línea de texto con las sutilezas en la expresión y el tono que habría usado el actor.

“Creemos que el uso de la tecnología para aumentar las voces de los actores será la nueva normalidad dentro de 5 años. Para los estudios, el software ofrece infinitas posibilidades para los creadores, además de ser más económico y rápido. Para los actores, el software ofrece ingresos pasivos, protección de voz y múltiples oportunidades. Para nosotros es importante que ambas partes se beneficien de esta revolución en la tecnología de audio”, expresó Qureshi.