Diff-SVC: el programa que intercambia la voz de les artistas

 A finales del año pasado la inteligencia artificial aumentó su popularidad con programas que permitían escribir textos con solo pedírselo. Como es el afamado ChatGPT, el cual repercutió su utilización con pros y contras en Universidades de todo el mundo. Hoy los usuarios de estas plataformas van encontrando distintas finales. Y estas nuevas tecnologías no solo permiten editar información, videos o imágenes. Sino que programas como el Diff-SVC, que sus siglas en español significan “Conversión de la voz cantada mediante un modelo de difusión” hacen lo inimaginable. Cómo tomar la voz de un artista, digitalizarla y transformarla en la voz de otra estrella de la música.


La última semana fue una revolución la llegada de distintos covers de cantantes interpretando éxitos de otros. Así los fanáticos colmaron Tik Tok y Youtube con versiones alternativas de canciones exitosas cantadas por sus artistas favoritos. No es difícil encontrar a Ariana Grande cantando una balada de Billie Ellish, Lady Gaga a Dua Lipa o Mariah Carey interpretando a Janet Jackson. Posteos que en menos de una semana lograron millones de reproducciones. Ya que el procedimiento en tan solo quince días se extendió como pólvora entre los usuarios de todas las edades tratando de transformar sus canciones preferidas en la voz de otras celebridades musicales. Sin embargo, a pesar de sonar bastante realista, se trata solo de una simulación de la voz del artista. 

El resultado hasta ahora es una buena imitación por parte de la inteligencia artificial, que parece no tener límites. Muchos usuarios incrédulos pensaron que eran demos o hasta versiones verdaderas lo que estaban escuchando. Y no se puede negar que a veces estos covers de canciones salen muy bien, pero no siempre resultan certeros en su totalidad. Lo que si en su mayoría, se aprecia cierta carencia de emociones en las interpretaciones.

¿Qué es realmente el Diff-SVC?
En los últimos años fue una novedad que ciertos programas como el “Vocal Remover”,  permitieran al usuario obtener canciones instrumentales o karaokes. Y también separar la voz del artista en otro canal para lograr una versión accapella de un éxito popular. Pero esta vez la tecnología va más allá, Diff-SVC es un software que permite que una inteligencia artificial separe la voz de un artista de la pista musical de una canción o meramente de un breve extracto de una pista musical.

Digitalizarla para lograr copiar su tono y modulación, y así crear un modelo propio de esa voz. Lo cual luego el programa lo utiliza para reemplazar la voz sobre otra canción. Es una tecnología informática avanzada que realmente no fue creada para eso. Sino meramente para digitalizar la voz del usuario de una plataforma para un uso propio no comercial. 

Pero muchos de estos rápidamente descubrieron nuevos usos, lo que ha creado problemas éticos. Ya que crearon modelos de voces de variados artistas, y una vez perfeccionada la técnica le pueden pedir que hable o cante absolutamente cualquier cosa.

Esto ha logrado que hasta los propios creadores de origen chino, frente a la masividad de su uso en las redes, hayan caído en el anonimato. Pero sin antes anunciar la semana pasada: «Por favor, no armen modelos de voz de famosos sin su permiso. Esta tecnología está en pañales y si se hace un mal uso de ella se retirará. El software (DiffSVC) ya ha sido retirado de Internet varias veces en los últimos meses por problemas de legalidad. 

Y sostienen que la conversión de la voz cantada (SVC), es lo que se logra con este programa.  Es una técnica prometedora que puede enriquecer la forma de interacción persona-computadora al dotar a una computadora de la capacidad de producir una voz cantada de alta fidelidad y expresividad.

Una nueva batalla, la AI contra la ética musical
De esta manera, a través de este programa informático, los fanáticos han encontrado millones de posibilidades y alternativas de crear versiones soñadas hasta ahora de sus canciones favoritas de cualquier cantante. Pero también ha logrado que entre en debate la ética y la propiedad intelectual. Así como también la penalización en varias redes, con la consecuencia de la suspensión de perfiles de usuarios que han elevado estas versiones ilegales, a los ojos de las compañías discográficas y sus artistas. 

Evidentemente, la Inteligencia Artificial no es perfecta y por ahora no es capaz de recrear con certera la calidad y emoción de una voz humana. Pero no deja de ser una experiencia divertida si se la usa con moderación, por igual prometedora ya que demuestra lo mucho que avanza hoy en día la tecnología. 


Reconstrucción vocal de Charly García de principios de los 80s mediante Inteligencia Artificial. 


SELECCIÓN POR CATEGORÍAS

Entradas populares de este blog

Resumen MasterClass ¿Cómo hacer una canción?

Tritono (La nota del Diablo)

Claves del Pentagrama