Dentro de la revolución de la inteligencia artificial en marcha, no se podía prescindir de una inteligencia artificial para hacer música. Meta, la compañía dueña de Facebook e Instagram, cree haber dado un paso importante en esta nueva carrera por crear las apps dominantes en la creación de video, imagen, texto y sonido con inteligencia artificial.
La nueva app "MusicGen" de Meta pretende facilitar la producción de música con el uso de prompts. o indicaciones simples, de una manera similar a como ChatGPT y otros modelos de lenguaje de IA generan texto.
MusicGen utiliza un tokenizador de audio EnCodec basado en un modelo de lenguaje transformador. Este tokenizador es capaz de tomar una secuencia de música y modificarla, generando, por ejemplo, una canción pop de los '80 a partir de un clásico estribillo musical. Otros ejemplos dados son una "partitura de Hans Zimmer para una película medieval de steampunk", (aunque no queda muy claro si MusicGen tiene una comprensión musical muy vasta).
Felix Kreuk, ingeniero de investigación de IA en Meta, mostró en Twitter que el bot musical puede crear una "interpretación sinfónica del tema de cumpleaños feliz" hasta una "pista de hip hop Lo-fi con muestras de la naturaleza".
Por ahora, el modelo no incluye letras en las canciones generadas. Los usuarios pueden probar MusicGen a través de la API de Hugging Face, pero generar música puede llevar algún tiempo, dependiendo de cuántos usuarios estén utilizando la plataforma al mismo tiempo. También es posible descargar el código y ejecutarlo de manera autónoma si se tienen las capacidades técnicas y el equipo necesario para soportarlo.
Sin embargo, esta innovación no está exenta de desafíos y críticas. Aunque la IA es capaz de imitar los estilos de ciertos compositores, su capacidad para comprender y replicar realmente los temas de los compositores sigue siendo un punto de debate.
Además, al igual que ha ocurrido con MidJourney o Stable Diffusion, hay un espinoso tema de los derechos de autor, ya que al fin de cuentas estas inteligencias artificiales se entrenan con la creatividad humana.
Según el documento de investigación de Meta, MusicGen fue entrenado en 20,000 horas de música con licencia de un conjunto de datos interno que incluye 10,000 pistas de música. La compañía también utilizó alrededor de 390,000 pistas solo de instrumentos destacados en Shutterstock y Pond5. Esto ha provocado preocupaciones entre los artistas sobre cómo se está utilizando su trabajo para entrenar a la IA.
A fin de cuentas, el éxito de MusicGen dependerá de que sea capaz de generar música relativamente buena o al menos divertida sin mucha dificultad. Y si no lo logra seguramente habrá otra aplicación que sí lo haga prontamente.