Google Introduces MusicLM: AI Model Generates High-Fidelity Music from Text

Google ha desarrollado MusicLM, un modelo de inteligencia artificial que genera música a partir de texto. Fue entrenado con 280.000 horas de música y crea música a 24 kHz.

El modelo crea piezas de 5 minutos a partir de texto simple o piezas de 30 segundos a partir de descripciones más detalladas, e incluso puede crear una historia musical basada en melodías existentes.

La música generada por IA tiene una larga historia, que incluye la escritura de canciones exitosas y la mejora de presentaciones en vivo.

A diferencia del aprendizaje automático de texto a imagen, donde se afirma que grandes conjuntos de datos han contribuido significativamente a los avances recientes, existen obstáculos para la música con IA relacionados con la ausencia de datos de audio y texto acoplados.

Por ejemplo, Stable Diffusion y la herramienta DALL-E de OpenAI han despertado un gran interés por parte del público en general.

Además, el hecho de que la música esté estructurada en una dimensión temporal presenta otra dificultad en la generación de música con IA.

En consecuencia, en comparación con el uso de una descripción para una imagen fija, es mucho más difícil transmitir la intención de una pista musical utilizando un texto simple.

Google está siendo cauteloso con MusicLM, al igual que con esfuerzos anteriores de IA, y no tiene planes de lanzar el modelo.

Other