Des chercheurs de Google ont créé un système d’intelligence artificielle capable de « créer » de la musique haute fidélité uniquement à partir d’indices textuels donnés par les utilisateurs.
L’outil d’IA de Google a utilisé 280 000 heures d’audio pour la formation. Le nouveau système appelé MusicLM utilise le générateur de musique AudioLM. Ce dernier est un outil de création musicale basé sur l’IA qui a fait du bruit en octobre.

Actualité mobile (sous-titrée) de notre partenaire de la semaine

Il fonctionne de la manière suivante : un utilisateur saisit la description de la musique sous forme de texte (1) ; ensuite, le système produit l’audio correspondant (2). Pour cela, le système doit connaître le type, la durée, le genre, etc. Outre ces détails, les utilisateurs peuvent également fournir plus d’informations avec MusicLM. Ce dernier peut également créer une musique qui « induit l’expérience d’être perdu dans l’espace ». Une autre tâche de l’outil pourrait être la création de musique basée sur une mélodie que l’utilisateur siffle ou fredonne.
Avantages MusicLM
Précisons également que MusicLM a quelques bugs. Par exemple, il peut créer une musique qui « reste cohérente pendant plusieurs minutes ». Mais le système d’IA reste le meilleur outil du créneau. Ainsi, si les utilisateurs fournissent plus de détails, le système créera une meilleure mélodie.
Le plus grand point fort de cet outil est une combinaison de plusieurs réseaux de neurones. Chacun d’eux peut contrôler une étape distincte dans le workflow de génération de musique. Au lieu de cela, MusicLM n’en utilise qu’un seul. Google utilise l’architecture dite Transformer. La société l’a publié en 2017.
Comme vous l’avez compris, il prend en compte une variété de points de données lors de la prise de décision, comme la façon de produire un morceau de musique. L’avantage de ce système est l’amélioration de la précision due à un impact plus important des données sur le résultat du traitement.
Google n’a pas encore rendu public le code MusicLM. À l’heure actuelle, les chercheurs ont publié un ensemble de données d’entraînement à l’IA. Il se compose d’environ 5 500 compositions musicales. Chacun d’eux a une description textuelle pour faciliter la compréhension des réseaux de neurones.
