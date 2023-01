La société de Mountain View a choisi de publier un document qui montre toutes les capacités du logiciel. Il ne l’a pas rendu public pour le moment pour éviter les problèmes de droits d’auteur.

Quel son a un Van Gogh, un lieu physique, une émotion ou un mot juxtaposé à un autre ? Google tente d’apporter une réponse en créant MusicLM, la nouvelle intelligence artificielle (IA) capable de créer de la musique à partir d’un texte.

Et c’est ainsi que l’on découvre que « Starry Night » est un clavier qui papillonne dans les aigus avec un son acide, et qu’il suffit d’écrire « escape from prison », pour obtenir une basse rebondissante avec des synthés en dents de scie. Beaucoup plus en fait. Avec un tel instrument en main, il suffit de fredonner une mélodie pour créer un solo, un riff, ou d’écrire deux phrases pour obtenir une base. Bref, créer un morceau sans même toucher à un instrument.

Ce que MusicLM peut faire

Comme l’écrit Google, MusicLM peut « transformer des mélodies sifflées et fredonnées selon le style décrit dans une légende de texte ». Il peut également générer « une musique haute fidélité à partir de descriptions textuelles telles qu’une mélodie de violon apaisante accompagnée d’un riff de guitare déformé ». Sur le site web du projet, quelques exemples ont été présentés. Écrivez simplement « Morceau funky avec un rythme fort et dansant et une ligne de basse proéminente, ou une mélodie de clavier accrocheuse qui ajoute une couche de richesse et de complexité à la chanson », et MusicLM est capable de créer un morceau entre les 30 secondes et 5 minutes qui reflète assez fidèlement les directives écrites.

Comment ça marche?

MusicLM a été « formé » sur 280 000 heures de musique, ce qui est la base sur laquelle l’IA puise pour créer de nouvelles chansons. « L’audio est généré en fournissant une séquence de messages texte », explique Google. « Les mots affectent la façon dont le modèle continue les jetons sémantiques dérivés de la légende précédente. » L’équipe MusicLM peut, par exemple, également ajouter des sections mélodiques pour fournir des exemples, une indication supplémentaire en plus de l’invite pour diriger la machine vers le résultat souhaité.

Exemples Google

Sur la page d’introduction, Google présente toutes les fonctionnalités de MusicLM. De la bande-son principale d’un jeu d’arcade, aux synthés lourds générés par deux mots : techno mélodique. Il peut également transformer une mélodie sifflée ou fredonnée en d’autres instruments, comme une guitare, un accordéon ou une flûte déformée. Ou créez des voix à partir de zéro qui chantent sur les bases créées. Le seul défaut est la langue, une sorte de grammelot similaire à la langue anglaise, ou au Simlish du jeu vidéo Les Sims. Les parties chantées sont alors granuleuses et brillantes. MusicLM parvient aussi à transformer un Van Gogh ou un Picasso en musique, à partir des descriptions produites sur Wikipédia. Sur le document du projet, Google a par exemple mis en ligne les oeuvres « Matisse’s Dance », qui se traduit par une chanson dansante aux rythmes tribaux ou « The Scream » de Munch, une pièce ambient noise aux cordes stridentes.

Musique et intelligence artificielle

La musique générée par l’IA a une longue histoire. Déjà dans les années 90, l’artiste et scientifique David Cope obsédé par le blocage de l’écrivain a créé Emi (Experiments in musical intelligence) un programme capable d’écrire des compositions dans le style de Bach. Ou Björk, qui grâce à l’IA a créé un paysage sonore vivant et génératif pour l’hôtel Sister City à New York. Cela s’appelle Kórsafn (en islandais pour « archives de choeur ») une composition dans laquelle la musique chorale et les arrangements changent en fonction du temps et de la position du soleil.

Puis Aiva a été créé, le programme qui utilise l’IA pour écrire des chansons. Pour créer de la musique, connectez-vous, sélectionnez le style, les instruments et la durée de la chanson souhaités. Il est également possible de choisir le bpm et la note dominante. Ensuite, cliquez simplement sur « Générer » et en 15 secondes, Aiva produit une chanson en suivant les instructions de l’utilisateur. Un logiciel a également été créé, utilisant le moteur d’imagerie AI StableDiffusion, pour transformer les invites textuelles en spectrogrammes qui sont ensuite traduits en musique.

Il ne sera pas disponible

Google est prudent avec MusicLM, expliquant : « Nous n’avons pas l’intention de publier des modèles à ce stade », lit-on dans le document. Une décision pour éviter « le détournement des contenus créatifs ». Il y a actuellement assez de bruit à ce sujet. Pensez à Stable Diffusion et Midjourney qui, en ce moment, ont reçu une plainte pour s’être approprié les oeuvres d’artistes sans leur permission.