Google a créé une IA capable de générer de la musique à partir de descriptions.
Google a créé un nouvel outil basé sur l’intelligence artificielle capable de générer de la musique à partir de descriptions textuelles. Son nom est MusicLM, et bien qu’elle ait prouvé sa capacité à produire de la musique de haute qualité et à surpasser les projets précédents de ce type, la société n’a pas l’intention de sortir MusicLM en tant que produit commercial.
Google lui-même suggère que MusicLM a pu améliorer les systèmes précédents à la fois dans la qualité du son généré et dans sa capacité à adhérer à la description textuelle indiquée. Sur le site du projet, quelques exemples de musiques générées à l’aide de cet outil sont partagés.
Le rapport académique où le développement du projet est expliqué précise que MusicLM utilise un modèle entraîné avec plus de 280 000 heures de musique. De cette manière, il est prévu de générer une musique cohérente à partir de descriptions d’une « complexité importante ».
À titre d’exemple, certaines chansons générées à partir de différentes descriptions sont affichées :
« Bande sonore épique avec des instruments d’orchestre. La pièce crée une tension, crée un sentiment d’urgence. Un chœur a cappella chante à l’unisson, crée un sentiment de puissance et de force »
« La bande-son principale d’un jeu d’arcade. C’est rapide et entraînant, avec un riff de guitare électrique accrocheur. La musique est répétitive et facile à retenir, mais avec des sons inattendus, comme des coups de cymbale ou des roulements de tambour. »
Les responsables du projet expliquent que MusicLM n’est pas seulement capable de générer de courts clips audio. Les capacités de l’outil vont encore plus loin, et vous pouvez même créer des chansons à partir de mélodies déjà existantes, quelle que soit la façon dont elles sont jouées (en fredonnant, en sifflant, en chantant ou avec n’importe quel type d’instrument).
Il existe également la possibilité de créer des mélodies de plusieurs minutes, et Google s’assure que la qualité sonore est maintenue tout au long du clip.
Malgré cela, l’entreprise n’a pas l’intention de proposer cet outil au public comme OpenAI l’a fait avec son ChatGPT. Bien qu’ils n’aient pas révélé les raisons spécifiques, ils ont expliqué que MusicLM pourrait incorporer du matériel protégé par le droit d’auteur dans les chansons générées (environ 1 % de la musique produite par MusicLM contient du matériel copié à partir des chansons qui ont été utilisées pendant leur formation). Cela a été confirmé à TechCrunch :
Nous reconnaissons le risque de détournement potentiel du contenu créatif associé au cas d’utilisation. Nous insistons fortement sur la nécessité de travaux futurs supplémentaires pour faire face à ces risques associés à la production musicale.
Reste à savoir si Google est capable de relever ce défi, et si oui, si l’entreprise se décide enfin à lancer une version commerciale de MusicLM. Cela pourrait certainement changer toute la génération de la musique.
Quoi qu’il en soit, pour l’instant, la société prévoit de se concentrer sur la mise en œuvre d’autres fonctionnalités, telles que la possibilité de générer des paroles de chansons ou d’améliorer la qualité des voix dans les chansons.
Détente, découvrez l’évolution du nombre de smartphones vendus par marque au fil du temps dans la vidéo ci-dessous :