Les responsables de Stable Diffusion ont lancé un nouveau modèle appelé Stable Audio, qui pourrait être une révolution dans la création de musique utilisant l’intelligence artificielle.

Stable Audio vient réinventer la création musicale par IA.

Les capacités de Stable Diffusion en tant qu’IA générative d’images sont déjà bien connues de tous. Le modèle est déjà parmi nous depuis un certain temps et dispose même d’une application dédiée pour Android. Ce n’est pas le seul de sa catégorie (il y a Irmo), mais il est l’un des plus connus et des plus puissants que l’on puisse trouver.

Stable Diffusion a été créé par Stability AI, qui ne s’est pas seulement consacré à ce modèle de génération d’images (il faut diversifier pour gagner de l’argent, après tout). La preuve en est Stable Audio, une IA génératrice de musique dont l’existence nous est parvenue par le biais de TechCrunch.

Créez des chansons sans connaître la musique

Selon ses créateurs, Stable Audio permet de créer de la « musique de haute qualité » destinée à des fins commerciales, en créant des fichiers audio avec une fréquence d’échantillonnage de 44,1 kHz. Il utilise pour cela une technique connue sous le nom de diffusion latente, dont Stability AI n’a pas donné de détails sur le fonctionnement.

Le modèle d’intelligence artificielle utilisé pour générer chaque chanson a été entraîné avec environ 1,2 milliard de paramètres incluant des métadonnées de chansons. Ses créateurs affirment que l’utilisateur aura un « grand contrôle » sur le contenu et la durée de l’audio qui sera généré, bien au-delà des outils similaires qui ont été vus jusqu’à présent.

Apparemment, Stable Audio est une évolution d’un autre IA générative musicale, Dance Diffusion. Ce modèle d’intelligence artificielle a été lancé sans beaucoup de fanfare l’année dernière, et il était capable de générer des chansons et des effets sonores. Il offrait même une description textuelle des deux choses.

Beaucoup d’argent a été investi dans sa création avec l’idée de devancer la concurrence dans l’industrie de la musique générée par IA, mais à un moment donné en 2022, Stability AI a décidé de cesser de mettre à jour Dance Diffusion. Apparemment, la création de ce nouveau modèle aurait pu être due à la pression des investisseurs pour récupérer leur argent.

Ceux qui ont pu avoir accès à des échantillons créés par Stable Audio disent qu’il s’agit des chansons générées par IA les plus authentiques entendues à ce jour. Il est vrai que la technologie aura du mal à remplacer jamais l’élément humain dans la création musicale, mais il semble que chez Stability AI, ils soient déterminés à essayer.

