Audiobox est la nouvelle IA de Meta qui inaugure la capacité de créer des conversations avec des voix à partir de zéro

La nouveauté de Meta est une IA capable de cloner votre voix en quelques secondes : voici comment fonctionne Audiobox.

Meta dispose d’une nouvelle IA capable de cloner votre voix en quelques secondes. Audiobox est le nom de cet outil qui utilise l’IA pour créer des voix à partir de zéro, ayant la capacité d’imiter n’importe quel type de voix sans problème majeur. Ce générateur de voix synthétiques est disponible en France et peut être utilisé par n’importe qui.

Audiobox est le résultat de années de recherche et développement de la part des ingénieurs de Meta, l’entreprise précédemment connue sous le nom de Facebook. Selon la page officielle, Audiobox est le premier modèle capable de généraliser les tâches de génération vocale sans avoir été spécifiquement formé à cet effet et avec des résultats jamais vus jusqu’à présent.

Meta lance Audiobox en France : voici sa nouvelle IA d’imitation de voix

Audiobox est basé sur un modèle d’intelligence artificielle appelé Voicebox, que Meta a développé et annoncé en juin dernier. Le modèle utilise une architecture de transformateur, similaire à celle de ChatGPT d’OpenAI ou de Bard de Google, qui lui permet d’apprendre en contexte et de généraliser à travers différentes tâches de texte à parole.

Le fonctionnement est très simple, bien qu’il puisse sembler écrasant au départ. Il faut garder à l’esprit que Meta a préparé son propre tutoriel avec tout ce dont vous avez besoin pour commencer à utiliser cet outil, et il est fortement recommandé de le suivre.

Le tutoriel explique que vous pouvez créer des voix à partir de zéro, en vous enregistrant vous-même ou une autre personne récitant un exemple de texte qui apparaîtra à l’écran. Si vous ne voulez pas le faire, vous pouvez toujours utiliser les voix pré-définies par défaut.

Une fois une voix choisie, Audiobox se montre comme un éditeur de pistes audio avec IA. Vous pouvez écrire une phrase que la voix prononcera et utiliser différentes voix pour former une conversation qui, selon ce qui est écrit, peut ou non avoir du sens.

De plus, il y a une section pour ajouter des effets sonores qui accompagneront les voix afin de créer une conversation plus immersive. En somme, Audiobox a l’utilité d’une sorte de livre audio dans lequel chaque utilisateur peut écrire son histoire.

Cet outil nécessite encore beaucoup de développement, en réalité, les voix sonnent plus robotiques qu’elles ne devraient et, en plus, sa sortie a été faite à des fins de divulgation. Meta est catégorique quant au fait que cet outil ne sera pas open source, il faut donc être prudent avec les données fournies.

Détente, découvrez l’évolution du nombre de smartphones vendus par marque au fil du temps dans la vidéo ci-dessous :