Un épisode de podcast fantasmagorique présente une IA de Steve Jobs «interviewée» par une IA de Joe Rogan – et l’effet est fascinant, malgré les défauts…
Podcast.ai décrit le fonctionnement du processus.
Podcast.ai est un podcast hebdomadaire qui explore en profondeur un nouveau sujet, entièrement généré par l’intelligence artificielle. Les épisodes sont rendus à l’aide des voix ultra-réalistes de play.ht, et les transcriptions sont générées avec des modèles de langage affinés. Par exemple, l’épisode de Steve Jobs a été formé sur sa biographie et tous les enregistrements de lui que nous avons pu trouver en ligne afin que l’IA puisse le ramener à la vie avec précision.
L’entreprise explique pourquoi elle a choisi Steve comme premier « invité ».
Nous voulions repousser les limites de ce qui est possible dans la synthèse vocale de pointe actuelle, nous voulions créer un contenu qui puisse inspirer les autres à faire de même, et personne n’a autant inspiré et impacté le monde de la technologie que Steve Jobs, c’est pourquoi, dans le premier épisode, nous avons redonné vie à sa voix.
Les voix ont plusieurs défauts. Il y a un léger avantage robotique, l’intonation ne correspond parfois pas au contenu et il n’y a pas assez de variation dans le rythme. Le rire est aussi assez terrible! Cela dit, il est toujours remarquable de voir à quel point les voix sont proches de la réalité lorsque vous n’écoutez pas activement ces choses.
Décrire le contenu comme généré par l’IA est, je pense, un véritable étirement. Il est très clair que le système retire le texte de paragraphes entiers des enregistrements, plutôt que de générer un contenu complètement nouveau. Il s’agit effectivement de relever des mots-clés, puis de rechercher des citations réelles sur ce sujet, plutôt que de générer véritablement de nouvelles réponses.
L’impact, alors, est que cela ressemble un peu à une collection d’extraits sonores de Steve plutôt qu’à une véritable interview. Malgré cela, c’est toujours une expérience quelque peu étrange à l’écouter!
On pourrait certainement dire que la vision de l’entreprise repousse les limites, bien que je ne sois pas sûr que Steve l’aurait approuvée.
Chez Play.ht, nous croyons en un avenir où toute la création de contenu sera générée par l’IA mais guidée par des humains, et le travail le plus créatif dépendra de la capacité de l’humain à articuler sa création souhaitée à la machine.
Nous construisons cet avenir, en commençant par un élément majeur de celui-ci qui est la génération de parole synthétique émotionnelle et expressive de type humain et la capacité de cloner n’importe quelle voix avec une ressemblance parfaite.
Nous espérons que d’autres seront inspirés par ce travail et commenceront à créer du contenu audio et vidéo encore plus créatif à l’aide de l’IA générative.
Jusqu’à présent, les systèmes d’IA écrivent un contenu simple avec un format prévisible, comme les actualités sportives et les rapports financiers, où les noms et les numéros sont intégrés à un modèle éprouvé. Mais l’idée d’un avenir où « tout le contenu » serait généré par l’IA semble aussi farfelue que peu attrayante.
Que pensez-vous de l’IA de Steve Jobs ? Faites-nous savoir sur nos réseaux sociaux après l’avoir écouté ici:
Photo : Wikipédia/CC2.0
Découvrez cette vidéo ci-dessous (en anglais) pour plus d’actualités Apple :

