Il suffit de 15 secondes pour cloner votre voix : comment fonctionne le nouveau programme d’OpenAI

Immagine

Non seulement à des fins éducatives ou pour parler d’autres langues, la nouvelle intelligence artificielle, sœur de ChatGPT, permettra également aux personnes atteintes de maladies oncologiques ou dégénératives de retrouver l’usage de leur voix. Mais il y a aussi des risques.

Immagine

Dans un avenir pas trop lointain, nous pourrons utiliser notre voix pour parler des langues que nous n’avons jamais apprises. Ce n’est pas de l’utopie, c’est une réalité signée par OpenAI et cela s’appelle Voice Engine. Le seul problème est que, pour l’instant, le projet n’est pas ouvert au public mais seulement à un groupe restreint d’associations et de centres de recherche.

Le fonctionnement est simple : quinze secondes d’enregistrement vocal suffisent et l’intelligence artificielle fait le reste. La voix peut également avoir été enregistrée à d’autres fins, comme cela a été le cas pour une jeune patiente qui ne parle plus comme avant et qui a fourni au logiciel un exemplaire audio provenant d’une ancienne vidéo.

Quand sera-t-il publié

OpenAI n’est pas étrangère à l’idée de combiner l’intelligence artificielle avec la voix humaine. Depuis le lancement de ChatGPT, le produit phare de l’entreprise, plusieurs possibilités ont été présentées pour transformer le texte en paroles (y compris la fonctionnalité de lecture de ce que l’IA générative écrit). Le même projet de Voice Engine a été lancé à la fin de 2022 et en moins de deux ans, il a recueilli des adhésions d’associations et de centres de recherche pour mettre l’outil à l’épreuve.

Comment l’intelligence artificielle s’est-elle retrouvée dans l’intrigue de Beautiful et pourquoi cela devrait nous intéresser

Il s’agit pour l’instant seulement d’une présentation. On ne sait pas encore quand Voice Engine sera publié à un public plus large. Les préoccupations concernant les utilisations abusives de cette technologie semblent peut-être être la raison pour laquelle les mains (et les voix) des utilisateurs du monde entier sont tenues à l’écart. Cependant, OpenAI a déjà lancé des idées sur la façon dont il pourrait être utilisé (bien) à l’avenir.

L’utilisation à des fins éducatives

On peut également cloner sa propre voix pour la réutiliser à d’autres occasions, par exemple à des fins éducatives. C’est le cas de la collaboration d’OpenAI avec Age of Learning, une entreprise spécialisée dans le développement d’outils technologiques pour l’enseignement et qui a mis en œuvre la technologie de clonage pour aider à la lecture.

Ou encore, on peut utiliser Voice Engine pour échantillonner sa propre voix et transmettre du contenu dans toutes les langues que l’on ne parle pas réellement. Par exemple, en enregistrant quinze secondes de voix en italien, on pourra l’utiliser pour lire des textes en anglais, en espagnol, en chinois et en japonais (en conservant l’accent de sa propre langue). Jusqu’à présent, l’expérience a été menée par HeyGen, qui se présente comme une « plateforme de narration ».

Restituer la voix à ceux qui l’ont perdue

Outre les domaines de l’éducation, ceux de la santé peuvent également bénéficier de cette nouveauté. Par exemple, pour donner la possibilité de communiquer à ceux qui ont toujours eu des problèmes pour le faire. Ou pour ceux qui ont perdu cette possibilité en raison d’une maladie oncologique ou dégénérative. C’est le cas d’une jeune patiente qui, à cause d’une tumeur au cerveau, n’a plus pu parler couramment. Quinze secondes d’audio prélevés à partir d’une vidéo d’un projet scolaire enregistrée auparavant ont suffi pour cloner sa voix et l’utiliser pour communiquer avec le monde, non seulement pour présenter le projet de Voice Engine, mais aussi pour passer une commande au restaurant, comme le montre l’exemple publié par OpenAI.

Les risques des voix clonées

S’il n’y avait que des avantages, il n’y aurait aucun problème à distribuer le logiciel au public. Mais les craintes d’une utilisation abusive ne manquent pas. OpenAI a décidé de temporiser avant de publier Voice Engine et a donc pris quelques précautions avec les entreprises qui ont eu un accès anticipé à l’intelligence artificielle.

Tout d’abord, un filigrane pour marquer le fichier audio comme généré par l’intelligence artificielle. Une étiquette qui doit également être clairement affichée par les entreprises elles-mêmes, qui doivent signaler quand un audio a été généré avec Voice Engine. Et, pour ne pas être avare de précautions, OpenAI a demandé aux entreprises et aux centres de recherche de signer une longue liste de règles pour éviter que la technologie soit utilisée pour cloner les voix de personnes qui n’ont pas été directement impliquées dans le projet.

La préoccupation principale est que cette technologie soit utilisée pour copier la voix de personnes célèbres, comme cela a été le cas du président américain Joe Biden lors de la campagne primaire, lorsqu’un autre logiciel a été utilisé pour l’imiter à son insu.