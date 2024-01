Le téléphone sonne, une femme répond, de l’autre côté Joe Biden dit : « Quelle montagne de bêtises ». Il ajoute ensuite : « Il est important que tu gardes ton vote pour les élections de novembre. Voter ce mardi ne fait que permettre aux républicains de réélire Donald Trump. Ton vote fait la différence en novembre, pas ce mardi. » Le même appel arrive dimanche soir à d’autres électeurs du New Hampshire, qui voteront aujourd’hui pour le candidat du Parti républicain à la course présidentielle. La voix est celle du Président des États-Unis, pourtant Biden n’a jamais passé ces appels.

« Bien que cela ressemble à la voix du président Biden, ce message semble avoir été généré artificiellement », a expliqué le procureur général. « Ces messages semblent être une tentative illégale de manipuler les primaires électorales du New Hampshire et d’influencer les électeurs. Tous ceux qui ont répondu doivent ignorer complètement le contenu du message ». On ne sait pas combien d’électeurs ont reçu l’appel, s’ils ont été choisis au hasard et qui a généré le faux message de Joe Biden. Un porte-parole de Trump a nié tout lien avec la voix clonée : « Ce n’était pas nous. Nous n’avons rien à voir avec cette affaire. »

On a déjà beaucoup parlé de l’impact que l’intelligence artificielle aurait sur les élections politiques. En mars, des photos truquées montrant Trump menotté et en prison avaient été publiées. Actuellement, c’est la voix de Biden qui est clonée. Le secrétaire d’État David Scanlan a souligné que cette affaire « renforce la préoccupation nationale sur l’effet de l’intelligence artificielle sur les campagnes ». Robert Weissman, président de Public Citizen, a déclaré dans un communiqué de presse : « Le moment du deepfake politique est arrivé. Les politiciens doivent se dépêcher de prendre des mesures de protection, sinon nous serons confrontés au chaos électoral. Le deepfake du New Hampshire rappelle les multiples façons dont les deepfakes peuvent semer la confusion. »

L’appel faux de Joe Biden

L’appel faux commence par « Quelle montagne de bêtises » (« What a bunch of malarkey » en anglais). « Malarkey » n’est pas un terme au hasard, Biden l’a déjà utilisé auparavant. L’appel a également été reçu par un membre du parti démocrate qui a signalé l’affaire. À la fin de l’appel, on entend la voix de Biden énoncer le numéro de téléphone de Kathy Sullivan, ancienne présidente du Parti démocrate du New Hampshire, qui a lancé une campagne pour inciter les démocrates du New Hampshire à écrire le nom de Biden pour les primaires.

Lors d’une interview avec NBC News, Sullivan a raconté : « Dimanche soir, elle a commencé à recevoir des appels de personnes qui avaient reçu l’appel de Biden. Une femme m’a dit qu’elle avait parlé à Biden en personne et qu’il lui avait donné mon numéro. » Elle a ensuite ajouté : « Je veux que les responsables soient identifiés immédiatement car cela est une attaque contre la démocratie. Je ne vais pas laisser passer les responsables. Ils doivent payer pour cela. Qui le savait ? Qui en tire profit ? »

Avec le retrait de Ron DeSantis, le combat d’aujourd’hui sera entre l’ancien président Trump et l’ancienne gouverneure de Caroline du Sud Nikki Haley. Biden ne figurera donc pas sur les listes électorales, mais comme l’a expliqué le porte-parole de Dean Phillips, député du Minnesota, à NBC : « Toute tentative de décourager les électeurs est honteuse, c’est une offense inacceptable à la démocratie. L’utilisation potentielle de l’intelligence artificielle pour manipuler les électeurs est profondément troublante. »

Comment l’intelligence artificielle clone les voix

Il existe déjà sur le marché plusieurs outils de synthèse vocale IA. L’intelligence artificielle est capable de reconstruire le timbre, le ton, la voix, le rythme en écoutant une voix pendant quelques secondes seulement. Les modèles de machine learning text-to-speech permettent de reproduire le discours en manipulant des formes d’onde, ils sont donc capables de générer rapidement la voix de n’importe qui sans la déformer.

Par ailleurs, l’IA est également capable de reproduire le ton émotionnel du discours et d’imiter l’environnement acoustique de l’exemplaire audio. Ainsi, si la voix enregistrée provient d’un appel téléphonique, l’IA sera capable de reproduire les caractéristiques acoustiques, telles que la voix métallique dévoilée par les haut-parleurs d’un smartphone.