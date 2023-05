Selon une étude récente, des scientifiques ont créé un analyseur de langage qui utilise un outil d’IA similaire à ChatGPT pour convertir la parole en texte. La découverte est remarquable car c’est la première fois qu’un langage continu est récupéré de manière non invasive à partir de l’activité cérébrale d’une personne à l’aide d’un appareil d’imagerie par résonance magnétique fonctionnelle (IRMf). À l’aide de schémas cérébraux IRMf, l’outil a pu interpréter les principaux points d’histoires que les sujets humains lisent, regardent ou écoutent – ou même simplement imaginent – d’une manière qui lui permet de lire en toute sécurité dans les pensées des gens. Les scientifiques s’attendent à ce que cette technologie, qui en est encore à ses balbutiements, puisse un jour permettre aux personnes atteintes de maladies neurologiques qui altèrent la parole de discuter facilement avec les autres.

Esprit – les outils de lecture pourraient être utilisés pour le mal

L’équipe derrière le décodeur avertit que l’esprit – les outils de lecture pourraient potentiellement être utilisés pour des actes pervers. L’un d’entre eux pourrait être une surveillance illégale par le gouvernement. Selon un rapport publié lundi dans Nature Neuroscience, les auteurs ont déclaré que « les interfaces cerveau-ordinateur doivent respecter la vie privée mentale », même s’ils ont noté que leur outil a besoin d’un effort d’équipe de sujets humains pour fonctionner.

Jerry Tang, étudiant diplômé en informatique à l’Univ. du Texas à Austin qui a dirigé l’étude, lors d’un point de presse tenu jeudi dernier, a déclaré

« Actuellement, le décodage du langage se fait à l’aide de dispositifs implantés qui nécessitent une neurochirurgie, et notre étude est la première à décoder le langage continu, c’est-à-dire plus que des mots ou des phrases complets, à partir d’enregistrements cérébraux non invasifs, que nous recueillons à l’aide d’une IRM fonctionnelle… L’objectif du langage – le décodage consiste à prendre des enregistrements de l’activité cérébrale d’un utilisateur et à prédire les mots que l’utilisateur entendait, disait ou imaginait », a-t-il noté. « À terme, nous espérons que cette technologie pourra aider les personnes qui ont perdu la capacité de parler à cause de blessures comme des accidents vasculaires cérébraux ou de maladies comme la SLA.

Comment fonctionne le nouvel outil d’IA

Trois personnes qui ont chacune passé 16 heures à écouter des histoires dans un outil d’IRMf ont aidé Tang et d’autres à créer leur outil. Pour relier les aspects sémantiques des histoires enregistrées à l’activité cérébrale notée dans les données IRMf, l’équipe a formé un modèle d’IA connu sous le nom de GPT-1. Il pourrait alors apprendre quels mots et expressions sont liés à des schémas cérébraux spécifiques.

Les participants écoutent ensuite de toutes nouvelles histoires qui ne faisaient pas partie de l’ensemble de données de formation. Tout en faisant cela, ils ont eu leur cerveau imagé à l’aide d’un IRMf. Bien que ces interprétations utilisent souvent des structures sémantiques différentes des enregistrements originaux, l’outil a pu traduire les scénarios audio en texte au fur et à mesure que les gens les entendaient. Par exemple, à l’aide de lecteurs IRMf, les pensées de l’auditeur ont été traduites à partir d’une cassette d’un orateur disant… « Je n’ai pas encore mon permis de conduire » en « Elle n’a même pas encore commencé à apprendre à conduire ».

Ces lectures bancales résultent d’une distinction cruciale entre le nouvel outil et les méthodes établies. Les anciennes méthodes standard implantent de manière invasive des électrodes dans le cerveau. Alors que l’équipe de Tang s’est concentrée sur le flux sanguin dans le cerveau, ce qui est capturé dans les appareils d’IRMf. Les outils basés sur les électrodes prédisent généralement le texte à partir des activités motrices. Cela inclut les mouvements de la bouche d’une personne lorsqu’elle essaie de parler.

L’outil ne donne pas les mots exacts

Alexander Huth, un assistant prof. de neurosciences et d’informatique à UT Austin et auteur principal de la nouvelle étude, déclare dans un point de presse

« Notre système fonctionne à un niveau très différent… Au lieu de regarder cette chose motrice de bas niveau, notre système fonctionne vraiment au niveau des idées, de la sémantique et du sens. C’est là où ça veut en venir… C’est la raison pour laquelle je pense que ce que nous obtenons n’est pas les mots exacts que quelqu’un a entendus ou prononcés, c’est l’essentiel… C’est la même idée mais exprimée avec des mots différents.

Le nouvel outil de l’équipe leur permet de repousser les limites de l’esprit : la technologie de lecture. Pour ce faire, il a testé si l’outil pouvait traduire les pensées des sujets lorsqu’ils regardaient des films muets. Il a également recommencé le processus car les sujets ont simplement créé des histoires dans leur tête. Dans les deux cas, le décodeur a obtenu de très bons résultats. Qu’ils créaient des histoires dans leur esprit ou qu’ils regardaient un film, le décodeur a bien fonctionné.

Par rapport à la parole imaginée, le décodeur a donné de meilleurs résultats tout au long des tests avec des enregistrements audio. Mais il était encore capable de déduire quelques faits de base sur les pensées non dites à partir de l’activité cérébrale. En tant qu’étude de cas, un sujet a imaginé l’énoncé … « est allé sur un chemin de terre à travers un champ de blé et au-dessus d’un ruisseau et par des bâtiments en rondins ». Le décodeur a produit un texte qui se lit… « il a dû traverser un pont de l’autre côté et un très grand bâtiment au loin. »

D’énormes problèmes de confidentialité sont inévitables

Toutes ces tâches ont été confiées aux membres de l’étude alors qu’ils se trouvaient à l’intérieur d’un appareil d’IRMf. Il s’agit d’une pièce d’équipement de laboratoire encombrante et fixe. Pour cette raison, Tang et son équipe pensent que le décodeur n’est pas encore prêt à être utilisé. Cela indique que pour les personnes ayant des problèmes d’élocution, cet outil n’est pas réalisable pour le moment. Cependant, ils pensent que les futures versions de l’appareil pourraient être modifiées pour fonctionner avec des outils plus simples. Des outils tels que les capteurs fNIRS qui peuvent être portés sur la tête d’un patient.

L’équipe qui a réalisé l’étude avertit que les décodeurs soulèvent des questions morales sur la vie privée mentale. Cependant, ils ont fait allusion au potentiel de cette technologie en tant que nouvelle forme de dialogue

L’équipe de Tang a déclaré dans l’étude

« Notre analyse de la confidentialité suggère que la coopération des sujets est actuellement requise à la fois pour former et pour appliquer le décodeur… Cependant, les développements futurs pourraient permettre aux décodeurs de contourner ces exigences. De plus, même si les prédictions du décodeur sont inexactes sans la coopération du sujet, elles pourraient être intentionnellement mal interprétées à des fins malveillantes… « Pour ces raisons et d’autres imprévues, il est essentiel de sensibiliser aux risques de la technologie de décodage cérébral. Il est également nécessaire d’adopter des politiques qui protègent la vie privée mentale de chaque personne »,

Actualité mobile de notre partenaire de la semaine