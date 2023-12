Meta a récemment lancé une suite de modèles de traduction automatique de l’IA appelée Communication sans faille, qui comprend 4 modèles d’IA. Cette fonction vise à permettre une communication plus naturelle et authentique entre les langues. La suite comprend trois modèles principaux : SeamlessExpressive, SeamlessStreaming et SeamlessM4T v2. Ces modèles sont conçus pour préserver l’expression et les subtilités du discours entre les langues. Ils fournissent également des traductions vocales et textuelles avec environ deux secondes de latence. De plus, cela permet aux personnes de communiquer sans effort par le biais de la parole et du texte.

Meta affirme que la suite d’IA peut « reproduire avec précision les émotions de l’orateur » et peut atteindre un délai de seulement 2 secondes. Elle prend en charge la capacité d’interprétation simultanée et prend en charge près de 100 langues d’entrée. Il y a des rapports selon lesquels la Communication sans faille est un résultat de recherche de Meta pour célébrer le 10e anniversaire de la création de sa propre organisation de recherche en IA « Fundamental AI Research ».

Communication sans faille : une percée dans la traduction IA

La Communication sans faille de Meta constitue une avancée considérable dans le domaine de la traduction automatique de l’IA. En permettant une communication translingue plus naturelle et authentique, la suite Communication sans faille a le potentiel de briser les barrières linguistiques et de faciliter la communication à l’échelle mondiale. Les principaux modèles inclus dans le kit Communication sans faille sont SeamlessExpressive, SeamlessStreaming et SeamlessM4T v2. Meta affirme que la suite comprend ce qui suit :

Le modèle « SeamlessM4T de deuxième génération » pour une traduction accélérée Le modèle d’interprétation – « Seamless Expressive » Le modèle de traduction simultanée – « Seamless Streaming »

Le modèle SeamlessM4T prétend pouvoir associer automatiquement les textes ultérieurs possibles en fonction du contenu oral de l’utilisateur pendant la traduction pour accélérer la traduction.

SeamlessExpressive

SeamlessExpressive est un modèle qui vise à préserver l’expression, l’émotion et la prosodie de la voix de l’orateur lors de la traduction vocale. Ce modèle se concentre sur la capture des nuances de l’expression humaine, souvent négligées par les outils de traduction existants. En préservant le style vocal et les nuances émotionnelles de la voix de l’orateur, SeamlessExpressive permet une communication translingue plus naturelle et authentique.

SeamlessStreaming

SeamlessStreaming est un autre modèle clé du kit Communication sans faille. Il permet des traductions vocales et textuelles presque en temps réel avec seulement environ deux secondes de latence. Contrairement aux systèmes de traduction classiques qui attendent que l’orateur ait terminé sa phrase avant de traduire, SeamlessStreaming traduit pendant que l’orateur parle encore. Cette fonction permet des conversations plus fluides et naturelles entre des locuteurs de différentes langues.

Il prend en charge la traduction orale (traduction de parole à parole), la traduction de dictée (traduction de parole à texte, S2TT) et la reconnaissance automatique de la parole. Le modèle complet Seamless intègre les trois modèles linguistiques pour faciliter les scénarios universels.

SeamlessM4T v2

SeamlessM4T v2 sert de modèle multilingue et multitâche fondamental qui alimente les deux autres modèles du kit Communication sans faille. Il s’agit d’une version améliorée du modèle SeamlessM4T original, offrant une meilleure cohérence entre le texte et la voix. Ce modèle permet aux personnes de communiquer sans effort par le biais de la parole et du texte dans différentes langues, ce qui en réalité un composant essentiel du kit de traduction de l’IA Communication sans faille.

Impact de la Communication sans faille

Le lancement du kit de traduction de l’IA Communication sans faille de Meta représente une avancée significative dans le domaine de la traduction automatique de l’IA. En permettant une communication translingue plus naturelle et authentique, la suite Communication sans faille a le potentiel de briser les barrières linguistiques et de faciliter la communication à l’échelle mondiale. Les principales caractéristiques du kit Communication sans faille, telles que la préservation de l’expression, la traduction en temps réel et la prise en charge de la communication multilingue, en font un outil précieux pour les particuliers, les entreprises et les organisations opérant dans des environnements multilingues.

En ce qui concerne la sécurité de ce produit, Meta a déclaré

« Nous nous engageons à promouvoir un écosystème d’IA sûr et responsable. Nous avons pris plusieurs mesures pour améliorer la sécurité de nos modèles de Communication sans faille ; réduire considérablement les effets de la toxicité hallucinée dans les traductions et mettre en œuvre une approche de tatouage numérique personnalisée pour les sorties audio de nos modèles expressifs. »

L’entreprise a ajouté

« Nous croyons au pouvoir de la collaboration et de la recherche ouverte pour briser les barrières de communication. Pour permettre à nos collègues chercheurs de s’appuyer sur ce travail, nous diffusons publiquement la suite complète des modèles de Communication sans faille, ainsi que les métadonnées, les données et les outils. »

Notre avis

Le kit de traduction de l’IA Communication sans faille de Meta est un développement révolutionnaire qui a le potentiel de transformer notre manière de communiquer à travers les langues. En préservant l’expression, en permettant la traduction en temps réel et en soutenant la communication multilingue, la suite Communication sans faille représente une avancée significative vers une communauté mondiale plus connectée et inclusive.

Selon Meta, les outils d’IA peuvent aider à rapprocher les nations du monde entier. Cependant, l’entreprise doit ajouter des fonctionnalités de sécurité pour prévenir l’imitation et d’autres formes d’abus au travail. Pour cette raison, Meta a ajouté une méthode de tatouage numérique qui est plus fiable que les discriminants passifs. Meta affirme que sa méthode de tatouage numérique est plus efficace pour distinguer les voix synthétiques des voix humaines. Le tatouage numérique incorpore activement un signal imperceptible pour l’oreille humaine mais détectable à l’aide d’un modèle de détection dans l’audio. L’origine de l’audio peut être correctement retracée avec ce tatouage. L’établissement d’une provenance audio vérifiable favorise l’utilisation appropriée des outils de préservation de la voix et contribue à prévenir les abus potentiels.

