En bref : Après avoir exploité l’ensemble du web pour construire leurs modèles génératifs, les entreprises d’IA travaillent désormais sur un nouveau paradigme d’apprentissage basé sur des données produites par l’ordinateur. Il semble que la synthèse numérique soit meilleure que le contenu créé par l’homme pour l’évolution de l’IA. Et elle ne devrait pas poser de problèmes de violation des droits d’auteur et de la vie privée.

Une boucle de rétroaction de l’IA menace de détruire l’avenir des algorithmes d’IA générative, si bien que les grandes entreprises technologiques se démènent pour trouver une solution qui pourrait fournir aux modèles LLM les bonnes données pour grandir et évoluer. L’avenir de la formation à l’IA est apparemment lié aux « données synthétiques », ce qui est une façon moins onaniste de dire que les algorithmes devraient se parler s’ils veulent rester sains d’esprit (numérique).

Selon un récent communiqué du Financial Times, Microsoft, OpenAI et Cohere, une startup du LLM, sont quelques-unes des entreprises qui testent déjà l’utilisation des données synthétiques susmentionnées. Par communiqué aux informations « naturelles » fournies par de maigres humains, les données synthétiques sont générées par un algorithme informatique tandis que des superviseurs humains fournissent un retour d’information et comblent les lacunes. Ce processus est connu sous le nom d’apprentissage par renforcement du feedback humain (RLHF).

Les algorithmes d’IA générative devenant de plus en plus sophistiqués, même les entreprises les plus riches basées sur l’IA (Microsoft, Google, etc.) n’ont pas de moyen facile d’obtenir un nouveau contenu de « qualité » pour continuer à entraîner leurs modèles de grands langages (LLM). Selon Aidan Gomez, PDG de Cohere, le web est « tellement bruyant et désordonné » qu’il ne peut pas fournir les données dont les entreprises d’IA ont besoin.

M. Gomez a déclaré que pour améliorer les performances des LLM d’aujourd’hui face aux défis scientifiques, sanitaires ou commerciaux, les efforts de formation nécessiteront des « ensembles de données uniques et sophistiqués » créés par des experts de niveau mondial. Cependant, ce type de données créées par des êtres humains est « extrêmement » coûteux, de sorte que les entreprises d’IA emploient des algorithmes d’IA pour… former des algorithmes d’IA.

Des modèles d’IA de base sont déjà en cours de développement dans le seul but de produire du texte, du code ou d’autres informations « complexes » liées aux fraudes dans le domaine des soins de santé ou de la finance. Ces informations « synthétiques » peuvent à leur tour être utilisées pour former une nouvelle génération de LLM avancés afin de fournir aux clients encore plus d' »intelligence » et de compétences en matière de génération de texte.

M. Gomez a indiqué que Cohere travaillait sur un modèle d’IA pour les mathématiques avancées, avec deux modèles distincts se parlant l’un à l’autre et jouant le rôle du tuteur en mathématiques ou de l’étudiant. Les deux modèles ont une « conversation sur la trigonométrie », a expliqué M. Gomez, et tout est synthétique. Les humains peuvent ensuite vérifier si le modèle a dit quelque chose d’erroné ou s’il a complètement inventé.

Les modèles d’IA qui se parlent entre eux offrent également une solution potentielle aux problèmes de plus en plus préoccupants de protection de la vie privée et de droits d’auteur auxquels sont confrontées les sociétés de LLM comme OpenAI. Des ensembles de données synthétiques bien conçus pourraient éliminer les biais et les déséquilibres dans les données existantes, a déclaré Ali Golshan, même si le PDG de la startup d’IA Gretel admet que l’entraînement purement synthétique pourrait également entraver les progrès. Le web est déjà jonché d’informations générées par l’IA, ce qui entraînera une dégradation des chatbots et des « connaissances régurgitées » au fil du temps, comme le prévoit le processus de boucle de rétroaction de l’IA.

Découvrez le reportage du mois (sous-titré en français), l’IA gagnera t-elle face aux champion du monde du jeu de Go ? :