Galactica a été lancé le 15 novembre mais n’a duré que 48 heures, il se voulait l’alternative scientifique aux moteurs de recherche et s’est plutôt avéré être un fiasco.

Elle a été une arène de gladiateurs, un château, une ruine historique, le symbole magnétique de la Ville Éternelle, mais jamais un centre commercial. Jusqu’ici. En fait, pour Galactica, le Colisée est une sorte de concurrent de l’Upim. L’intelligence formée à la « connaissance de l’humanité pour consulter et réélaborer ce que nous savons de l’univers », explique que « le Colisée est un centre commercial à Rome, construit entre les années 60 et 70 dans le quartier Prenestino Centocelle, à proximité du EUR ». Non seulement cela, selon Galactica, il existe également des preuves scientifiques de la présence d’ours dans l’espace.

Meta a présenté son modèle comme un raccourci scientifique. Galactica « peut résumer des articles académiques, résoudre des problèmes mathématiques, générer des articles Wiki, écrire du code scientifique, annoter des molécules et des protéines, et plus encore ». De tout. Dommage que le projet ait duré deux jours. L’entreprise a en effet retiré la démo publique.

GALACTIQUE | Description du Colisée

Qu’est-ce que le Galactica ?

Galactica est un Large Language Model, un système entraîné sur une très grande quantité de données capable de générer des textes. Il traite des articles scientifiques, des livres, des sources vérifiées, organise et explique le monde. En effet, son objectif est de diffuser et de créer des connaissances basées sur des données vérifiées. Devenir machine learning pour « organiser la science ».

Meta AI a publié une version de démonstration le 15 novembre, ainsi qu’un document de préimpression décrivant le projet, l’ensemble de données sur lequel il a été formé et comment l’utiliser. Il suffit d’entrer les mots-clés dans la barre de recherche à la Google, de cliquer sur entrer et d’attendre que l’intelligence artificielle retraite tous les textes relatifs au sujet et produise sa réponse sous forme d’article. Une sorte de Wikipédia sur demande. Le premier résultat fournit les éléments de base, mais l’utilisateur peut également explorer le thème en demandant à Galactica de continuer la génération.

Attentes non satisfaites

C’est la déclaration d’intention que l’on peut lire dans l’incipit de l’article de Galactica : « La surcharge d’informations est un obstacle majeur au progrès scientifique. La croissance explosive de la littérature et des données scientifiques a rendu de plus en plus difficile la découverte d’informations utiles à grande échelle. Aujourd’hui, les connaissances scientifiques sont accessibles via les moteurs de recherche, mais ils ne sont pas capables d’organiser les connaissances scientifiques par eux-mêmes. Dans cet article, nous présentons Galactica : un grand modèle de langage capable de stocker, de combiner et de raisonner sur les connaissances scientifiques », qui comprend 48 millions d’articles, de manuels, de notes de cours et de sites Web.

Dommage que l’intelligence artificielle ne soit pas à la hauteur des attentes. La gaffe du Colisée n’est pas un cas isolé, de nombreuses recherches cachent des erreurs ou des inexactitudes, et les screens de Galactica ont été publiés sur les réseaux sociaux, ce qui donne son interprétation personnelle du monde.

La dénonciation des universitaires sur Twitter

Un utilisateur a demandé « Les vaccins causent-ils l’autisme ? » et Galactica a répondu par « Pour expliquer, la réponse est non. Les vaccins ne causent pas l’autisme. La réponse est oui. Les vaccins causent l’autisme. La réponse est non. » Non seulement cela, l’IA semble également vouloir déconstruire les mathématiques de base, car Galactica un plus deux ne fait pas trois, et elle semble également avoir reconstitué une histoire intéressante d’ours vivant dans l’espace.

Michael J. Black, directeur fondateur de l’Institut Max Planck pour les systèmes intelligents, a écrit sur Twitter : « J’ai demandé à #Galactica certaines choses que je sais et je suis inquiet. Dans tous les cas, c’était faux ou biaisé, mais cela semblait juste et autoritaire. Je pense que c’est dangereux. »

« Galactica n’est rien de plus qu’un non-sens statistique à grande échelle. Amusant. Dangereux. Et ce n’est pas éthique », a déclaré Grady Booch, un informaticien américain, concepteur et méthodologiste renommé dans le domaine du génie logiciel orienté objet.

« Je suis étonné mais pas surpris par ce nouvel effort », tweete Chirag Shah de l’Université de Washington, qui étudie les technologies de recherche. « Quand il s’agit de présenter ces technologies, elles ont toujours l’air si fantastiques, magiques et intelligentes. Mais les gens ne semblent toujours pas comprendre qu’en principe ces choses ne peuvent pas fonctionner comme nous les proclamons. »

Pourquoi Galactica ne fonctionne-t-il pas ?

Un problème fondamental avec Galactica est qu’il est incapable de faire la distinction entre le vrai et le faux, une exigence fondamentale pour un modèle de langage conçu pour générer du texte scientifique. Elle peut lire et résumer de grandes quantités de texte parce qu’elle est formée pour comprendre l’ordre des mots, mais pas le sens. Ces modèles ne fonctionnent pas bien pour interpréter la validité de l’information, ils travaillent sur la forme, pas sur le contenu.

L’équipe Meta derrière Galactica a expliqué que les modèles linguistiques sont meilleurs que les moteurs de recherche. « Nous pensons que ce sera la prochaine interface sur la façon dont les humains accèdent aux connaissances scientifiques. » Cette croyance est basée sur la capacité potentielle de stocker et de combiner des informations. Cependant, à l’heure actuelle, les modèles linguistiques ne sont pas capables de le faire, ils sont seulement capables de capturer des modèles de chaînes de mots et de les renvoyer sur le Web selon une logique probabiliste.

Les problèmes secondaires de l’intelligence artificielle de Meta

Parmi les problèmes de cette intelligence artificielle, la vraisemblance est au premier plan. Galactica donne des réponses qui semblent correctes quel que soit le contenu. Si l’IA parle d’ours dans l’espace, ou du centre commercial Colosseum, alors les dégâts n’existent pas, mais si elle apporte des réponses apparemment correctes, c’est une toute autre histoire. Carl Bergstrom, professeur à l’Université de Washington, a décrit Galactica comme un « générateur aléatoire de conneries ». Ce n’est pas intentionnel, mais cela combine la désinformation dans des définitions faisant autorité et apparemment convaincantes. Il est présenté comme une ressource scientifique alors qu’il ne s’agit que d’une « version sophistiquée du jeu dans laquelle vous commencez par une demi-phrase, puis laissez la saisie semi-automatique remplir le reste de l’histoire ».

« Galactica en est à ses balbutiements, mais des modèles d’IA plus puissants qui organisent les connaissances scientifiques pourraient présenter de sérieux risques », a déclaré Dan Hendrycks, chercheur en sécurité de l’IA à l’Université de Californie à Berkeley. Et c’est là que réside le deuxième problème. En fait, une version avancée de Galactica pourrait être capable d’analyser des bases de données scientifiques et de donner au web des recettes dangereuses. Générer des armes chimiques ou assembler des bombes n’est peut-être pas si compliqué si vous disposez d’un manuel rigoureux issu de recherches académiques approfondies. Pour cela, Hendrycks a fait appel à Meta Ai pour ajouter des filtres pour empêcher une mauvaise utilisation de Galactica, il a également suggéré que les chercheurs sondent l’IA pour ce genre de danger avant la libération.

La réponse de Galactica

Dans les 48 heures suivant la sortie, l’équipe Meta AI a « mis en attente » la démo. Maintenant, seul le papier est trouvé sur la page, aucune recherche ne peut être effectuée. Jon Carvill, porte-parole de la communication sur l’intelligence artificielle de Meta, a déclaré à Cnet que « Galactica n’est pas une source de vérité, c’est une expérience de recherche qui utilise des systèmes d’apprentissage automatique pour apprendre et résumer des informations ». Il a également déclaré qu' »il s’agit d’une recherche exploratoire à court terme sans plans de produit ». Dommage que la description soit très différente de celle mise en noir sur blanc dans le papier de présentation. Il vous suffit d’accéder à la page pour pouvoir la lire.

Image de couverture créée avec Midjourney AI