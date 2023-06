La vue d’ensemble : Bien avant les récents exploits d’OpenAI et d’autres systèmes d’IA générative, Demis Hassabis travaillait sur des algorithmes « intelligents » très puissants au sein du laboratoire DeepMind de Google. Aujourd’hui, le chercheur britannique laisse entrevoir une nouvelle étape dans l’évolution de l’IA.

Gemini, le dernier produit d’IA sur lequel travaillent les chercheurs de DeepMind, semble faire honte à ChatGPT. Demis Hassabis, PDG et cofondateur du laboratoire de recherche britannique sur l’IA racheté par Google en 2014, affirme que les capacités de Gemini iront au-delà de ce qu’OpenAI propose actuellement aux entreprises et aux utilisateurs, grâce à son expérience du jeu de société Go.

Gemini héritera de ses capacités supposées supérieures d’AlphaGo, l’intelligence artificielle qui a obtenu une victoire historique contre un champion (humain) du jeu de Go en 2016. Gemini se comportera comme un grand modèle de langage (LLM) de type ChatGPT, mais il aura également des capacités avancées telles que la planification ou la résolution de problèmes grâce à l’algorithme d’AlphaGo développé précédemment.

Selon M. Hassabis, Gemini peut être considéré comme une combinaison de certains des points forts des systèmes de type AlphaGo et des « capacités linguistiques étonnantes » des chatbots basés sur des LLM. Les utilisateurs (et probablement les clients) seront en mesure de fournir une invite textuelle, et l’IA répondra – tout en apprenant les meilleures stratégies pour satisfaire pleinement les besoins des utilisateurs.

Gemini est encore en cours de développement et sa réalisation prendra probablement plusieurs mois. Le projet, qui pourrait coûter des dizaines, voire des centaines de millions de dollars, utilisera des techniques d’IA avancées développées pour AlphaGo, telles que l’apprentissage par renforcement et la recherche arborescente.

L’apprentissage par renforcement fait référence à la capacité des logiciels à apprendre comment résoudre des problèmes stratégiques, comme choisir le prochain coup dans un match de Go ou jouer à un jeu vidéo. La recherche arborescente est une méthode permettant d’explorer et de mémoriser les prochains mouvements possibles sur un plateau de jeu.

Les systèmes LLM actuels sont limités dans leur capacité à apprendre de nouvelles choses ou même à « s’adapter » à des problèmes stratégiques et complexes, car ils s’appuient uniquement sur des techniques de recherche de modèles pour essayer de prédire les bribes de texte les plus significatives d’un point de vue statistique pour répondre à l’invite d’un utilisateur. Il n’y a absolument rien d' »intelligent » là-dedans, même si les résultats de ces IA génératives limitées peuvent être impressionnants si vous n’avez pas besoin de responsabilité, de fiabilité ou simplement d’exactitude factuelle.

L’apprentissage par renforcement basé sur le feedback, qui est l’une des techniques améliorées par les chercheurs de DeepMind au cours de ces dernières années, pourrait grandement améliorer les performances du LLM et donner à Gemini l’avantage sur ses concurrents.

M. Hassabis affirme que « 80 à 90 % des innovations » que nous observons actuellement dans ChatGPT et d’autres systèmes d’IA proviennent de DeepMind et Brain, les unités de recherche en IA de Google qui ont été regroupées au sein de la division Google DeepMind. Avec Gemini, Mountain View pourrait à nouveau retrouver sa suprématie dans la course à l’IA.

Découvrez le reportage du mois (sous-titré en français), l’IA gagnera t-elle face aux champion du monde du jeu de Go ? :