ChatGPT écrasé aux échecs par un Atari 2600 à 1 MHz !

Une récente expérience a mis en lumière les limites des modèles de langage grand format, révélant qu’ils ne rivalisent même pas avec des technologies plus anciennes. Dans un affrontement contre un Atari 2600, ChatGPT s’est retrouvé en difficulté, offrant un aperçu saisissant des défis que pose l’intelligence artificielle contemporaines.

Une émulation exacte du CPU Atari 2600, fonctionnant à un rythme modeste de 1,19 MHz, s’est avérée plus que suffisante pour écraser ChatGPT dans une partie d’échecs. L’ingénieur Citrix Robert Jr. Caruso a mené cette expérience « drôle » durant le week-end, opposant le puissant chatbot d’OpenAI à une console Atari 2600 virtuelle émulée par Stella. Le résultat fut désastreux pour le chatbot.

Caruso a apparemment eu l’idée de ce test en discutant avec ChatGPT sur l’histoire de l’IA et des échecs. Le service d’OpenAI a proposé de jouer aux « échecs Atari », que Caruso a supposé désigner Video Chess, le seul titre d’échecs jamais sorti sur Atari 2600.

Malgré un schéma de base du plateau pour identifier les versions, ChatGPT a montré des difficultés. Le bot a confondu les tours avec les fous, a manqué des fourchettes de pions évidentes et a commis une série d’erreurs déconcertantes, selon Caruso. À un moment donné, ChatGPT a même attribué son incapacité à suivre l’état du jeu à des facteurs externes, tel que les symboles abstraits utilisés par Video Chess pour représenter les versions.

« Pendant 90 minutes, j’ai dû l’empêcher de faire de mauvais coups et corriger sa perception du plateau plusieurs fois par tour », a déclaré l’ingénieur à propos de la performance de ChatGPT contre un CPU émulé des années 70.

Le bot a apparemment continué à demander à recommencer la partie dans l’espoir d’améliorer ses performances, mais a finalement été vaincu par un moteur d’échecs de 8 bits. Un CPU à 1 MHz devrait, au mieux, être capable de penser un ou deux coups en avance, tandis que ChatGPT dépend d’une armée moderne de GPU énergivores pour faire fonctionner son service de chat. Pourtant, le CPU à 1 MHz a triomphé, dominant le chatbot au niveau débutant.

L’expérience de Caruso rappelle bien ce qu’est réellement le modèle LLM : un moteur de recherche complexe basé sur des heuristiques, conçu pour satisfaire les utilisateurs avec un résultat d’une forme ou d’une autre. Ils ne « savent » rien, n’ont aucune capacité de raisonnement ou de déduction, et n’ont certainement pas d’intelligence propre. Et, forcément, ils sont mauvais aux échecs.

Je n’ai jamais possédé d’Atari 2600 à l’époque, mais j’ai passé de belles après-midis avec ma puissante console Intellivision. La prochaine fois, je vais tenter d’humilier ChatGPT en le faisant jouer à une partie de Battle Chess sur une réplique émulée de ma première machine x86 : un 80286 fonctionnant à un incroyable 16 MHz.

ChatGPT écrasé aux échecs par un Atari 2600 à 1 MHz !

Offres JIMMY Prime Day : Grosses réduction sur les purificateurs d’eau et aspirateurs anti-acariens

Lymow One Plus : la tondeuse autonome aux doubles lames rotatives à -18% !

Jimmy : Aspirateurs anti-acariens indispensables en promo jusqu’au 26 juin !

Comment empêcher Instagram d’utiliser vos photos pour alimenter son intelligence artificielle

Attendre le nouveau Google Pixel 11 vaut déjà le coup pour ce seul changement

Des scientifiques ont équipé des pigeons de caméras pour faire avancer la technologie

La version Sève de Pin du Google Pixel 11 Pro Fold fuite avant même son lancement

7 câbles USB-C à charge rapide qui préserveront votre téléphone portable

TEST UGREEN Maxidok 17 en 1 Thunderbolt 5 : Notre verdict sur la station d’accueil qui fait tout

TEST AFERIY P280 + Extension : Batterie de 4096Wh à 1439€, le meilleur rapport qualité-prix ?

TEST UGREEN Maxidok 10 en 1 Thunderbolt 5 pour Mac Mini : La station d’accueil parfaitement taillée ?