ChatGPT o3 casse tous les tests de raisonnement et se rapproche de la redoutée singularité, mais il lui reste encore du chemin à parcourir

La dernière avancée d’OpenAI, le modèle o3 de ChatGPT, a franchi un cap historique en atteignant 75,7 % au test ARC Challenge. Les experts, bien que séduits par cette amélioration, soulignent que l’Intelligence Artificielle Générale reste un objectif lointain, malgré ces progrès impressionnants et les nouveaux défis à relever.

Le nouveau modèle d’OpenAI atteint des performances sans précédent lors du prestigieux test ARC Challenge, bien que les experts avertissent qu’il n’est pas encore AGI

ChatGPT o3 bat tous les tests de raisonnement et se rapproche de la redoutée singularité, mais il lui reste du chemin à parcourir — Le nouveau modèle de ChatGPT est un pas de plus vers la singularité, mais il reste encore beaucoup à faire

La nouvelle version de ChatGPT, dénommée modèle o3, a réalisé un exploit historique en obtenant un score de 75,7 % lors du prestigieux test de raisonnement ARC Challenge. Ce progrès représente un saut significatif dans les capacités de l’IA, dépassant les attentes de la communauté scientifique et se rapprochant de la performance humaine moyenne de 84 % pour ces tests de raisonnement visuel.

Les résultats sont d’autant plus impressionnants lorsque l’on retire les limitations de puissance de calcul. D’après New Scientist, en augmentant les ressources de traitement, le modèle o3 a atteint un étonnant 87,5 % d’efficacité, bien que cela ait fait grimper le coût par tâche de 20 $ à des milliers de dollars, dépassant les limites imposées pour remporter le prix officiel de 600 000 $.

Le chemin vers la superintelligence artificielle soulève de nouveaux défis et attentes

L’Intelligence Artificielle Générale (AGI) reste le Saint Graal de la recherche en IA. Bien que le modèle o3 représente une avancée significative, les experts adoptent une position prudente. François Chollet, créateur de l’ARC Challenge, souligne qu’il reste encore des tâches simples que le système ne peut pas accomplir, même avec une puissance de calcul massive.

Le test ARC Challenge, conçu en 2019, n’est pas simple : il évalue la capacité des IAs à repérer des motifs dans des paires de grilles colorées. Ce qui est intéressant dans ces épreuves, c’est qu’elles sont conçues pour éviter qu’une IA puisse les résoudre simplement par la force brute, établissant des limites à la puissance de calcul utilisable.

La course vers la singularité technologique se poursuit, et bien que les résultats soient encourageants, il reste des détails cruciaux à considérer. Le coût computationnel est un facteur clé : tandis que le test « semi-privé » autorise des dépenses jusqu’à 20 $ par tâche, le test « privé » plus difficile a une limite de seulement 10 cents par tâche, un défi que le modèle o3 n’a pas réussi à relever.

Pour vous donner une idée de la complexité du sujet, le modèle o3 a échoué à résoudre plus de 100 tâches visuelles, même avec une quantité massive de puissance de calcul déployée par OpenAI. L’écart entre le traitement massif et la véritable intelligence reste un sujet de débat au sein de la communauté scientifique.

Melanie Mitchell, de l’Institut Santa Fe au Nouveau-Mexique, soulève une critique pertinente : résoudre ces tâches par un simple pouvoir de calcul contredit l’objectif initial du test. Le véritable but est de concevoir des systèmes capables de raisonner de manière similaire aux humains, pas seulement de traiter des données de manière massive.

Chollet a formulé une proposition intéressante pour reconnaître l’avènement de la véritable AGI : ce sera le moment où il sera impossible de créer des tâches faciles pour les humains mais difficiles pour les IA. Pour l’instant, l’industrie technologique connaît un ralentissement dans le développement de modèles d’IA pour 2024, en comparaison avec les avancées explosives de 2023.

Alors que l’on attend le lancement officiel de o3 au début de 2025, les organisateurs de l’ARC Challenge mettent déjà en place un deuxième tour d’épreuves plus exigeantes. L’avenir s’annonce passionnant, mais pour l’heure, la véritable intelligence artificielle générale semble un objectif éloigné qui nécessitera bien plus que de la seule puissance de traitement.

ChatGPT o3 casse tous les tests de raisonnement et se rapproche de la redoutée singularité, mais il lui reste encore du chemin à parcourir

Le nouveau modèle d’OpenAI atteint des performances sans précédent lors du prestigieux test ARC Challenge, bien que les experts avertissent qu’il n’est pas encore AGI

Le chemin vers la superintelligence artificielle soulève de nouveaux défis et attentes

Offres JIMMY Prime Day : Grosses réduction sur les purificateurs d’eau et aspirateurs anti-acariens

Lymow One Plus : la tondeuse autonome aux doubles lames rotatives à -18% !

Jimmy : Aspirateurs anti-acariens indispensables en promo jusqu’au 26 juin !

Vous avez un iPhone 17 les 3 meilleures coques chargeur et protection dont vous avez besoin

Tu n’es pas fou, il y a une raison pour laquelle la batterie de ton téléphone tient moins longtemps en été

Tout ce que vous pouvez faire pour résoudre les problèmes de l’application Cita Sanitaria avant de vous décourager

Mole l’outil gratuit pour nettoyer optimiser et surveiller votre Mac

Photoshop, Lightroom et sept autres applications pour retoucher vos photos comme un pro

TEST UGREEN Maxidok 17 en 1 Thunderbolt 5 : Notre verdict sur la station d’accueil qui fait tout

TEST AFERIY P280 + Extension : Batterie de 4096Wh à 1439€, le meilleur rapport qualité-prix ?

TEST UGREEN Maxidok 10 en 1 Thunderbolt 5 pour Mac Mini : La station d’accueil parfaitement taillée ?