OpenAI dévoile GPT-5.4, le modèle le plus puissant : il gère votre ordinateur à votre place

OpenAI a dévoilé GPT-5.4, un modèle d’intelligence artificielle innovant, capable d’interagir avec des applications et sites web comme un utilisateur humain. Doté de performances impressionnantes et d’outils de planification avancés, il surpasse largement ses prédécesseurs en matière de productivité et d’efficacité.

OpenAI a récemment introduit GPT-5.4, son modèle d’intelligence artificielle le plus avancé à ce jour. La société le qualifie de système le plus performant et efficace, disponible sur ChatGPT, l’API et sa plateforme Codex. Ce qui distingue cette version des précédentes est une fonctionnalité unique : GPT-5.4 est le premier modèle généraliste d’OpenAI capable de contrôler un ordinateur nativement, interagissant avec des sites et des applications comme le ferait un utilisateur humain.

Deux variantes ont été lancées. GPT-5.4 Thinking est accessible aux abonnés de ChatGPT Plus, Team et Pro, tandis que GPT-5.4 Pro est réservé aux plans Pro et Enterprise. La version Thinking présente un plan préalable de son raisonnement avant de commencer, ce qui permet à l’utilisateur d’ajuster la réponse en cours de route sans avoir à redémarrer.

Les chiffres accompagnant ce lancement sont impressionnants. Dans le benchmark OSWorld-Verified, qui évalue la capacité d’un modèle à opérer dans un environnement de bureau réel via des captures d’écran et commandes clavier, GPT-5.4 atteint un taux de réussite de 75 %, dépasse le rendement humain enregistré de 72,4 %. Son prédécesseur, GPT-5.2, ne dépassait pas 47,3 %.

Le modèle qui fonctionne comme un professionnel

Selon le blog officiel d’OpenAI, GPT-5.4 est conçu pour des tâches de compétence professionnelle. Dans le test GDPval, qui évalue la capacité des agents IA à produire un travail réel dans 44 professions, le modèle égale ou surpasse les professionnels humains dans 83 % des comparaisons. Les tâches vont des présentations commerciales aux feuilles de calcul comptables. L’ancien modèle GPT-5 avait déjà placé la barre haute, mais cette itération l’élève considérablement.

OpenAI a mis l’accent sur l’amélioration des travaux sur les feuilles de calcul et présentations. Dans un benchmark interne de modélisation financière, GPT-5.4 obtient un score de 87,3 %, contre 68,4 % pour GPT-5.2. Lors des évaluations des présentations, les évaluateurs humains ont préféré les résultats de GPT-5.4 dans 68 % des cas en raison de meilleure esthétique et plus de diversité visuelle. La société souligne également que les affirmations du modèle ont 33 % de chances de moins d’être fausses. Lorsque Anthropic a présenté son système de contrôle d’ordinateur en 2024, cela a ouvert la voie que GPT-5.4 explore désormais plus en profondeur.

Outils, contexte et efficacité inédits

Dans l’API, GPT-5.4 supporte des fenêtres de contexte atteignant un million de tokens, la plus grande taille proposée par OpenAI. Cela permet aux agents de planifier et de vérifier des tâches sur de longues périodes. De plus, il introduit Tool Search, qui permet au modèle de rechercher des définitions d’outils à la demande. Lors d’essais avec 250 tâches du benchmark MCP Atlas sur 36 serveurs, cette configuration a réduit la consommation totale de tokens de 47 % tout en maintenant la même précision. L’agent ChatGPT lancé l’an dernier pointait déjà dans cette direction, et avec GPT-5.4, OpenAI se trouve en concurrence avec des rivaux comme Gemini 3 de Google, qui intègre également des fonctions d’utilisation d’ordinateur.

En programmation, GPT-5.4 hérite des capacités de GPT-5.3-Codex et égalise ou surpasse ses performances dans SWE-Bench Pro avec une latence réduite. Le modèle améliore également la recherche web : dans BrowseComp, il atteint 82,7 % contre 65,8 % pour GPT-5.2. En termes de prix, il coûte 2,50 dollars par million de tokens d’entrée et 15 dollars par million de sortie, Légèrement au-dessus de GPT-5.2, bien qu’OpenAI affirme que l’efficacité accrue du modèle compense cette hausse en nécessitant moins de tokens pour réaliser les mêmes tâches.

OpenAI dévoile GPT-5.4, le modèle le plus puissant : il gère votre ordinateur à votre place

Le modèle qui fonctionne comme un professionnel

Outils, contexte et efficacité inédits

Offres JIMMY Prime Day : Grosses réduction sur les purificateurs d’eau et aspirateurs anti-acariens

Lymow One Plus : la tondeuse autonome aux doubles lames rotatives à -18% !

Jimmy : Aspirateurs anti-acariens indispensables en promo jusqu’au 26 juin !

Mole l’outil gratuit pour nettoyer optimiser et surveiller votre Mac

Photoshop, Lightroom et sept autres applications pour retoucher vos photos comme un pro

China réussit à récupérer sa fusée ! La suprématie spatiale de Elon Musk menacée

Design et caractéristiques du Redmi Note 17 dévoilés avant son lancement

Les États-Unis autorisent un satellite géant pour réfléchir les rayons du soleil vers la Terre

TEST UGREEN Maxidok 17 en 1 Thunderbolt 5 : Notre verdict sur la station d’accueil qui fait tout

TEST AFERIY P280 + Extension : Batterie de 4096Wh à 1439€, le meilleur rapport qualité-prix ?

TEST UGREEN Maxidok 10 en 1 Thunderbolt 5 pour Mac Mini : La station d’accueil parfaitement taillée ?