OpenAI dévoile GPT-5.4, le modèle le plus puissant : il gère votre ordinateur à votre place

OpenAI lanza GPT-5.4, su modelo más potente: es el primero capaz de controlar un ordenador por ti

OpenAI a dévoilé GPT-5.4, un modèle d’intelligence artificielle innovant, capable d’interagir avec des applications et sites web comme un utilisateur humain. Doté de performances impressionnantes et d’outils de planification avancés, il surpasse largement ses prédécesseurs en matière de productivité et d’efficacité.

OpenAI devoile GPT 54 le modele le plus puissant il

OpenAI a récemment introduit GPT-5.4, son modèle d’intelligence artificielle le plus avancé à ce jour. La société le qualifie de système le plus performant et efficace, disponible sur ChatGPT, l’API et sa plateforme Codex. Ce qui distingue cette version des précédentes est une fonctionnalité unique : GPT-5.4 est le premier modèle généraliste d’OpenAI capable de contrôler un ordinateur nativement, interagissant avec des sites et des applications comme le ferait un utilisateur humain.

Deux variantes ont été lancées. GPT-5.4 Thinking est accessible aux abonnés de ChatGPT Plus, Team et Pro, tandis que GPT-5.4 Pro est réservé aux plans Pro et Enterprise. La version Thinking présente un plan préalable de son raisonnement avant de commencer, ce qui permet à l’utilisateur d’ajuster la réponse en cours de route sans avoir à redémarrer.

Les chiffres accompagnant ce lancement sont impressionnants. Dans le benchmark OSWorld-Verified, qui évalue la capacité d’un modèle à opérer dans un environnement de bureau réel via des captures d’écran et commandes clavier, GPT-5.4 atteint un taux de réussite de 75 %, dépasse le rendement humain enregistré de 72,4 %. Son prédécesseur, GPT-5.2, ne dépassait pas 47,3 %.

Le modèle qui fonctionne comme un professionnel

Selon le blog officiel d’OpenAI, GPT-5.4 est conçu pour des tâches de compétence professionnelle. Dans le test GDPval, qui évalue la capacité des agents IA à produire un travail réel dans 44 professions, le modèle égale ou surpasse les professionnels humains dans 83 % des comparaisons. Les tâches vont des présentations commerciales aux feuilles de calcul comptables. L’ancien modèle GPT-5 avait déjà placé la barre haute, mais cette itération l’élève considérablement.

OpenAI a mis l’accent sur l’amélioration des travaux sur les feuilles de calcul et présentations. Dans un benchmark interne de modélisation financière, GPT-5.4 obtient un score de 87,3 %, contre 68,4 % pour GPT-5.2. Lors des évaluations des présentations, les évaluateurs humains ont préféré les résultats de GPT-5.4 dans 68 % des cas en raison de meilleure esthétique et plus de diversité visuelle. La société souligne également que les affirmations du modèle ont 33 % de chances de moins d’être fausses. Lorsque Anthropic a présenté son système de contrôle d’ordinateur en 2024, cela a ouvert la voie que GPT-5.4 explore désormais plus en profondeur.

Outils, contexte et efficacité inédits

Dans l’API, GPT-5.4 supporte des fenêtres de contexte atteignant un million de tokens, la plus grande taille proposée par OpenAI. Cela permet aux agents de planifier et de vérifier des tâches sur de longues périodes. De plus, il introduit Tool Search, qui permet au modèle de rechercher des définitions d’outils à la demande. Lors d’essais avec 250 tâches du benchmark MCP Atlas sur 36 serveurs, cette configuration a réduit la consommation totale de tokens de 47 % tout en maintenant la même précision. L’agent ChatGPT lancé l’an dernier pointait déjà dans cette direction, et avec GPT-5.4, OpenAI se trouve en concurrence avec des rivaux comme Gemini 3 de Google, qui intègre également des fonctions d’utilisation d’ordinateur.

En programmation, GPT-5.4 hérite des capacités de GPT-5.3-Codex et égalise ou surpasse ses performances dans SWE-Bench Pro avec une latence réduite. Le modèle améliore également la recherche web : dans BrowseComp, il atteint 82,7 % contre 65,8 % pour GPT-5.2. En termes de prix, il coûte 2,50 dollars par million de tokens d’entrée et 15 dollars par million de sortie, Légèrement au-dessus de GPT-5.2, bien qu’OpenAI affirme que l’efficacité accrue du modèle compense cette hausse en nécessitant moins de tokens pour réaliser les mêmes tâches.