OpenAI frappe fort. GPT-5.4 est disponible dès aujourd'hui dans ChatGPT (sous le nom GPT-5.4 Thinking), dans l'API et dans Codex. C'est le modèle frontier le plus performant et le plus efficace jamais produit par OpenAI pour le travail professionnel. La version GPT-5.4 Pro est aussi disponible pour ceux qui veulent le maximum de performance sur les tâches les plus complexes.
Ce que GPT-5.4 change concrètement
GPT-5.4 réunit le meilleur des avancées récentes d'OpenAI en un seul modèle. Il intègre les capacités de coding de GPT-5.3-Codex tout en améliorant considérablement le travail avec les outils, les environnements logiciels et les tâches professionnelles impliquant tableurs, présentations et documents.
Le résultat : un modèle qui accomplit le travail complexe avec précision et efficacité, en livrant ce que vous avez demandé avec moins d'allers-retours. Fini les 3 relances pour obtenir le bon format de tableur ou la bonne mise en page.
1 million de tokens : une mémoire enfin à la hauteur
GPT-5.4 supporte jusqu'à 1 million de tokens de contexte, soit plus du double des 400 000 tokens de GPT-5.2. Concrètement, le modèle peut ingérer des bases de code entières, des bibliothèques de documentation complètes ou de longs échanges de conversation sans perdre le fil.
Cette mémoire étendue s'accompagne d'une bien meilleure rétention : GPT-5.4 se souvient de vos consignes et du contexte sur de longues sessions. Les oublis de directives après 20 messages, c'est terminé. Pour les développeurs utilisant Codex, c'est un changement majeur : le modèle peut planifier, exécuter et vérifier des tâches sur de longues séquences.
Raisonnement 'extrême' : le mode xhigh
GPT-5.4 introduit un nouveau niveau de raisonnement appelé xhigh. Ce mode alloue beaucoup plus de ressources à la réflexion avant de répondre, une stratégie de calcul lent qui s'avère décisive pour les sujets pointus, les analyses complexes et les tâches multi-étapes.
Dans ChatGPT, GPT-5.4 Thinking peut désormais présenter un plan de réflexion en amont, ce qui vous permet d'ajuster sa direction en cours de route pendant qu'il travaille. Vous obtenez un résultat final plus aligné avec vos attentes sans avoir à relancer la conversation.
Computer Use : GPT-5.4 contrôle votre ordinateur
C'est la nouveauté la plus spectaculaire. GPT-5.4 est le premier modèle généraliste d'OpenAI avec des capacités natives d'utilisation d'ordinateur. Il peut naviguer sur le web, remplir des formulaires, envoyer des emails, manipuler des interfaces, le tout en interprétant des captures d'écran et en envoyant des commandes clavier/souris.
Sur OSWorld-Verified, qui mesure la capacité d'un modèle à naviguer dans un environnement desktop, GPT-5.4 atteint 75,0% de réussite, pulvérisant les 47,3% de GPT-5.2 et dépassant la performance humaine de 72,4%. On parle d'un modèle qui est littéralement meilleur qu'un humain moyen pour utiliser un ordinateur via screenshots.
| Benchmark | GPT-5.4 | GPT-5.2 | Humain |
|---|---|---|---|
| OSWorld-Verified (desktop) | 75,0% | 47,3% | 72,4% |
| WebArena-Verified (navigateur) | 67,3% | 65,4% | - |
| Online-Mind2Web (navigateur) | 92,8% | - | - |
Performances computer use de GPT-5.4
Travail professionnel : tableurs, présentations, documents
OpenAI a mis un accent particulier sur l'amélioration des capacités de GPT-5.4 à créer et éditer des tableurs, présentations et documents. Sur un benchmark interne de tâches de modélisation tableur (niveau analyste junior en banque d'investissement), GPT-5.4 obtient un score de 87,3%, contre 68,4% pour GPT-5.2.
Pour les présentations, les évaluateurs humains ont préféré les slides de GPT-5.4 dans 68% des cas par rapport à GPT-5.2, grâce à une meilleure esthétique, plus de variété visuelle et une utilisation plus efficace de la génération d'images.
Sur GDPval, qui teste les capacités des agents sur des tâches de travail réel dans 44 métiers, GPT-5.4 établit un nouveau record : il égale ou surpasse les professionnels du secteur dans 83% des comparaisons, contre 70,9% pour GPT-5.2.
Moins d'hallucinations, plus de précision
GPT-5.4 est le modèle le plus factuel d'OpenAI. Sur un ensemble de requêtes où les utilisateurs avaient signalé des erreurs factuelles, les affirmations individuelles de GPT-5.4 sont 33% moins susceptibles d'être fausses et ses réponses complètes sont 18% moins susceptibles de contenir la moindre erreur, par rapport à GPT-5.2.
Coding : fusion des forces de GPT-5.3-Codex
GPT-5.4 fusionne les capacités de coding de GPT-5.3-Codex avec ses propres forces en raisonnement et computer use. Il égale ou surpasse GPT-5.3-Codex sur SWE-Bench Pro (57,7% vs 56,8%) tout en étant plus rapide à tous les niveaux de raisonnement.
Le mode /fast dans Codex offre jusqu'à 1,5x la vitesse de génération de tokens avec GPT-5.4. Même modèle, même intelligence, juste plus rapide. OpenAI note aussi que le modèle excelle sur les tâches frontend complexes, avec des résultats visuellement plus aboutis que tout ce qu'ils ont lancé précédemment.
Tool Search : gérer des milliers d'outils intelligemment
GPT-5.4 introduit Tool Search, une fonctionnalité qui change la donne pour les workflows agentiques. Auparavant, toutes les définitions d'outils étaient incluses dans le prompt, ce qui pouvait ajouter des dizaines de milliers de tokens à chaque requête. Avec Tool Search, le modèle reçoit une liste légère des outils disponibles et ne charge la définition complète que quand il en a besoin.
Résultat sur le benchmark MCP Atlas avec 36 serveurs MCP : 47% de tokens en moins pour la même précision. Pour les serveurs MCP avec des dizaines de milliers de tokens de définitions d'outils, les gains sont considérables.
Les benchmarks en détail
| Benchmark | GPT-5.4 | GPT-5.4 Pro | GPT-5.2 |
|---|---|---|---|
| GDPval (travail pro) | 83,0% | 82,0% | 70,9% |
| SWE-Bench Pro (coding) | 57,7% | - | 55,6% |
| OSWorld (computer use) | 75,0% | - | 47,3% |
| BrowseComp (recherche web) | 82,7% | 89,3% | 65,8% |
| Toolathlon (outils) | 54,6% | - | 45,7% |
| ARC-AGI-2 (raisonnement) | 73,3% | 83,3% | 52,9% |
| GPQA Diamond (science) | 92,8% | 94,4% | 92,4% |
| Humanity's Last Exam | 52,1% | 58,7% | 45,5% |
Performances de GPT-5.4 vs GPT-5.2 sur les principaux benchmarks
Prix et disponibilité
GPT-5.4 Thinking est disponible dès aujourd'hui pour les abonnés ChatGPT Plus, Team et Pro, en remplacement de GPT-5.2 Thinking. Ce dernier restera accessible pendant 3 mois dans la section Legacy Models avant d'être retiré le 5 juin 2026. GPT-5.4 Pro est réservé aux plans Pro et Enterprise.
| Modèle API | Prix input | Input caché | Prix output |
|---|---|---|---|
| gpt-5.2 | 1,75$ / M tokens | 0,175$ / M tokens | 14$ / M tokens |
| gpt-5.4 | 2,50$ / M tokens | 0,25$ / M tokens | 15$ / M tokens |
| gpt-5.4-pro | 30$ / M tokens | - | 180$ / M tokens |
Tarification API de GPT-5.4
GPT-5.4 coûte plus cher au token que GPT-5.2, mais sa plus grande efficacité en tokens réduit le nombre total de tokens nécessaires pour beaucoup de tâches. Les tarifs Batch et Flex sont disponibles à moitié prix.
Ce que ça change pour les utilisateurs de ChatGPT
Pour l'utilisateur quotidien de ChatGPT, GPT-5.4 apporte trois améliorations majeures : des réponses plus précises et moins d'hallucinations, un meilleur suivi du contexte sur de longues conversations, et la possibilité de voir et ajuster le plan de réflexion du modèle en cours de route.
Pour les développeurs et les professionnels, c'est le computer use et le Tool Search qui changent la donne. La capacité de créer des agents qui naviguent sur le web, remplissent des formulaires et enchainent des tâches complexes de manière autonome ouvre des possibilités qui étaient jusqu'ici réservées à des solutions sur mesure.
La course aux modèles ne ralentit pas
Avec GPT-5.4, OpenAI répond directement à la pression de la concurrence. Claude d'Anthropic progresse sur le raisonnement et le coding, Gemini de Google pousse sur le multimodal et le contexte long, et DeepSeek continue de surprendre sur l'efficacité. Ce lancement est clairement une tentative de reconquérir le terrain perdu ces derniers mois.
La vraie question reste celle de la durabilité de l'avance. GPT-5.4 est impressionnant aujourd'hui, mais dans un marché où un nouveau modèle frontier sort chaque semaine, combien de temps ces benchmarks resteront-ils au sommet ?
Outils mentionnés dans cet article
Sources et références
Sources officielles :
- OpenAI - Introducing GPT-5.4 - openai.com
- OpenAI API Platform - GPT-5.4 - platform.openai.com
- Clubic - GPT-5.4 - clubic.com
Retrouvez nos fiches détaillées :
Suivez l'actualité IA
Recevez les dernières nouvelles sur les modèles IA, les lancements et les innovations qui comptent.
Pas de spam. Desinscription en 1 clic.
- ChatGPT
- Claude
- Gemini
- GitHub Copilot
- Cursor
- [Perplexity AI](/perplexity-ai)





