Le 30 juin 2026, Anthropic a lancé Claude Sonnet 5 (identifiant API claude-sonnet-5), disponible le jour même : modèle par défaut des plans Free et Pro, accessible aux comptes Max, Team et Enterprise, et actif dans Claude Code et sur la Claude Platform. Le pitch d'Anthropic est direct, « conçu pour être le modèle Sonnet le plus agentique à ce jour », un modèle qui « sait planifier, utiliser des outils comme des navigateurs et des terminaux, et fonctionner en autonomie à un niveau qui exigeait, il y a quelques mois encore, des modèles plus gros et plus chers ».
C'est une grosse promesse, et « le plus agentique » est du langage marketing, pas un fait mesuré. Nous avons donc fait ce que nous faisons toujours : remonter aux sources primaires, l'annonce officielle, la documentation des modèles, les pages de prix et la system card, et tout ranger en trois cases : faits vérifiés, benchmarks déclarés par l'éditeur et notre propre analyse. En résumé : les specs et les prix sont du solide, les benchmarks (tous issus de la system card d'Anthropic, sans aucun test indépendant publié à ce stade) placent Sonnet 5 étonnamment près du bien plus cher Opus 4.8, et pour quiconque construit des agents ou des outils de code, c'est probablement votre nouveau modèle par défaut. Voici les chiffres.
La fiche technique vérifiée
D'abord les faits qui ne se discutent pas, directement issus de la documentation d'Anthropic. Aucune invention, aucun arrondi arrangeant.
| Claude Sonnet 5, specs vérifiées | Détail |
|---|---|
| Identifiant API | claude-sonnet-5 (snapshot figé sans date ; AWS Bedrock anthropic.claude-sonnet-5, Google Cloud claude-sonnet-5) |
| Sortie | 30 juin 2026, disponible le jour même sur tous les plans et dans Claude Code |
| Fenêtre de contexte | 1 million de tokens |
| Sortie maximale | 128k tokens (jusqu'à 300k via l'en-tête beta du Batch) |
| Date de connaissances | Janvier 2026 (cutoff de connaissances et d'entraînement) |
| Entrée / sortie | Entrée texte et image avec vision, multilingue, sortie texte |
| Raisonnement | Adaptive thinking (toujours disponible), l'effort par défaut est « high » sur l'API et Claude Code |
| Latence | Rapide (positionné comme le meilleur équilibre vitesse-intelligence) |
Le point clé, c'est la combinaison : une fenêtre d'un million de tokens et une date de connaissances de janvier 2026 sur un modèle qu'Anthropic règle explicitement pour la vitesse et le travail agentique. C'est le profil du modèle de production, et ça compte, car les agents consomment des tokens par millions : le modèle sur lequel vous les faites tourner doit être à la fois capable et abordable.
Le prix : pas cher maintenant, un peu moins en septembre
C'est la partie qui rebat les cartes pour les développeurs. Le tarif standard de Claude Sonnet 5 est de 3 $ par million de tokens en entrée et 15 $ par million en sortie. Mais il y a une remise de lancement : 2 $ / 10 $ par million de tokens jusqu'au 31 août 2026, après quoi le standard 3 $ / 15 $ s'applique au 1er septembre. Le Batch est encore moins cher, 1 $ / 5 $ en lancement.
Pour voir à quel point c'est agressif, mettez-le face au reste de la gamme Claude actuelle. Sonnet 5 se situe à une fraction des paliers Opus et Fable tout en les égalant, on va le voir, sur plusieurs évaluations.
Prix de sortie par million de tokens, gamme Claude actuelle (plus bas = moins cher)
Source : documentation modèles et prix d'Anthropic, juin 2026 (vérifié). Prix de sortie par million de tokens. Une réserve honnête : des rapports indépendants notent que Sonnet 5 utilise un nouveau tokenizer qui produit un peu plus de tokens par requête, donc la remise de lancement est plus proche d'un coût neutre que d'une vraie division par deux face au Sonnet précédent.
| Modèle | Prix (entrée / sortie par MTok) | Contexte | Rôle |
|---|---|---|---|
| Haiku 4.5 | 1 $ / 5 $ | 200k | Le plus rapide, quasi frontière |
| Sonnet 5 | 3 $ / 15 $ (2 $ / 10 $ jusqu'au 31 août) | 1M | Meilleur équilibre vitesse + intelligence |
| Opus 4.8 | 5 $ / 25 $ | 1M | Le plus capable du palier Opus |
| Fable 5 | 10 $ / 50 $ | 1M | Le plus capable des modèles largement diffusés |
Les benchmarks : il rattrape Opus
Réserve importante : chaque chiffre ci-dessous vient de la system card d'Anthropic. Au moment d'écrire, le jour du lancement, aucune évaluation tierce indépendante (Artificial Analysis et consorts) n'avait publié son propre test. À considérer comme déclaré par l'éditeur, solide dans la tendance, mais pas encore confirmé indépendamment.
L'histoire que racontent les benchmarks est cohérente : Sonnet 5 est un vrai bond générationnel face à Sonnet 4.6, et sur plusieurs évaluations il se pose à quelques points d'Opus 4.8, un modèle presque deux fois plus cher en sortie. Sur le benchmark de code agentique SWE-bench Pro, la progression est nette.
SWE-bench Pro, code agentique (déclaré par l'éditeur, plus haut = mieux)
Source : system card Claude Sonnet 5 via The Decoder, juin 2026 (déclaré par l'éditeur). Sonnet 5 comble l'essentiel de l'écart avec Opus 4.8 à une fraction du prix de sortie.
C'est encore plus serré sur les évaluations plus larges et plus coûteuses. Regardez où Sonnet 5 égale pour ainsi dire Opus 4.8 malgré l'écart de prix.
| Benchmark (déclaré par l'éditeur) | Sonnet 5 | Sonnet 4.6 | Opus 4.8 |
|---|---|---|---|
| SWE-bench Pro (code agentique) | 63,2 % | 58,1 % | 69,2 % |
| Terminal-Bench 2.1 | 80,4 % | 67,0 % | non communiqué |
| OSWorld-Verified (computer use) | 81,2 % | 78,5 % | non communiqué |
| Humanity's Last Exam (avec outils) | 57,4 % | non communiqué | 57,9 % |
| GDPval-AA v2 (travail de connaissance) | 1 618 pts | non communiqué | 1 615 pts |
Relisez ces deux dernières lignes. Sur Humanity's Last Exam avec outils (57,4 % contre 57,9 %) et sur l'évaluation de travail de connaissance GDPval (1 618 contre 1 615 points), Sonnet 5 est au coude-à-coude avec Opus 4.8, à 15 $ de sortie contre 25 $ pour Opus. C'est toute la thèse de cette sortie en deux chiffres. Le bond de Terminal-Bench, de 67 % à 80,4 % en une seule génération de Sonnet, est l'autre point marquant : un vrai progrès pour exécuter des choses dans un vrai terminal, c'est-à-dire exactement ce que font les agents.
Qui l'utilise déjà
L'annonce s'appuie sur des clients nommés plutôt que sur des éloges anonymes, et la liste est parlante, car plusieurs d'entre eux sont précisément les outils de code IA qu'on présente d'habitude comme une menace pour les acteurs établis. Anthropic cite Replit (« gère bien le code soutenu, l'usage d'outils et le débogage »), Cursor (excellent sur le « code brownfield » avec des corrections robustes), Lovable (« fait plus avec moins » et « refuse proprement les requêtes dangereuses »), Salesforce (a mené de bout en bout des automatisations multi-étapes qui calaient avant), plus ClickHouse, Eve et Pace. Quand les entreprises qui construisent des produits agentiques s'alignent dès le premier jour, c'est un signal : le modèle est réglé pour exactement cette charge de travail.
Les réserves à garder en tête
C'est une sortie solide, mais un billet de lancement ne commence pas par les astérisques.
- Les benchmarks sont ceux d'Anthropic. Chaque chiffre vient de la system card. Aucun évaluateur indépendant n'avait publié de test au lancement. Les chiffres sont probablement justes dans la tendance, mais attendez une confirmation tierce avant de les tenir pour acquis.
- Le prix bas a une date de péremption. Le tarif de lancement 2 $ / 10 $ se termine le 31 août 2026. Dès le 1er septembre, c'est 3 $ / 15 $, soit 50 % de plus des deux côtés. Budgétez le prix standard, pas celui de lancement.
- Un nouveau tokenizer brouille les économies. Des rapports indépendants notent que Sonnet 5 découpe le texte en un peu plus de tokens que le Sonnet précédent : pour une même tâche, le coût réel est plus proche du neutre que ne le suggère la remise affichée. Mesurez votre propre charge.
- « Le Sonnet le plus agentique » et « proche d'Opus » sont la formulation d'Anthropic. Les données soutiennent un modèle solide, mais les superlatifs marketing ne sont pas des verdicts indépendants.
Notre lecture : est-ce le nouveau défaut des développeurs ?
Ce qui suit est notre analyse.
Pour la plupart des charges de code et d'agents, oui, Sonnet 5 devient le défaut raisonnable, et la raison est le rapport coût-performance, pas l'intelligence de pointe brute. Si un modèle finit à quelques points derrière Opus 4.8 sur le benchmark de code le plus dur mais l'égale sur le travail de connaissance et le raisonnement par outils, tout en coûtant 60 % d'Opus en sortie (et bien moins pendant la fenêtre de lancement), alors pour la réalité gourmande en tokens des agents, le calcul penche vers Sonnet 5. On réserve Opus 4.8 et Fable 5 au raisonnement vraiment le plus difficile, et on fait passer le gros du trafic agent sur Sonnet 5.
Le point plus profond, celui que nous martelons dans cette série, c'est que le modèle est un composant interchangeable, pas le produit. La bonne architecture place le modèle derrière votre propre abstraction, pour passer de Sonnet 4.6 à Sonnet 5, ou à un modèle à poids ouverts moins cher quand la qualité le permet, par un simple changement de configuration plutôt que par une refonte. C'est ainsi qu'on capte une sortie comme celle-ci dès le premier jour plutôt qu'un trimestre plus tard. C'est exactement ainsi que nous construisons des fonctionnalités IA pour nos clients : choisies tâche par tâche selon la qualité, le coût et la gouvernance, sur une infrastructure que vous maîtrisez (voir nos réalisations). Si vous voulez de l'aide pour transformer Claude Sonnet 5 en agents et en fonctionnalités qui partent vraiment en production, avec une stack capable d'intégrer le meilleur modèle dès qu'arrive le suivant, parlez-nous de votre projet ou contactez-nous, nous répondons sous 48 heures. Pour aller plus loin sur le paysage des modèles qui bouge vite, lisez nos décryptages de GLM-5.2, le meilleur LLM à poids ouverts, du rachat de Cursor (un client cité de Sonnet 5) par SpaceX pour 60 milliards, et de Figma Motion face à la vague de l'IA dans le design.
Chiffres clés (au 30 juin 2026)
- 30 juin 2026 sortie de Claude Sonnet 5, disponible le jour même, identifiant
claude-sonnet-5. - 3 $ / 15 $ prix standard par million de tokens, avec un tarif de lancement 2 $ / 10 $ jusqu'au 31 août 2026.
- 1 million de tokens de contexte, 128k de sortie maximale, connaissances arrêtées en janvier 2026.
- 63,2 % sur SWE-bench Pro (déclaré par l'éditeur), contre 58,1 % pour Sonnet 4.6 et 69,2 % pour Opus 4.8.
- 57,4 % contre 57,9 % Sonnet 5 face à Opus 4.8 sur Humanity's Last Exam avec outils, au coude-à-coude.
- 80,4 % sur Terminal-Bench 2.1, contre 67,0 % pour Sonnet 4.6.



