Depuis ce matin, 9 juin 2026, il existe un palier de modèles Claude au-dessus d'Opus. Anthropic vient de lancer Claude Fable 5, premier modèle de classe « Mythos » accessible à tous, et l'a inclus sans surcoût dans les abonnements Pro, Max, Team et Enterprise jusqu'au 22 juin. Pour un dirigeant de PME ou un responsable IT, la question n'est pas de savoir si ce modèle est impressionnant, il l'est, les chiffres suivent, mais ce qu'il faut en faire concrètement : quels cas d'usage tester, combien cela coûte vraiment, comment l'intégrer via l'API, et ce que la nouvelle politique de rétention des données change pour une entreprise européenne.
Cet article répond à ces questions opérationnelles, calculs de coûts à l'appui. Pour le panorama complet du lancement, la classe Mythos, le Project Glasswing, les capacités scientifiques de Mythos 5 et le détail des safeguards, lisez notre guide complet de Claude Fable 5 et Mythos 5. Ici, on parle budget, intégration et stratégie d'adoption.
Que change Claude Fable 5 concrètement pour une PME ou une ETI ?
L'annonce d'Anthropic positionne Fable 5 à l'état de l'art sur la quasi-totalité des benchmarks testés : ingénierie logicielle, travail de la connaissance, vision, recherche scientifique. Le point clé pour une entreprise tient en une phrase de l'annonce : plus la tâche est longue et complexe, plus l'avance de Fable 5 sur les autres modèles est grande. Autrement dit, ce modèle ne se justifie pas pour répondre à un email, il se justifie pour les travaux qui mobilisent aujourd'hui des jours ou des semaines de travail qualifié. Quatre familles de cas d'usage ressortent.
Développement logiciel : des mois compressés en jours
Le chiffre le plus parlant vient de Stripe, qui a testé le modèle en avant-première : sur une base de code Ruby de 50 millions de lignes, une migration à l'échelle de tout le code a été réalisée en une journée, là où une équipe entière aurait mis plus de deux mois à la main. Sur FrontierCode, le benchmark de code de niveau production publié par Cognition, Fable 5 obtient le meilleur score des modèles frontière, y compris à effort de calcul « medium ». Et il est plus économe en tokens que les Claude précédents, ce qui compte quand on regarde la facture (on y vient).
Pour une PME, la traduction est directe : refonte d'un logiciel métier vieillissant, migration de framework, montée de version d'une dépendance critique, résorption de dette technique. Ce sont précisément les chantiers que les équipes repoussent faute de bande passante.
Analyse documentaire et financière de niveau senior
Sur le Hebbia Finance Benchmark, qui évalue un raisonnement de niveau analyste senior, Fable 5 obtient le meilleur score de tous les modèles, avec des gains nets en raisonnement documentaire, en interprétation de graphiques et de tableaux, et en résolution de problèmes. Chez IMC, les évaluations d'analyse de trading sont décrites comme quasi parfaites : recherche factuelle, raisonnement conceptuel, analyse de cause racine, analyse d'espérance de gain.
Concrètement : due diligence sur un dossier d'acquisition, analyse de contrats fournisseurs, revue de liasses fiscales, synthèse de rapports sectoriels de plusieurs centaines de pages. Le modèle extrait aussi des chiffres précis directement depuis des figures et graphiques, plus besoin que la donnée soit dans un tableau propre pour être exploitable.
Agents autonomes de longue durée
Fable 5 garde le fil sur des millions de tokens de contexte et améliore ses propres résultats en prenant des notes dans des fichiers. L'exemple donné par Anthropic est ludique mais éclairant : sur le jeu Slay the Spire, la mémoire persistante à base de fichiers lui apporte un gain de performance trois fois supérieur à celui observé sur Opus 4.8, et le modèle atteint l'acte final du jeu trois fois plus souvent. Derrière l'anecdote, c'est la brique qui manquait aux agents d'entreprise : un système qui travaille plusieurs heures ou plusieurs jours sur un dossier sans perdre le fil ni répéter ses erreurs.
Si vous suivez le sujet, nous avions cartographié les cas d'usage réalistes dans notre article sur les agents IA autonomes pour les PME en 2026 : veille concurrentielle continue, qualification de leads, reporting automatisé, monitoring de conformité. Fable 5 relève le plafond de ce que ces agents peuvent accomplir sans supervision.
Vision : des captures d'écran au code source
Nouveau record en vision également. Deux capacités intéressent directement les entreprises : l'extraction de chiffres précis dans des figures scientifiques ou techniques, et la reconstruction du code source d'une application web à partir de simples captures d'écran. Si vous avez un vieil outil interne dont le code est perdu ou inexploitable, ce point mérite un test. Anthropic illustre la robustesse de cette vision avec un cas extrême : le modèle a terminé Pokémon FireRed avec un harnais minimal uniquement basé sur les captures d'écran brutes, sans carte ni aide de navigation, là où les modèles précédents échouaient même avec des harnais d'aide complexes.
Combien coûte Claude Fable 5 ? Le détail des prix API
Le tarif API de Fable 5 est de 10 $ par million de tokens en entrée et 50 $ par million de tokens en sortie, soit moins de la moitié du prix de Claude Mythos Preview, le modèle d'avril réservé au Project Glasswing. Voici la grille complète des modèles Anthropic au 9 juin 2026 :
| Modèle | Identifiant API | Input (par M tokens) | Output (par M tokens) |
|---|---|---|---|
| Claude Fable 5 | claude-fable-5 | 10 $ | 50 $ |
| Claude Opus 4.8 | claude-opus-4-8 | 5 $ | 25 $ |
| Claude Sonnet 4.6 | claude-sonnet-4-6 | 3 $ | 15 $ |
| Claude Haiku 4.5 | claude-haiku-4-5 | 1 $ | 5 $ |
Opus 4.8 et Sonnet 4.6 offrent une fenêtre de contexte d'un million de tokens, Haiku 4.5 plafonne à 200 000. Fable 5 coûte donc exactement le double d'Opus 4.8. Est-ce cher ? Tout dépend de la tâche. Trois scénarios calculés :
Scénario 1 : analyser un rapport de 100 pages
Un document de 100 pages représente environ 75 000 tokens en entrée. Ajoutons une synthèse structurée de 2 000 tokens en sortie. Le calcul : 75 000 tokens à 10 $ le million font 0,75 $ ; 2 000 tokens à 50 $ le million font 0,10 $. Total : 0,85 $ par document. La même tâche coûte environ 0,43 $ sur Opus 4.8 et 0,26 $ sur Sonnet 4.6. Face au coût d'une demi-journée d'analyste, le débat sur le surcoût de Fable 5 dure trois secondes, à condition que la tâche justifie son niveau de raisonnement.
Scénario 2 : un assistant interne à 500 requêtes par jour
Prenons un assistant documentaire interne traitant 500 requêtes par jour, avec en moyenne 3 000 tokens de contexte en entrée et 800 tokens de réponse. Par jour : 1,5 million de tokens d'entrée et 400 000 tokens de sortie. Sur Fable 5 : 15 $ d'input + 20 $ d'output = 35 $ par jour, soit environ 770 $ par mois sur 22 jours ouvrés. Le même volume coûte 10,50 $ par jour sur Sonnet 4.6 (231 $ par mois) et 3,50 $ par jour sur Haiku 4.5 (77 $ par mois). Pour ce type d'usage à fort volume et faible complexité unitaire, Fable 5 est un mauvais choix : multiplié par le volume, le facteur prix devient significatif sans gain de qualité perceptible.
Scénario 3 : une migration de code agentique
Hypothèse volontairement large pour un chantier lourd : une session agentique de refactoring qui consommerait 20 millions de tokens en entrée (lectures de fichiers répétées, contexte, allers-retours d'outils) et 1 million en sortie. Calcul : 200 $ + 50 $ = 250 $ pour l'ensemble du chantier. Si ce chantier remplace deux mois d'une équipe de développement, l'ordre de grandeur du cas Stripe, le retour sur investissement ne se discute même pas. Et la meilleure efficacité en tokens de Fable 5 par rapport aux Claude précédents atténue en pratique l'écart de prix facial avec Opus 4.8.
La conclusion de ces trois calculs tient en un mot : routage. Le coût par tâche reste marginal face au coût humain équivalent, mais payer le double d'Opus 4.8 sur des tâches qui n'en ont pas besoin est du gaspillage pur. La bonne architecture envoie chaque requête au modèle le moins cher capable de la traiter correctement.
Claude Fable 5 ou Opus 4.8 : quel modèle pour quelle tâche ?
Voici la matrice de décision que nous appliquons depuis ce matin sur nos propres projets :
| Modèle | Profil de tâche | Exemples concrets |
|---|---|---|
| Fable 5 | Tâches longues, complexes, multi-étapes, où son avance est maximale | Migration de codebase, due diligence complète, agent travaillant plusieurs heures avec mémoire fichiers, extraction de données depuis des graphiques, reconstruction d'interfaces depuis captures d'écran |
| Opus 4.8 | Tâches exigeantes dans les domaines où le fallback de Fable 5 s'appliquerait de toute façon | Sujets touchant à la biologie ou à la chimie, analyses de sécurité informatique susceptibles de déclencher les classifieurs cyber (réglés de façon volontairement conservatrice), plus généralement tout cas où vous constatez des basculements répétés |
| Sonnet 4.6 | Gros volume avec un bon équilibre qualité-prix | Assistant documentaire interne, génération de contenu, support client de niveau 2, RAG sur base de connaissances |
| Haiku 4.5 | Temps réel et micro-tâches à coût minimal | Classification de tickets, routage de requêtes, autocomplétion, extraction de champs simples |
La ligne Opus 4.8 mérite une explication, car elle découle directement de l'architecture de safeguards de Fable 5, le point le plus original de ce lancement.
Comment intégrer Claude Fable 5 via l'API ?
Fable 5 est disponible depuis aujourd'hui sur l'API Claude et les plans Enterprise à la consommation, sous l'identifiant claude-fable-5. L'intégration minimale en Python ressemble à n'importe quel appel Claude :
import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-fable-5",
max_tokens=2048,
messages=[
{
"role": "user",
"content": "Analyse ce contrat et liste les clauses de responsabilité."
}
],
)
print(message.content[0].text)
Safeguards et fallback Opus 4.8 : ce que vos pipelines doivent gérer
C'est la particularité technique à intégrer dès le premier jour. Fable 5 est accompagné de classifieurs : des systèmes d'IA séparés qui détectent les usages à risque dans trois domaines, la cybersécurité (exploitation de vulnérabilités et tâches cyber offensives au sens large), la biologie et la chimie (couverture volontairement large pour l'instant), et la distillation (tentatives d'extraction des capacités du modèle pour entraîner des concurrents). Quand un classifieur se déclenche, la requête n'est pas refusée : elle est traitée par Claude Opus 4.8 à la place de Fable 5, et l'utilisateur en est informé à chaque fois.
Les ordres de grandeur communiqués par Anthropic : les safeguards se déclenchent en moyenne dans moins de 5 % des sessions ; pour toutes les autres, les performances sont effectivement identiques à celles de Claude Mythos 5, le même modèle sous-jacent avec certains safeguards levés selon le profil du partenaire. Le réglage est volontairement conservateur : des requêtes parfaitement bénignes déclencheront parfois les classifieurs, ce qu'Anthropic dit vouloir corriger aussi vite que possible.
Pour vos pipelines, trois implications pratiques. Un, journalisez chaque fallback : Anthropic informe l'utilisateur à chaque basculement, vérifiez dans la réponse ou la documentation API comment identifier le modèle ayant traité la requête, et conservez cette information pour savoir quelle part de votre trafic bascule, par cas d'usage. Deux, traitez la réponse de fallback comme une réponse valide, c'est du Opus 4.8, pas un message d'erreur. Ne codez surtout pas de retry agressif qui renverrait la même requête en boucle en espérant éviter le classifieur : vous paieriez plusieurs fois pour le même résultat, sans garantie de résultat différent. Trois, si un de vos cas d'usage déclenche le fallback systématiquement, simplifiez l'architecture : appelez Opus 4.8 directement, à moitié prix, et gardez Fable 5 pour le reste.
Claude Fable 5 est-il compatible RGPD ? Le point sur la rétention des données
C'est le volet que votre DPO doit lire avant le déploiement. Anthropic impose une rétention obligatoire de 30 jours sur tout le trafic des modèles de classe Mythos, Fable 5, Mythos 5 et les futurs modèles de capacité égale ou supérieure. Cette rétention s'applique sur les produits Anthropic comme sur les plateformes tierces, clients business inclus. Aucune exemption contractuelle annoncée à ce stade.
Les garde-fous annoncés sont substantiels : ces données ne servent pas à entraîner de nouveaux modèles Claude, ni à aucun usage non lié à la sécurité ; tout accès humain aux données est journalisé ; la suppression intervient après 30 jours dans la quasi-totalité des cas. L'objectif affiché est défensif, détecter les attaques complexes et nouvelles (nouveaux jailbreaks, attaques multi-requêtes) et réduire les faux positifs des classifieurs.
Pour une entreprise européenne, le travail de mise en conformité est classique mais ne doit pas être sauté :
- Registre de traitements : ajoutez ou mettez à jour la fiche correspondant à vos usages Claude, en mentionnant Anthropic comme sous-traitant et la rétention de 30 jours à finalité de sécurité.
- Analyse des données envoyées : si vos prompts contiennent des données personnelles de clients ou de salariés, vérifiez que votre base légale et votre information des personnes couvrent ce transfert et cette durée de conservation.
- CGU et politiques internes : votre charte d'utilisation de l'IA doit préciser ce qui peut ou non transiter par les modèles Mythos-class, par exemple, exclure les données de santé tant que la couverture bio-chimie des classifieurs reste large.
- Documentation fournisseur : conservez l'annonce et la system card dans votre dossier de conformité, au même titre que vos DPA existants.
Ce chantier s'inscrit dans un calendrier réglementaire plus large : les obligations de l'AI Act pour les modèles à usage général montent en puissance cet été, et nous avons détaillé ce qui s'applique aux entreprises françaises dans notre analyse de ce qui change au 2 août 2026 avec l'AI Act. Traiter les deux sujets dans le même lot de travail est le plus efficace.
Du 9 au 22 juin : votre plan d'action en 5 étapes
Fable 5 est inclus sans surcoût dans les plans Pro, Max, Team et Enterprise par siège jusqu'au 22 juin. Le 23 juin, il sera retiré de ces abonnements et son utilisation passera par des crédits d'usage, Anthropic indique que la fenêtre pourra être prolongée si la capacité le permet, et que l'objectif à terme est de le réintégrer comme composant standard des abonnements. Mais ne planifiez pas sur une prolongation : vous avez deux semaines d'accès inclus dans votre abonnement pour produire des données de décision. Voici comment les utiliser :
- Sélectionnez 2 à 3 tâches représentatives et exigeantes. Pas vos cas faciles : prenez les chantiers de fond, une analyse de contrat complète, un chantier de refactoring, un dossier de synthèse multi-documents, là où le modèle est censé creuser l'écart.
- Constituez un jeu de comparaison. Mêmes prompts, mêmes documents, exécutés en parallèle sur votre modèle actuel (Opus 4.8 ou Sonnet 4.6) et sur Fable 5. Sans comparaison directe, vous ne saurez pas si l'écart justifie le prix.
- Mesurez ce qui compte. Qualité du résultat jugée par un expert métier, nombre d'allers-retours nécessaires, temps total, et taux de déclenchement du fallback sur vos requêtes réelles.
- Chiffrez le routage cible. Pour chaque famille de tâches, calculez le coût mensuel sur Fable 5 et sur l'alternative, comme dans nos scénarios ci-dessus. Décidez quelles tâches méritent le tarif double.
- Tranchez avant le 23 juin. Budget de crédits d'usage, règles de routage dans vos outils, mise à jour du registre de traitements. Une décision documentée en deux semaines vaut mieux qu'une adoption par défaut qui gonfle la facture.
Quand ne pas utiliser Claude Fable 5
Un bon test d'adoption identifie aussi les cas où la réponse est non. Trois situations où Fable 5 est le mauvais choix :
- Les tâches simples et volumineuses. Classification, extraction de champs, reformulation, réponses de premier niveau : le surcoût est pur gaspillage. Haiku 4.5 à 1 $ le million de tokens d'entrée fait le travail, Sonnet 4.6 couvre les cas intermédiaires.
- Les domaines qui déclenchent systématiquement le fallback. Si vous travaillez en pharma ou en chimie, vos requêtes ont de bonnes chances de basculer vers Opus 4.8, la couverture bio-chimie des classifieurs est volontairement large pour l'instant, même si Anthropic prévoit de la resserrer. Côté cybersécurité, les classifieurs couvrent les tâches offensives au sens large avec un réglage volontairement conservateur : des requêtes de sécurité défensive manipulant les mêmes contenus pourraient elles aussi déclencher le fallback. Dans les deux cas, autant appeler Opus 4.8 directement et payer moitié prix pour le même résultat.
- Les workflows où la latence est critique. Chatbot en temps réel, suggestions à la frappe, scoring synchrone dans un parcours client : le raisonnement profond de Fable 5 n'apporte rien quand la réponse doit partir en moins d'une seconde. C'est le territoire de Haiku.
Ajoutez un quatrième cas, organisationnel : si votre politique interne de données est incompatible avec une rétention de 30 jours chez le fournisseur, les modèles Mythos-class sont hors périmètre tant que cette politique n'évolue pas, les modèles classiques comme Opus 4.8 et Sonnet 4.6 ne sont pas concernés par cette obligation.
Passer du test au déploiement
La fenêtre du 9 au 22 juin est une opportunité rare : tester sans surcoût le modèle le plus capable du marché sur vos propres dossiers, avec des données chiffrées à la sortie. Mais l'écart entre un test concluant et un outil métier fiable reste important : routage multi-modèles, gestion du fallback, journalisation, conformité RGPD, intégration à vos systèmes existants. C'est exactement le travail que nous menons pour nos clients, des outils métier sur mesure qui exploitent le bon modèle au bon coût, dans le cadre de notre offre de développement de logiciels sur mesure.
Si vous voulez transformer ces deux semaines d'essai en avantage opérationnel durable, assistant documentaire, agent d'analyse, automatisation d'un processus métier complet, décrivez-nous votre projet. Nous revenons vers vous sous 48 heures avec une approche concrète, un choix de modèles argumenté et un plan d'intégration.



