Il 30 giugno 2026 Anthropic ha rilasciato Claude Sonnet 5 (ID modello API claude-sonnet-5), reso disponibile a tutti già nello stesso giorno: modello di default sui piani Free e Pro, accessibile a Max, Team ed Enterprise, attivo in Claude Code e sulla Claude Platform. Il messaggio di Anthropic è diretto, "costruito per essere il modello Sonnet più agentico di sempre", un modello che "sa pianificare, usare strumenti come browser e terminali, e operare in autonomia a un livello che, solo qualche mese fa, richiedeva modelli più grandi e più costosi".
È un'affermazione importante, e "il più agentico" è linguaggio di marketing, non un dato misurato. Quindi abbiamo fatto quello che facciamo sempre: siamo andati alle fonti primarie, l'annuncio ufficiale, la documentazione del modello, le pagine sui prezzi e la system card, e abbiamo diviso tutto in fatti verificati, benchmark dichiarati dall'azienda e analisi nostra. In breve: specifiche e prezzi sono solidissimi, i benchmark (tutti dalla system card di Anthropic, senza alcuna verifica indipendente di terze parti ancora pubblicata) collocano Sonnet 5 sorprendentemente vicino al ben più caro Opus 4.8, e per chiunque costruisca agenti o strumenti di coding questo è con ogni probabilità il vostro nuovo modello di default. Ecco i numeri.
La scheda tecnica verificata
Per prima cosa, i fatti che non sono in discussione, presi direttamente dalla documentazione di Anthropic. Niente invenzioni, niente giochi di arrotondamento.
| Claude Sonnet 5, specifiche verificate | Dettaglio |
|---|---|
| ID modello API | claude-sonnet-5 (snapshot fissato senza data; AWS Bedrock anthropic.claude-sonnet-5, Google Cloud claude-sonnet-5) |
| Rilascio | 30 giugno 2026, disponibile a tutti su ogni piano e in Claude Code |
| Finestra di contesto | 1 milione di token |
| Output massimo | 128k token (fino a 300k tramite l'header batch beta) |
| Knowledge cutoff | gennaio 2026 (conoscenza affidabile e cutoff di addestramento) |
| Input / output | input testo e immagini con vision, multilingue, output testo |
| Ragionamento | ragionamento adattivo (sempre disponibile), effort impostato di default su high su API e Claude Code |
| Latenza | rapida (posizionato come il miglior equilibrio tra velocità e intelligenza) |
Il titolo è la combinazione: una finestra di contesto da un milione di token e un knowledge cutoff a gennaio 2026 su un modello che Anthropic ottimizza esplicitamente per velocità e lavoro agentico. È il profilo del cavallo da lavoro, e conta perché gli agenti bruciano token a milioni, quindi il modello su cui li fate girare deve essere allo stesso tempo capace e accessibile.
Il prezzo: conveniente ora, un filo meno a settembre
È la parte che ridisegna le scelte di default di chi costruisce. Il prezzo API standard di Claude Sonnet 5 è di 3 dollari per milione di token in input e 15 dollari per milione di token in output. Ma c'è uno sconto introduttivo: 2 / 10 dollari per milione di token fino al 31 agosto 2026, dopodiché dal 1° settembre scatta lo standard a 3 / 15 dollari. La Batch API è ancora più economica, 1 / 5 dollari in introduttivo.
Per capire quanto sia aggressivo, mettetelo in fila con il resto della gamma Claude attuale. Sonnet 5 si colloca a una frazione delle fasce Opus e Fable e, come vedremo, le eguaglia su diversi test.
Prezzo output per milione di token, gamma Claude attuale (più basso è più economico)
Fonte: documentazione modelli e prezzi Anthropic, giugno 2026 (verificato). Prezzo output per milione di token. Un caveat onesto: report indipendenti notano che Sonnet 5 usa un nuovo tokenizer che produce un po' più token per richiesta, quindi lo sconto introduttivo è più vicino a essere neutro sui costi che a un vero dimezzamento rispetto al Sonnet precedente.
| Modello | Prezzo (in / out per MTok) | Contesto | Ruolo |
|---|---|---|---|
| Haiku 4.5 | 1 $ / 5 $ | 200k | il più rapido, quasi-frontiera |
| Sonnet 5 | 3 $ / 15 $ (2 $ / 10 $ fino al 31 ago) | 1M | miglior velocità + intelligenza |
| Opus 4.8 | 5 $ / 25 $ | 1M | il più capace fascia Opus |
| Fable 5 | 10 $ / 50 $ | 1M | il più capace a rilascio ampio |
I benchmark: il divario con Opus si chiude
Nota di onestà importante: ogni numero qui sotto viene dalla system card di Anthropic. Al momento della scrittura, nel giorno del lancio, nessuna valutazione indipendente di terze parti (Artificial Analysis e simili) aveva pubblicato il proprio test. Trattateli come dichiarati dall'azienda, direzionalmente forti, ma non ancora confermati in modo indipendente.
La storia che raccontano i benchmark è coerente: Sonnet 5 è un vero salto generazionale rispetto a Sonnet 4.6, e su diversi test arriva a pochi punti da Opus 4.8, un modello che costa quasi il doppio in output. Sul benchmark di coding agentico SWE-bench Pro la progressione è netta.
SWE-bench Pro, coding agentico (dichiarato dall'azienda, più alto è meglio)
Fonte: system card di Claude Sonnet 5 via The Decoder, giugno 2026 (dichiarato dall'azienda). Sonnet 5 colma quasi tutto il divario con Opus 4.8 a una frazione del prezzo di output.
Il quadro è ancora più stretto sui test più ampi e costosi. Guardate dove Sonnet 5 sostanzialmente pareggia con Opus 4.8 nonostante il divario di prezzo.
| Benchmark (dichiarato dall'azienda) | Sonnet 5 | Sonnet 4.6 | Opus 4.8 |
|---|---|---|---|
| SWE-bench Pro (coding agentico) | 63,2 % | 58,1 % | 69,2 % |
| Terminal-Bench 2.1 | 80,4 % | 67,0 % | non indicato |
| OSWorld-Verified (computer use) | 81,2 % | 78,5 % | non indicato |
| Humanity's Last Exam (con strumenti) | 57,4 % | non indicato | 57,9 % |
| GDPval-AA v2 (lavoro di conoscenza) | 1 618 pti | non indicato | 1 615 pti |
Rileggete quelle ultime due righe. Su Humanity's Last Exam con strumenti (57,4 % contro 57,9 %) e sul test di lavoro di conoscenza GDPval (1 618 contro 1 615 punti), Sonnet 5 è statisticamente alla pari con Opus 4.8, a 15 $ di output contro i 25 $ di Opus. È l'intera tesi di questo rilascio in due numeri. Il salto su Terminal-Bench dal 67 % all'80,4 % nell'arco di una sola generazione Sonnet è l'altro elemento che colpisce: progresso reale nel far girare cose in una shell reale, che è esattamente quello che fanno gli agenti.
Chi lo sta già usando
L'annuncio si appoggia su clienti con nome e cognome più che su elogi anonimi, e la lista è eloquente, perché diversi di loro sono proprio gli strumenti di coding AI di solito presentati come una minaccia per gli incumbent. Anthropic cita Replit ("gestisce bene coding prolungato, uso di strumenti e debugging"), Cursor (eccelle sul "codice brownfield" con correzioni robuste), Lovable ("fa di più con meno" e "rifiuta le richieste non sicure in modo pulito"), Salesforce (ha completato automazioni multi-step "dall'inizio alla fine" che prima si bloccavano), oltre a ClickHouse, Eve e Pace. Quando le aziende che costruiscono prodotti agentici si schierano già dal primo giorno, è un segnale che il modello è ottimizzato esattamente per quel carico di lavoro.
Le insidie da tenere d'occhio
È un rilascio forte, ma un post di lancio non apre certo con gli asterischi.
- I benchmark sono di Anthropic stessa. Ogni dato qui viene dalla system card. Al lancio i valutatori indipendenti non avevano pubblicato i loro test. I numeri sono probabilmente corretti come direzione, ma aspettate la conferma di terze parti prima di considerarli definitivi.
- Il prezzo conveniente ha una scadenza. La tariffa introduttiva a 2 / 10 $ termina il 31 agosto 2026. Dal 1° settembre è 3 / 15 $, un più 50 % su entrambi i lati. Mettete a budget il prezzo standard, non quello introduttivo.
- Un nuovo tokenizer offusca il risparmio. Report indipendenti notano che Sonnet 5 tokenizza il testo in un po' più token rispetto al Sonnet precedente, quindi per uno stesso compito il costo reale è più vicino a essere invariato di quanto lo sconto pubblicizzato lasci intendere. Misurate il vostro carico di lavoro.
- "Il Sonnet più agentico di sempre" e "vicino a Opus" sono il framing di Anthropic. I dati sostengono un modello forte, ma i superlativi di marketing non sono verdetti indipendenti.
La nostra lettura: è il nuovo default per chi costruisce?
Quel che segue è la nostra analisi.
Per la maggior parte dei carichi di coding e agentici, sì, Sonnet 5 diventa il default sensato, e il motivo è il rapporto costo-prestazioni, non l'intelligenza di picco pura. Se un modello resta qualche punto dietro Opus 4.8 sul test di coding più duro ma lo pareggia sul lavoro di conoscenza e sul ragionamento con uso di strumenti, costando il 60 % di Opus in output (e molto meno durante la finestra introduttiva), allora per la realtà affamata di token del far girare agenti la matematica indica Sonnet 5. Riservate Opus 4.8 e Fable 5 al ragionamento davvero più difficile, e fate girare il grosso del traffico dei vostri agenti su Sonnet 5.
Il punto più profondo, quello che continuiamo a ribadire in questa serie, è che il modello è un componente intercambiabile, non il prodotto. L'architettura giusta mette il modello dietro una vostra astrazione così da poter passare da Sonnet 4.6 a Sonnet 5, o a un modello open-weights più economico dove la qualità lo consente, con una modifica di configurazione invece che con una riscrittura. È così che si coglie un rilascio come questo nel giorno stesso del lancio, e non un trimestre dopo. È esattamente come costruiamo le funzionalità AI per i clienti: scelte caso per caso su qualità, costo e governance, su infrastruttura che controllate voi (vedi i nostri lavori). Se volete una mano a trasformare Claude Sonnet 5 in agenti e funzionalità di prodotto che arrivano davvero in produzione, e in uno stack capace di inserire il modello migliore appena esce il prossimo, parlateci del vostro progetto o mettetevi in contatto, e rispondiamo entro 48 ore. Per approfondire il panorama dei modelli in rapida evoluzione, leggete le nostre analisi su GLM-5.2, il miglior LLM open-weights, SpaceX che compra Cursor (cliente citato di Sonnet 5) per 60 miliardi di dollari e Figma Motion contro l'onda del design AI.
Numeri chiave (al 30 giugno 2026)
- 30 giugno 2026 esce Claude Sonnet 5, disponibile a tutti lo stesso giorno, ID modello
claude-sonnet-5. - 3 $ / 15 $ prezzo standard per milione di token, con prezzo introduttivo 2 $ / 10 $ fino al 31 agosto 2026.
- 1 milione di token di finestra di contesto, 128k di output massimo, knowledge cutoff a gennaio 2026.
- 63,2 % su SWE-bench Pro (dichiarato dall'azienda), contro il 58,1 % di Sonnet 4.6 e il 69,2 % di Opus 4.8.
- 57,4 % contro 57,9 % Sonnet 5 contro Opus 4.8 su Humanity's Last Exam con strumenti, di fatto alla pari.
- 80,4 % su Terminal-Bench 2.1, in salita dal 67,0 % di Sonnet 4.6.



