A 30 de junho de 2026, a Anthropic lançou o Claude Sonnet 5 (ID de modelo na API: claude-sonnet-5), e ficou disponível para todos no mesmo dia: modelo padrão dos planos Free e Pro, acessível a Max, Team e Enterprise, e ativo no Claude Code e na Claude Platform. O discurso da Anthropic é direto, "construído para ser o modelo Sonnet mais agêntico até hoje", um modelo que "consegue fazer planos, usar ferramentas como navegadores e terminais e correr de forma autónoma a um nível que, há apenas alguns meses, exigia modelos maiores e mais caros."
É uma afirmação forte, e "mais agêntico" é linguagem de marketing, não um facto medido. Por isso fizemos o que fazemos sempre: fomos às fontes primárias, o anúncio oficial, a documentação do modelo, as páginas de preços e o system card, e separámos tudo em factos verificados, benchmarks declarados pela empresa e análise nossa. A versão curta: as especificações e os preços são sólidos como rocha, os benchmarks (todos do próprio system card da Anthropic, sem qualquer avaliação independente de terceiros publicada até agora) colocam o Sonnet 5 surpreendentemente perto do bem mais caro Opus 4.8, e para quem constrói agentes ou ferramentas de programação este é, muito provavelmente, o seu novo modelo padrão. Eis os números.
A ficha técnica verificada
Primeiro, os factos que não estão em disputa, diretamente da documentação de modelos da Anthropic. Sem invenções, sem jogos de arredondamento.
| Claude Sonnet 5, especificações verificadas | Detalhe |
|---|---|
| ID de modelo na API | claude-sonnet-5 (snapshot fixo sem data; AWS Bedrock anthropic.claude-sonnet-5, Google Cloud claude-sonnet-5) |
| Lançado | 30 de junho de 2026, disponível para todos os planos e no Claude Code |
| Janela de contexto | 1M de tokens |
| Saída máxima | 128 mil tokens (até 300 mil via cabeçalho beta de batch) |
| Corte de conhecimento | janeiro de 2026 (corte fiável de conhecimento e de treino) |
| Entrada / saída | entrada de texto e imagem com visão, multilingue, saída de texto |
| Raciocínio | raciocínio adaptativo (sempre disponível), esforço por defeito em alto na API e no Claude Code |
| Latência | rápida (posicionado como o melhor equilíbrio entre velocidade e inteligência) |
O destaque é a combinação: uma janela de contexto de um milhão de tokens e um corte de conhecimento em janeiro de 2026 num modelo que a Anthropic afina explicitamente para velocidade e trabalho agêntico. É o perfil de cavalo de batalha, e isso importa porque os agentes consomem tokens aos milhões, pelo que o modelo onde os corre tem de ser ao mesmo tempo capaz e acessível.
O preço: barato agora, um pouco menos barato em setembro
É aqui que se reordena o padrão de quem constrói. O preço de API padrão do Claude Sonnet 5 é de 3 dólares por milhão de tokens de entrada e 15 dólares por milhão de tokens de saída. Mas há um desconto de lançamento: 2 / 10 dólares por milhão de tokens até 31 de agosto de 2026, após o qual o padrão de 3 / 15 entra em vigor a 1 de setembro. A Batch API é ainda mais barata, 1 / 5 dólares em preço de lançamento.
Para perceber por que isto é agressivo, alinhe-o com o resto da gama Claude atual. O Sonnet 5 fica a uma fração dos níveis Opus e Fable enquanto, como veremos, os iguala em vários testes.
Preço de saída por milhão de tokens, gama Claude atual (mais baixo é mais barato)
Fonte: documentação de modelos e preços da Anthropic, junho de 2026 (verificado). Preço de saída por milhão de tokens. Uma ressalva honesta: relatos independentes notam que o Sonnet 5 usa um novo tokenizador que produz algo mais tokens por pedido, pelo que o desconto de lançamento está mais perto de ser neutro em custo do que de uma verdadeira redução para metade face ao Sonnet anterior.
| Modelo | Preço (entrada / saída por MTok) | Contexto | Função |
|---|---|---|---|
| Haiku 4.5 | 1 $ / 5 $ | 200 mil | O mais rápido, quase de fronteira |
| Sonnet 5 | 3 $ / 15 $ (2 $ / 10 $ até 31 ago.) | 1M | Melhor velocidade + inteligência |
| Opus 4.8 | 5 $ / 25 $ | 1M | O mais capaz do nível Opus |
| Fable 5 | 10 $ / 50 $ | 1M | O mais capaz amplamente disponibilizado |
Os benchmarks: a fechar a distância para o Opus
Nota de honestidade importante: cada número abaixo provém do próprio system card da Anthropic. À data de escrita, no dia do lançamento, nenhuma avaliação independente de terceiros (Artificial Analysis e afins) tinha publicado a sua própria medição. Trate-os como declarados pela empresa, fortes na direção, mas ainda não confirmados de forma independente.
A história que os benchmarks contam é consistente: o Sonnet 5 é um verdadeiro salto geracional sobre o Sonnet 4.6, e em vários testes fica a poucos pontos do Opus 4.8, um modelo que custa quase o dobro na saída. No benchmark de programação agêntica SWE-bench Pro, a progressão é clara.
SWE-bench Pro, programação agêntica (declarado pela empresa, mais alto é melhor)
Fonte: system card do Claude Sonnet 5 via The Decoder, junho de 2026 (declarado pela empresa). O Sonnet 5 fecha a maior parte da distância para o Opus 4.8 a uma fração do preço de saída.
É ainda mais apertado nos testes mais amplos e mais caros. Repare onde o Sonnet 5 essencialmente empata com o Opus 4.8 apesar da diferença de preço.
| Benchmark (declarado pela empresa) | Sonnet 5 | Sonnet 4.6 | Opus 4.8 |
|---|---|---|---|
| SWE-bench Pro (programação agêntica) | 63,2 % | 58,1 % | 69,2 % |
| Terminal-Bench 2.1 | 80,4 % | 67,0 % | não apresentado |
| OSWorld-Verified (uso de computador) | 81,2 % | 78,5 % | não apresentado |
| Humanity's Last Exam (com ferramentas) | 57,4 % | não apresentado | 57,9 % |
| GDPval-AA v2 (trabalho de conhecimento) | 1 618 pts | não apresentado | 1 615 pts |
Leia essas duas últimas linhas de novo. No Humanity's Last Exam com ferramentas (57,4 % contra 57,9 %) e na avaliação de trabalho de conhecimento GDPval (1 618 contra 1 615 pontos), o Sonnet 5 está estatisticamente ao nível do Opus 4.8, a 15 dólares de saída contra os 25 dólares do Opus. É toda a tese deste lançamento em dois números. O salto no Terminal-Bench de 67 % para 80,4 % numa única geração Sonnet é o outro ponto de atração: progresso real a correr coisas numa shell real, que é exatamente o que os agentes fazem.
Quem já o está a usar
O anúncio apoia-se em clientes nomeados em vez de elogios anónimos, e a lista é reveladora, porque vários deles são as ferramentas de programação por IA habitualmente apresentadas como uma ameaça aos incumbentes. A Anthropic cita a Replit ("lida bem com programação sustentada, uso de ferramentas e depuração"), o Cursor (destaca-se em "código legado" com correções robustas), a Lovable ("faz mais com menos" e "recusa pedidos inseguros de forma limpa"), a Salesforce (completou automações multi-etapa "de ponta a ponta" que antes ficavam pelo caminho), além de ClickHouse, Eve e Pace. Quando as empresas que constroem produtos agênticos se alinham no primeiro dia, é sinal de que o modelo está afinado precisamente para esse tipo de carga.
As ressalvas a manter à vista
É um lançamento forte, mas um texto de lançamento não vai abrir com os asteriscos.
- Os benchmarks são da própria Anthropic. Cada número aqui vem do system card. Os avaliadores independentes não tinham publicado medições no lançamento. Os números estão provavelmente certos na direção, mas espere pela confirmação de terceiros antes de os tratar como assentes.
- O preço barato tem um relógio a contar. A tarifa de lançamento de 2 / 10 dólares termina a 31 de agosto de 2026. A partir de 1 de setembro é 3 / 15 dólares, um salto de 50 % de ambos os lados. Faça orçamento com o preço padrão, não com o de lançamento.
- Um novo tokenizador baralha as poupanças. Relatos independentes notam que o Sonnet 5 transforma texto em algo mais tokens do que o Sonnet anterior, pelo que, para uma dada tarefa, o custo real está mais perto de ser estável do que o desconto da manchete sugere. Meça a sua própria carga de trabalho.
- "O Sonnet mais agêntico até hoje" e "perto do Opus" são o enquadramento da Anthropic. Os dados sustentam um modelo forte, mas os superlativos de marketing não são veredictos independentes.
A nossa leitura: é este o novo padrão para quem constrói?
O que se segue é a nossa análise.
Para a maioria das cargas de programação e agênticas, sim, o Sonnet 5 torna-se o padrão sensato, e a razão é a relação custo-desempenho, não a inteligência de pico em bruto. Se um modelo fica a poucos pontos do Opus 4.8 no teste de programação mais difícil mas o iguala em trabalho de conhecimento e em raciocínio com uso de ferramentas, enquanto custa 60 % do Opus na saída (e bem menos durante a janela de lançamento), então, para a realidade esfomeada de tokens de correr agentes, as contas apontam para o Sonnet 5. Reserva-se o Opus 4.8 e o Fable 5 para o raciocínio genuinamente mais difícil e corre-se o grosso do tráfego de agentes no Sonnet 5.
O ponto mais profundo, aquele que continuamos a sublinhar nesta série, é que o modelo é um componente substituível, não o produto. A arquitetura certa coloca o modelo por trás da sua própria abstração para que possa passar do Sonnet 4.6 para o Sonnet 5, ou para um modelo open-weights mais barato onde a qualidade o permita, com uma mudança de configuração em vez de uma reconstrução. É assim que se aproveita um lançamento como este no primeiro dia em vez de num trimestre. É exatamente como construímos funcionalidades de IA para clientes: escolhido por tarefa em função de qualidade, custo e governação, sobre infraestrutura que controla (veja o nosso trabalho). Se quer ajuda para transformar o Claude Sonnet 5 em agentes e funcionalidades de produto que de facto saem para produção, e numa stack capaz de trocar para o melhor modelo assim que o próximo aterra, conte-nos sobre o seu projeto ou entre em contacto, e respondemos em 48 horas. Para mais sobre o panorama acelerado dos modelos, leia as nossas análises do GLM-5.2, o melhor LLM open-weights, da SpaceX a comprar o Cursor (um cliente nomeado do Sonnet 5) por 60 mil milhões de dólares e do Figma Motion contra a onda do design por IA.
Números-chave (a 30 de junho de 2026)
- 30 de junho de 2026 lançamento do Claude Sonnet 5, disponível para todos no mesmo dia, ID de modelo
claude-sonnet-5. - 3 $ / 15 $ preço padrão por milhão de tokens, com preço de lançamento de 2 $ / 10 $ até 31 de agosto de 2026.
- 1M de tokens de janela de contexto, 128 mil de saída máxima, corte de conhecimento em janeiro de 2026.
- 63,2 % no SWE-bench Pro (declarado pela empresa), contra 58,1 % do Sonnet 4.6 e 69,2 % do Opus 4.8.
- 57,4 % contra 57,9 % Sonnet 5 contra Opus 4.8 no Humanity's Last Exam com ferramentas, na prática empatados.
- 80,4 % no Terminal-Bench 2.1, a subir de 67,0 % do Sonnet 4.6.



