Brief du jour
Claude Opus 4.7 : ce qui change vraiment pour les PME qui codent avec Claude
Anthropic a annoncé le mercredi 22 avril Opus 4.7. Le récit médiatique dominant parle de « 1 million de tokens de contexte » et de « prompt caching 90 % » comme si c’étaient les nouveautés du cru — ce sont des reprises d’Opus 4.6. Les vraies ruptures sont ailleurs, et elles impactent directement le code d’intégration des PME qui ont déjà Claude en production.
Ce qui change réellement entre 4.6 et 4.7
| Capacité | Opus 4.6 | Opus 4.7 | Impact PME |
|---|---|---|---|
| Thinking budget | budget_tokens explicite | adaptive (le modèle choisit) | Fort — simplification code |
| Thinking content | summarized | omitted par défaut | Moyen — logs plus courts |
| Niveaux effort | low / medium / high | + xhigh | Moyen — option premium |
| Sampling (temp / top_p / top_k) | configurable | HTTP 400 si envoyés | Fort — breaking change |
| Vision (résolution max) | 1568 px | 2576 px | Fort — OCR / PDF HD |
| Task Budgets beta | non supporté | header task-budgets-2026-03-13 | Fort — plafond coût par tâche |
| Managed Agents beta | supporté | supporté | Neutre — pas exclusif 4.7 |
| Fenêtre contexte | 1 M tokens | 1 M tokens | Aucun — identique |
| Prompt caching | cache reads ≈ 0,1× input | idem | Aucun — identique |
Le vrai saut : adaptive thinking + sampling lock
Sur 4.6, tu passais budget_tokens: 8000 pour cadrer la réflexion du modèle. Sur 4.7, ce paramètre est ignoré : le modèle choisit son propre budget selon la difficulté de la tâche. Un pré-traitement trivial consomme 200 tokens de thinking, un refactor architectural peut en consommer 40 000. Plus de devinette côté intégrateur.
Corollaire moins glamour mais plus cassant : les paramètres temperature, top_p et top_k retournent HTTP 400 sur 4.7. Si ton SDK les passait encore « par habitude » (souvent le cas sur du code repris d’un tutoriel plus ancien), ton appel échoue au premier run. Grep ton code avant de migrer.
Task Budgets beta : un vrai garde-fou coût
Activable via le header task-budgets-2026-03-13, cette beta permet de déclarer un plafond de coût par tâche avant de lancer un agent. Le modèle coupe proprement si la facture s’approche du seuil, avec un stop_reason explicite. Pour les PME qui ont eu peur d’activer Claude sur des workflows ouverts (peur d’un runaway à 200 $ sur une boucle foireuse), c’est la fonctionnalité qu’on attendait.
Attention : c’est en beta, pas en GA. Le header peut changer, les semantics peuvent bouger. Activable sur 4.7 uniquement.
Managed Agents : beta, et pas exclusive à 4.7
Le récit « Anthropic internalise les orchestrateurs » tenu par certaines analyses accole Managed Agents à 4.7. La documentation est plus nuancée : Managed Agents est une beta (managed-agents-2026-04-01) supportée sur Opus 4.7, Opus 4.6 et Sonnet 4.6. La bonne question pour une PME n’est donc pas « faut-il migrer vers 4.7 pour les Managed Agents », mais « faut-il activer le header beta sur le modèle qu’on utilise déjà ».
%%{init: {'title': 'Architecture des Managed Agents (beta)'}}%%
flowchart LR
U[App client] -->|requête| MA[Managed Agent]
MA -->|tool_use| T1[Tool métier 1]
MA -->|tool_use| T2[Tool métier 2]
T1 --> MA
T2 --> MA
MA -->|résultat| U
Ce qu’il faut faire maintenant
Si tu as déjà claude-opus-4-6 en production :
- Avant migration 4.7 : grep
temperature,top_p,top_kdans tous tes appels Claude — ces paramètres cassent l’API sur 4.7. - Retire les
budget_tokensdes appels thinking quand tu migres — ils sont ignorés, adaptive thinking prend la main. - Teste la vision 2576 px sur tes cas d’usage PDF HD / screenshots — gain de qualité OCR potentiellement significatif sans refactor.
- Task Budgets beta : activer sur un workflow non-critique d’abord, observer 1 semaine avant d’élargir.
- Pas de rush : 4.6 reste supporté, 1M de contexte et caching 90 % sont déjà là depuis 4.6.
Notre verdict
Opus 4.7 n’est pas un saut de capacité, c’est un affinage — adaptive thinking, sampling lock, vision HD, Task Budgets beta. Ces quatre changements ensemble valent la migration pour les PME qui codent avec Claude, mais pas pour les bonnes raisons médiatiques. Ceux qui migrent en s’attendant au « 1M de contexte » vont être déçus : ils l’avaient déjà. Ceux qui migrent pour le sampling lock risquent de casser leur prod. Lis la doc, grep le code, ensuite migre.