Claude Opus 4.8: bedste agent-model på markedet — uændret pris
Vores analyse
Den 28. maj lancerede Anthropic Claude Opus 4.8 — deres hidtil mest kapable Opus-model. Springet fra 4.7 handler mindre om rå sprogforståelse og mere om det, der gør AI brugbar i drift: agentisk pålidelighed. Modellen topper både OpenAIs GPT-5.5 og Googles Gemini 3.1 Pro på agentisk kodning, finansanalyse og computerbrug.
De konkrete tal: 84 procent på Online-Mind2Web, der måler en models evne til at navigere i en browser som en agent — den højeste score Anthropic har testet og et markant spring over både 4.7 og GPT-5.5. På OSWorld-Verified, der måler computerbrug, scorer den 82,3 procent. På Legal Agent Benchmark er Opus 4.8 den første model nogensinde, der bryder 10 procent på all-pass-standarden, hvor en opgave kun tæller, hvis hvert eneste delkrav er løst korrekt. Måske vigtigst for drift: modellen er ifølge Anthropic cirka fire gange mindre tilbøjelig end forgængeren til at lade fejl i kode passere ukommenteret. Det er ikke en benchmark-detalje — det er forskellen mellem en agent, I kan stole på uden konstant opsyn, og en I ikke kan.
To nye funktioner følger med. Effort-kontrol lader jer skrue på, hvor mange ressourcer Claude bruger på en opgave — høj indsats giver bedre svar mod flere tokens, lav indsats sparer penge på rutineopgaver. Og Claude Code får dynamiske workflows, der kan køre parallelle delagenter på opgaver i kodebase-skala — migreringer på tværs af hundredtusindvis af kodelinjer. Prisen er uændret: 5 dollar per million input-tokens og 25 dollar per million output-tokens, og fast mode er nu tre gange billigere end før.
For danske SMV-virksomheder er det springende punkt prisen kontra kvaliteten. Når den bedste model på markedet koster det samme som forgængeren, er der ingen kommerciel grund til at blive på en svagere model. Og effort-kontrollen er reelt et budget-værktøj: I kan køre dyre, høj-indsats-svar på de kritiske opgaver og billige svar på resten — i stedet for at betale topprisen på alt.