Anthropic forklarer: Sådan begrænser vi skaden hvis en Claude-agent fejler
Vores analyse
Efterhånden som AI-agenter får adgang til at udføre rigtige opgaver — redigere kode, sende mails, kalde API'er — opstår et nyt ingeniørspørgsmål: hvad er den maksimale skade, hvis noget går galt? Anthropic kalder det "blast radius", og deres engineering-team har nu delt, hvad de har lært fra at bygge containment-systemer til claude.ai, Claude Code og Cowork.
Kerneobservationen er enkel: Anthropic har på 12 måneder bevæget sig fra "vi ville aldrig give Claude nok adgang til at tage en intern service ned" til at det er rutine — og produktiviteten er steget. Risiko-regnestykket tipper mod adoption, når man kan begrænse skadeomfanget. De to primære metoder er menneskelig kontrol (brugeren godkender kritiske handlinger) og miljøisolering (agenten kører i en sandbox med begrænsede rettigheder). Claude Mythos Preview-modellen blev faktisk holdt tilbage i april 2026, fordi dens blast radius blev vurderet for høj til frigivelse.
For os der bygger AI-agenter til danske SMV'er er dette et konkret framework at arbejde ud fra: kortlæg hvad din agent har adgang til, definer det maksimale skadeomfang, og byg containment ind fra dag ét — ikke som en eftertanke.