Analyse4. juni 2026

Anthropic forklarer: Sådan begrænser vi skaden hvis en Claude-agent fejler

Anthropics engineering-team deler konkret, hvordan de håndterer "blast radius" — den maksimale skade et autonomt AI-agent-system kan gøre, hvis noget går galt.

Original kilde:Anthropic Engineering — How we contain Claude across products ↗Publiceret 25.5.2026

Vores analyse

Efterhånden som AI-agenter får adgang til at udføre rigtige opgaver — redigere kode, sende mails, kalde API'er — opstår et nyt ingeniørspørgsmål: hvad er den maksimale skade, hvis noget går galt? Anthropic kalder det "blast radius", og deres engineering-team har nu delt, hvad de har lært fra at bygge containment-systemer til claude.ai, Claude Code og Cowork.

Kerneobservationen er enkel: Anthropic har på 12 måneder bevæget sig fra "vi ville aldrig give Claude nok adgang til at tage en intern service ned" til at det er rutine — og produktiviteten er steget. Risiko-regnestykket tipper mod adoption, når man kan begrænse skadeomfanget. De to primære metoder er menneskelig kontrol (brugeren godkender kritiske handlinger) og miljøisolering (agenten kører i en sandbox med begrænsede rettigheder). Claude Mythos Preview-modellen blev faktisk holdt tilbage i april 2026, fordi dens blast radius blev vurderet for høj til frigivelse.

For os der bygger AI-agenter til danske SMV'er er dette et konkret framework at arbejde ud fra: kortlæg hvad din agent har adgang til, definer det maksimale skadeomfang, og byg containment ind fra dag ét — ikke som en eftertanke.

AnthropicAI-agenterSikkerhedBlast radiusClaude CodeEngineering

Anthropic forklarer: Sådan begrænser vi skaden hvis en Claude-agent fejler

Vores analyse

Mere fra AI Feed

Apple skifter AI-model ved grænsen — Kina godkender Apple Intelligence

Claude kan nu sende mails og handle i Microsoft 365 — ikke bare læse

Anthropic lancerer Claude Science — AI der dokumenterer hvert eneste resultat