Fine-tuning vs prompt engineering 2026: Hvad du faktisk skal vælge

Når en kunde siger "vi vil have en fine-tuned model", svarer vi næsten altid: "Lad os først tjekke om prompt-engineering" class="ordbog-inline-link" title="Prompt engineering — se i AI Ordbogen">prompt engineering kan løse det". I 90% af tilfældene kan det. Her er hvordan vi træffer beslutningen — og hvornår fine-tuning faktisk er det rigtige.

Forskellen, kort

Prompt engineering: Du sender en (potentielt lang) instruktion + nogle eksempler til modellen ved hvert kald. Modellen er uændret.

Fine-tuning: Du træner en custom version af modellen på dine egne data. Modellen ændrer sig permanent for dig.

Prompt engineering er hurtigere, billigere, mere fleksibelt og mere fejlsikkert. Fine-tuning er dyrere, langsommere at iterere på, men kan opnå ting prompts ikke kan.

Hvornår prompt engineering er nok

I vil have modellen til at følge et bestemt format (JSON, Markdown, struktureret output)
I vil have brand voice eller tone i output
I vil klassificere input i fastsatte kategorier
I vil have specifik viden brugt (læg den i prompt eller brug RAG)
I vil begrænse adfærd (don't generate X, kun svar på Y)

Det dækker 90% af alle reelle AI-implementeringer i virksomheder.

Hvornår fine-tuning faktisk giver mening

Output-format er ekstremt struktureret og konsistent — fx specifikke domænesprog eller code-templates
Latency er kritisk — fine-tuned mindre modeller kan være 10× hurtigere end stor model med lang prompt
Pris pr. kald skal ned — kortere prompts via fine-tuning sparer tokens i skala
Specifikt fagsprog eller stil — jura, medicin, eller meget speciel brand voice som er for kompleks til prompts
Klassificering med tusindvis af kategorier — for mange til at få ind i en prompt

Den ærlige fine-tuning-virkelighed

Vi har lavet fine-tuning for tre danske kunder og rådet 12 andre fra det. Her er hvad de fleste undervurderer:

Datakrav

Fine-tuning kræver typisk minimum 100-500 højkvalitets eksempler. Garbage in = garbage out. Hvis I skal bruge en uge på at samle data, og det stadig er rodet, så har I et data-problem, ikke et model-problem.

Iteration-omkostning

Hver gang I vil ændre adfærden, skal I retrænes. Prompt engineering: ændr 2 linjer. Fine-tuning: omkostning + 30 min ventetid + ny model-version at vedligeholde.

Det virker først efter version 3

Første fine-tune virker næsten aldrig. Forvent 3-5 iterationer over 2-4 uger før modellen leverer det forventede.

Modelvalg

Fine-tuning er kun tilgængeligt på enkelte modeller (GPT-4o-mini, Claude Haiku 3.5, Gemini 1.5 Flash). Frontier-modeller (GPT-5, Claude Opus 4.5) understøtter ikke fine-tuning. Hvis I har brug for frontier-kvalitet, skal I bruge prompt engineering.

Vores stigetilgang

For et nyt AI-projekt går vi altid trinvis:

Trin 1: Simpel prompt med 1-2 eksempler (zero/few-shot). Tester på ~20 inputs. 80% af projekterne stopper her.
Trin 2: Detaljeret prompt med 5-10 eksempler + kæde-af-tanke reasoning. Yderligere 15% af projekter løses her.
Trin 3: Tilføj RAG hvis viden er problemet. Yderligere 3% løses her.
Trin 4: Fine-tuning kun hvis ovenstående ikke har nået kvalitetsmålet. Resterende 2%.

Hvad det koster

Prompt engineering-iteration: 30 min - 2 timer arbejde, 0 kr i træning
Fine-tuning et lille datasæt (200 eksempler): ~ 500-2.000 kr for træning + dyrere pr. inference-kald (typisk 1.5-3x basispris)
Vedligeholdelse: Hver retræning ~ samme pris

Konklusion

Hvis nogen siger "vi skal fine-tune", spørg dem først: "Hvilken adfærd kan du ikke opnå med prompt engineering, og har du faktisk prøvet?"

90% af tiden er svaret "jeg har ikke prøvet" eller "jeg vidste ikke prompts kunne det". Spar pengene.

Leder du efter en strategisk partner?

Læsning flytter ikke nålen i sig selv. Vi implementerer disse strategier for krævende B2B virksomheder hver dag. Få en skræddersyet roadmap.

Få en 30-min Strategisession