Når en kunde siger "vi vil have en fine-tuned model", svarer vi næsten altid: "Lad os først tjekke om prompt-engineering" class="ordbog-inline-link" title="Prompt engineering — se i AI Ordbogen">prompt engineering kan løse det". I 90% af tilfældene kan det. Her er hvordan vi træffer beslutningen — og hvornår fine-tuning faktisk er det rigtige.
Forskellen, kort
Prompt engineering: Du sender en (potentielt lang) instruktion + nogle eksempler til modellen ved hvert kald. Modellen er uændret.
Fine-tuning: Du træner en custom version af modellen på dine egne data. Modellen ændrer sig permanent for dig.
Prompt engineering er hurtigere, billigere, mere fleksibelt og mere fejlsikkert. Fine-tuning er dyrere, langsommere at iterere på, men kan opnå ting prompts ikke kan.
Hvornår prompt engineering er nok
- I vil have modellen til at følge et bestemt format (JSON, Markdown, struktureret output)
- I vil have brand voice eller tone i output
- I vil klassificere input i fastsatte kategorier
- I vil have specifik viden brugt (læg den i prompt eller brug RAG)
- I vil begrænse adfærd (don't generate X, kun svar på Y)
Det dækker 90% af alle reelle AI-implementeringer i virksomheder.
Hvornår fine-tuning faktisk giver mening
- Output-format er ekstremt struktureret og konsistent — fx specifikke domænesprog eller code-templates
- Latency er kritisk — fine-tuned mindre modeller kan være 10× hurtigere end stor model med lang prompt
- Pris pr. kald skal ned — kortere prompts via fine-tuning sparer tokens i skala
- Specifikt fagsprog eller stil — jura, medicin, eller meget speciel brand voice som er for kompleks til prompts
- Klassificering med tusindvis af kategorier — for mange til at få ind i en prompt
Den ærlige fine-tuning-virkelighed
Vi har lavet fine-tuning for tre danske kunder og rådet 12 andre fra det. Her er hvad de fleste undervurderer:
Datakrav
Fine-tuning kræver typisk minimum 100-500 højkvalitets eksempler. Garbage in = garbage out. Hvis I skal bruge en uge på at samle data, og det stadig er rodet, så har I et data-problem, ikke et model-problem.
Iteration-omkostning
Hver gang I vil ændre adfærden, skal I retrænes. Prompt engineering: ændr 2 linjer. Fine-tuning: omkostning + 30 min ventetid + ny model-version at vedligeholde.
Det virker først efter version 3
Første fine-tune virker næsten aldrig. Forvent 3-5 iterationer over 2-4 uger før modellen leverer det forventede.
Modelvalg
Fine-tuning er kun tilgængeligt på enkelte modeller (GPT-4o-mini, Claude Haiku 3.5, Gemini 1.5 Flash). Frontier-modeller (GPT-5, Claude Opus 4.5) understøtter ikke fine-tuning. Hvis I har brug for frontier-kvalitet, skal I bruge prompt engineering.
Vores stigetilgang
For et nyt AI-projekt går vi altid trinvis:
- Trin 1: Simpel prompt med 1-2 eksempler (zero/few-shot). Tester på ~20 inputs. 80% af projekterne stopper her.
- Trin 2: Detaljeret prompt med 5-10 eksempler + kæde-af-tanke reasoning. Yderligere 15% af projekter løses her.
- Trin 3: Tilføj RAG hvis viden er problemet. Yderligere 3% løses her.
- Trin 4: Fine-tuning kun hvis ovenstående ikke har nået kvalitetsmålet. Resterende 2%.
Hvad det koster
- Prompt engineering-iteration: 30 min - 2 timer arbejde, 0 kr i træning
- Fine-tuning et lille datasæt (200 eksempler): ~ 500-2.000 kr for træning + dyrere pr. inference-kald (typisk 1.5-3x basispris)
- Vedligeholdelse: Hver retræning ~ samme pris
Konklusion
Hvis nogen siger "vi skal fine-tune", spørg dem først: "Hvilken adfærd kan du ikke opnå med prompt engineering, og har du faktisk prøvet?"
90% af tiden er svaret "jeg har ikke prøvet" eller "jeg vidste ikke prompts kunne det". Spar pengene.
Leder du efter en strategisk partner?
Læsning flytter ikke nålen i sig selv. Vi implementerer disse strategier for krævende B2B virksomheder hver dag. Få en skræddersyet roadmap.
Få en 30-min Strategisession