← Tilbage til ordbogenModeller & arkitektur

LLM (Large Language Model)

Også kendt som: Large Language Model, Sprogmodel

En stor sprogmodel trænet på enorme tekstmængder til at forstå og generere naturligt sprog.

En LLM er en neural netværksmodel — typisk en transformer-arkitektur — der er trænet på milliarder af ord fra internettet, bøger, kode og andre kilder. Modellen lærer statistiske mønstre i sprog: hvilke ord der typisk følger hvilke, hvordan begreber hænger sammen, og hvordan tekst struktureres.

Når du sender en prompt til en LLM, forudsiger den ét token (ord eller del af ord) ad gangen, baseret på alt det den har set under træningen og den kontekst du har givet. Det er ikke "tænkning" i menneskelig forstand, men det er kraftigt nok til at løse en enorm bredde af opgaver: oversættelse, kodning, opsummering, ræsonnement.

Nutidens førende LLM-familier er Claude (Anthropic), GPT (OpenAI), Gemini (Google) og Llama (Meta). De varierer i størrelse fra få milliarder til over en billion parametre.

LLM (Large Language Model)

Relaterede termer