Google frigiver DiffusionGemma — 4× hurtigere tekstgenerering
Vores analyse
Google DeepMind har frigivet DiffusionGemma — en eksperimentel open-weights model (Apache 2.0), der bruger såkaldt tekst-diffusion i stedet for den klassiske token-for-token-tilgang. Hvor en almindelig sprogmodel skriver ét ord ad gangen, genererer DiffusionGemma hele blokke af tekst på én gang og forfiner dem gennem flere gennemløb — samme princip som diffusion bruger til billeder, men anvendt på tekst. Resultatet er op til 4× hurtigere generering: over 1.000 tokens i sekundet på et NVIDIA H100 og 700+ på et forbruger-grafikkort som RTX 5090. Modellen er en 26B Mixture-of-Experts, der kun aktiverer 3,8B parametre ad gangen.
For danske SMV'er er det interessante hastigheden lokalt. DiffusionGemma er bygget til hurtige, interaktive arbejdsgange på eget udstyr — in-line redigering, kode-udfyldning og hurtig iteration — uden dyre eksterne API-kald. Men der er en hage: Google er åbne om, at outputkvaliteten er lavere end standard-Gemma 4. Det er en model til opgaver, hvor fart betyder mere end perfektion, ikke en erstatning for jeres bedste model.