Stop med at gætte i indkøb: sådan får du GenAI til at gøre det kedelige

For nogle år siden sad jeg en sen aften med en kop alt for stærk kaffe og et Excel-ark med 38.000 indkøbslinjer fra en mellemstor virksomhed. Målet var at finde besparelser. Realiteten var, at jeg efter to timer mest havde fundet stavefejl i leverandørnavne og tre forskellige måder at skrive “IT-udstyr” på. Jeg fik lyst til at sende en faktura for spild af menneskeliv, ikke konsulenttimer.

Dengang var der ikke så meget at gøre. I dag har du GenAI, og pludselig er det meste af det arbejde noget, en model kan klare på minutter, hvis du strukturerer det rigtigt. Spørgsmålet er ikke, om AI kan hjælpe i indkøb. Spørgsmålet er, om du vil blive ved med at bruge højtuddannede mennesker på manuel kategorisering og rapportering, mens leverandørerne forhandler med nogen, der faktisk har dataene foran sig.

Hvor AI faktisk skaber værdi i indkøb

Lad os starte lavpraktisk: Hvor giver AI i indkøb reel værdi, uden at du skal bygge et nyt ERP-system eller skrive en 80 siders strategi?

1. Spend-analyse, der tager timer i stedet for måneder

Det meste indkøb arbejder stadig med spend-analyser, der i praksis er øjebliksbilleder: en stor øvelse en eller to gange om året. GenAI kan hjælpe med løbende at:

  • kategorisere linjer på tværs af fritekst, varebeskrivelser og leverandørnavne
  • samle relaterede leverandører (f.eks. lokale datterselskaber) i én koncern
  • identificere de 5-10 vigtigste kategorier, du bør fokusere på

Pointen er ikke, at AI gør analysen perfekt. Pointen er, at du kan komme fra kaos til brugbar prioriteringsliste på en eftermiddag.

2. Forhandlingsbriefs på få minutter

En stærk forhandling starter med et klart billede af, hvad du faktisk køber, til hvilke priser og på hvilke vilkår. Her kan GenAI hjælpe med at:

  • trække nøgleklausuler ud af kontrakter (opsigelse, prisregulering, rabatter)
  • summere aftalegrundlag per leverandør
  • matche faktiske køb mod kontraktvilkår

I stedet for at bruge tre dage på at bladre PDF-kontrakter igennem, kan du bruge din tid på at beslutte, hvad du vil opnå i forhandlingen. Det er typisk der, der skabes værdi.

3. Overblik over afvigelser og maverick spend

AI i procurement bliver ofte solgt som magisk besparelsesmaskine. I praksis starter gevinsterne ofte med noget mere jordnært: at opdage, hvor organisationen køber uden om aftaler, eller hvor priser glider stille og roligt op.

Her kan modellerne hjælpe med at:

  • fange køb uden for aftaleleverandører i bestemte kategorier
  • pege på prisafvigelser på ensartede varer
  • identificere enheder, der konsekvent bryder indkøbspolitikken

Det er også her, det begynder at hænge sammen med klassisk forandringsledelse: teknologien kan pege på problemet, men mennesker skal stadig tage dialogen om adfærd og ansvar.

Datagrundlaget: hvad du faktisk skal have styr på

Der er én ubehagelig sandhed, du ikke slipper uden om: AI er ikke bedre end de data, du fodrer den med. Men du behøver heller ikke et perfekt datalandskab for at komme i gang. Du skal have et minimumssæt felter, som er nogenlunde pålidelige.

De felter, du skal kunne trække konsekvent

Hvis du vil bruge GenAI fornuftigt i indkøb, bør du som minimum kunne trække følgende felter ud af økonomisystem eller ERP:

  • Leverandørnavn (som bogført)
  • Leverandørnummer
  • Fritekst-varelinje / beskrivelse
  • Konto / kontoplan (gerne både nummer og tekst)
  • Beløb (inkl. valuta)
  • Dato for bilag
  • Enhed / afdeling / cost center
  • Fakturanummer / bilagsnummer

Det behøver ikke være perfekt, men det skal være stabilt. Hvis de samme konti pludselig bruges til vidt forskellige formål mellem år, bliver analysen mudret for både dig og modellen.

Strukturer først, automatiser bagefter

En praktisk måde at tænke det på er:

  • Første iteration: Udtræk data, rens åbenlyse fejl, og lad GenAI hjælpe med at foreslå kategorier og konsoliderede leverandørnavne.
  • Anden iteration: Tilpas kontoplanen og måske en simpel indkøbskategori-struktur, så fremtidige data bliver mere ensartede.
  • Tredje iteration: Automatiser pipelines (fx via scripts eller et simpelt værktøj), så opdaterede spend-analyser kan køre næsten på autopilot.

Hvis du hopper direkte til automatisering uden at have kigget dine data grundigt igennem mindst én gang, risikerer du bare at gøre fejlene hurtigere.

Use case 1: kategorisering og leverandør-normalisering

Det her er det kedeligste arbejde i indkøb. Derfor er det perfekt til GenAI.

Sådan ser workflowet ud i praksis

Forestil dig, at du har trukket et CSV-udtræk med 50.000 linjer. Du kan køre følgende proces med en GenAI-model (enten via et værktøj, I bygger, eller via en leverandør):

  1. Tag et repræsentativt udsnit (fx 2.000 linjer) og bed modellen foreslå 15-25 hovedkategorier baseret på beskrivelse, konto og eventuelle eksisterende kategorier.
  2. Gennemgå og juster kategorierne manuelt. Fjern overlappende kategorier, og navngiv dem, så de giver mening for jeres organisation.
  3. Bed modellen tildele en af disse kategorier til hver linje i hele datasættet.
  4. Lad modellen gruppere leverandørnavne, der sandsynligvis er samme virksomhed (f.eks. “ABC IT ApS”, “ABC-IT”, “A.B.C. It”) og foreslå en konsolideret leverandøridentitet.
  5. Gennemgå de største leverandører manuelt for at sikre, at grupperingen er korrekt.

Resultatet er ikke akademisk perfekt, men det er typisk 80-90 % bedre end det, mange virksomheder har i dag. Og du er kommet dertil på dage, ikke måneder.

Eksempel på prompt til kategorisering

Hvis du arbejder med en model via et værktøj med tabel-understøttelse (fx CSV-upload), kan en simpel prompt i starten se sådan ud:

“Du er indkøbskonsulent. Du får et udsnit af virksomhedens indkøbsdata med felterne: leverandørnavn, kontotekst, beskrivelse og beløb. 1) Foreslå 20 indkøbskategorier, der dækker datasættet. 2) Returner en tabel, hvor hver linje er tildelt en af kategorierne i en ny kolonne kaldet ‘AI_kategori’. Kategorinavne skal være korte og relevante for en dansk mellemstor virksomhed.”

Det lyder banalt, men de fleste, der eksperimenterer med AI i indkøb, starter for uklart. Jo mere konkret og forretningsnært du instruerer modellen, desto bedre output.

Use case 2: kontrakt-udtræk til forhandlingsbriefs

Kontrakter er et perfekt eksempel på noget, hvor GenAI og mennesker supplerer hinanden. Modellen er god til at læse alt. Du er god til at vurdere, hvad der betyder noget.

Fra PDF-rod til struktureret overblik

Et typisk forløb ser sådan her ud:

  1. Samle alle kontrakter for de 10 største leverandører, gerne i PDF eller tekstformat.
  2. Definere et fast “kontrakt-resume”-skema, fx:
    • Grundlæggende vilkår (startdato, slutdato, opsigelsesvarsel)
    • Prisstruktur (listepriser, rabatter, indeksregulering)
    • Service levels og bodsregler
    • Eksklusivitetsforpligtelser
    • Andre kritiske klausuler (lock-in, minimumsforbrug osv.)
  3. Bruge GenAI til at udfylde skemaet for hver kontrakt, baseret på kontraktteksten.
  4. Lade en indkøber/generelist tjekke resumeet op mod originalkontrakten.

Du ender med et simpelt, sammenligneligt overblik, der kan genbruges hver gang, du planlægger forhandlinger eller får ny indkøbschef.

Prompt-eksempel til kontraktresumé

“Du er juridisk assistent for et indkøbsteam. Du får en kontrakttekst på dansk mellem en virksomhed og en leverandør. Udfyld følgende felter i en kort, punktvis opsummering: – Parter – Varighed og opsigelse – Prisstruktur og rabatter – Prisregulering (indeks, frekvens, loft) – Væsentlige servicekrav og bod – Eksklusivitet og minimumsforbrug – Andre forhold, der er særligt kritiske ved genforhandling Svar på dansk i en struktureret liste. Hvis et felt ikke findes, skriver du ‘Ikke angivet’.”

Her er den vigtige detalje: Du beder modellen om at markere mangler i kontrakten, ikke bare genfortælle den. Det gør det meget nemmere at se, hvor du faktisk har huller eller uklare forhold.

Use case 3: maverick spend og prisafvigelser

De fleste ledelser bliver mere motiverede af konkrete afvigelser end af store principper. “Vi har 14 % maverick spend på IT-udstyr” er mere brugbart end “vi burde have bedre compliance”.

Sådan bygger du en simpel afvigelsesrapport med GenAI

Udgangspunktet er, at du har dine transaktionsdata, og at du har defineret, hvem der er “aftaleleverandør” i hver kategori. Så kan du:

  1. Bruge modellen til at identificere køb i en given kategori, der ligger hos andre leverandører end de aftalte.
  2. Lade modellen gruppere afvigende køb efter enhed/afdeling.
  3. Bede modellen om at prioritere de største afvigelser økonomisk og foreslå mulige forklaringer baseret på beskrivelsestekst.

Her vil du ofte opdage en blanding af helt legitime undtagelser og ren adfærd. Forskellen er, at du kan gå til dialogen med tal og konkrete cases.

Prisbenchmark som indikationsværktøj

GenAI kan også bruges til grov benchmark, men her skal du være mere forsigtig. En model kan f.eks. hjælpe dig med at:

  • gruppere produkter, der ligner hinanden (samme type, samme leverandør, samme mærke)
  • pege på prisvariationer inden for samme produktgruppe

Det er sjældent et juridisk holdbart benchmark, men det er et rigtig godt udgangspunkt for at spørge: “Hvorfor betaler vi 18 % mere for samme produkt på den her lokation end på de andre?”

Kontroller: fortrolighed, hallucinationer og godkendelsesflow

Indkøb er fuld af følsomme data: priser, rabatter, leverandørrelationer. Samtidig er GenAI-modeller gode til at svare selvsikkert, også når de tager fejl. Kombinationen kræver lidt omtanke.

Fortrolighed og dataplacering

Før du uploader noget som helst, skal du have styr på, hvor data ender, og hvem der har adgang. Her er det værd at kigge forbi både jeres egne politikker for cyber og informationssikkerhed og de krav, der følger af EU-regler, fx databeskyttelse og kommende AI-forordning.

Som tommelfingerregel:

  • Brug leverandører, der eksplicit tilbyder “no training” på jeres data i enterprise-opsætninger.
  • Undlad at sende hele kontrakter med de mest følsomme vilkår i generiske, åbne AI-tjenester.
  • Overvej at pseudonymisere data (fjerne direkte kunde- og leverandørnavne) i de tidlige eksperimenter.

Hallucinationer: AI må aldrig være eneste sandhedskilde

GenAI skal ikke erstatte din juridiske afdeling eller din erfarne indkøber. Modellen skal hjælpe med at reducere mængden af råmateriale, ikke overtage vurderingen.

Tre simple guardrails:

  • AI må gerne foreslå kategorier, men ikke ændre priser eller kontrakttekster.
  • AI må gerne skrive kontrakt-resuméer, men en menneskelig reviewer skal altid godkende dem.
  • AI må gerne foreslå potentielle besparelser, men beslutningen om at gå videre tages først, når data er verificeret.

Det kan virke basalt, men mange AI-projekter går galt, fordi man glemmer den sidste del og forventer fuld automatik fra dag ét.

Godkendelsesflow og roller

Der er en grund til, at mange AI-implementeringer flytter ind under kategorien implementerings tjekliste. Du har brug for et simpelt, men klart flow:

  • Data-ejer: sikrer, at datagrundlaget er lovligt og korrekt.
  • AI-operatør: kører prompts, opsætter workflows og dokumenterer, hvad modellen har lavet.
  • Faglig reviewer: validerer resultaterne og træffer beslutning om brug.

Det kan i starten være de samme to-tre mennesker, der har flere kasketter på, men rollerne skal være tydelige. Især når noget går galt, og I skal kunne forklare, hvorfor.

KPI’er: hvordan du måler, om AI i indkøb virker

Hvis du vil have ledelsen med på at skalere AI i procurement, bliver du nødt til at dokumentere mere end “det føles hurtigere”.

Tre simple måledimensioner

En enkel KPI-model kan fokusere på:

  • Besparelser: dokumenterede prisreduktioner, forbedrede rabatter eller undgåede omkostninger.
  • Cykeltid: hvor lang tid der går fra dataudtræk til klar forhandlingsbrief eller spend-rapport.
  • Compliance: reduktion i maverick spend eller andel af indkøb på aftaleleverandører.

Du behøver ikke være perfekt. Det vigtige er, at du måler før og efter en konkret AI-pilot på samme måde.

Et konkret eksempel på KPI-sæt

Forestil dig, at du laver en 3-måneders pilot på GenAI-understøttet spend-analyse og forhandling på IT-kategorien. Dine KPI’er kunne være:

  • Reducere gennemsnitlig tid til spend-analyse fra 4 uger til 5 arbejdsdage.
  • Identificere og realisere prisreduktioner på mindst 5 % på top 10 IT-varer.
  • Skære maverick spend på IT med 30 % i de afdelinger, der er med i piloten.

Det er tal, man kan tale om på et ledermøde uden at forsvinde ned i tekniske detaljer.

4-ugers pilot: sådan kommer du i gang uden at bygge et programkontor

Hvis du vil prøve AI i indkøb af i praksis, giver det mere mening at lave en skarp, tidsafgrænset pilot end at skrive en stor strategi fra starten. Her er et forslag til et 4-ugers forløb.

Uge 1: Afgrænsning og data

  • Vælg én kategori (fx IT, marketing eller rejser) med høj volumen og relativt god datakvalitet.
  • Træk 12 måneders transaktionsdata for kategorien med de felter, vi gennemgik før.
  • Udvælg 5-10 centrale leverandørkontrakter i kategorien.
  • Få styr på, hvilke AI-værktøjer og datamæssige rammer I må bruge.

Uge 2: Spend-kategorisering og leverandørbillede

  • Brug GenAI til at foreslå og tildele kategorier til alle transaktioner.
  • Lad modellen gruppere leverandørnavne, og valider top 20 leverandører manuelt.
  • Byg første version af en visuel spend-oversigt (fx i Power BI eller Excel).

Uge 3: Kontrakt-resuméer og forhandlingsbriefs

  • Brug GenAI til at lave kontrakt-resuméer i et fast format.
  • Match kontraktvilkår med faktisk spend pr. leverandør.
  • Udarbejd 3-5 forhandlingsbriefs, hvor AI-output er integreret.

Uge 4: Forhandlinger og læring

  • Gennemfør minimum 2-3 forhandlingsdialoger baseret på de nye briefs.
  • Dokumenter besparelser, forbedringer og tidsforbrug sammenlignet med tidligere.
  • Evaluer: hvor gav AI mest værdi, hvor skabte det støj, og hvad skal skaleres op/ned.

Efter sådan en pilot har du noget langt mere konkret at tale om end “AI-strategi”. Du har erfaringer, tal og fejl, du kan lære af. Det er typisk her, samtalen flytter sig fra hype til drift, lidt som vi også ser det i mere regulerede områder som NIS2-arbejdet i mange virksomheder.

Hvad du ikke bør automatisere (i hvert fald ikke endnu)

Fristelsen er selvfølgelig at lade modellen overtage så meget som muligt. Men der er nogle områder, hvor det stadig er direkte risikabelt at give slip.

Juridiske vurderinger og kontraktændringer

AI må gerne hjælpe med at opsummere og sammenligne klausuler. Den skal ikke selv formulere nye juridisk bindende bestemmelser uden tæt menneskelig kontrol. Her krydser du hurtigt ind i områder, hvor både regulering og praksis stadig udvikler sig, og hvor fejl kan blive dyre.

Endelige leverandørvalg

Det kan være fristende at lade en model rangordne leverandører og sige: “Her er den bedste”. Det bør du undgå. Modellen kan foreslå kandidater baseret på pris, performance og risikoindikatorer, men leverandørvalg handler også om relationer, kapacitet, strategisk fit og nogle gange ren mavefornemmelse. Det er menneskearbejde.

Automatisk kommunikation til leverandører

AI-genererede mails kan være fine udkast, men du bør ikke lade en model sende automatiske forhandlingsudspil eller opsigelser uden menneskelig gennemgang. Det er få beskeder, men de bærer stor vægt i relationen. Her er gevinsten ved fuld automatisering simpelthen for lille i forhold til risikoen.

Indgå en klar Data Processing Agreement med AI-leverandøren, brug pseudonymisering eller anonymisering før dataoverførsel, og foretræk enterprise-løsninger der ikke gemmer inputdata. Overvej private modeller eller on-prem/privat cloud for særligt følsomme data, og sørg for kryptering både under transport og ved lagring.
Start med baseline-målinger som tid brugt på categorisering, antal kontraktgennemgangstimer, mængde maverick spend og antal leverandører pr. kategori. Sæt konkrete mål i tid- eller omkostningsbesparelser (f.eks. FTE-timer sparet) samt kvalitets- og adoptationsmål som korrekthed og brugeraccept. Brug før-efter data og spor både direkte besparelser og værdien af hurtigere beslutninger.
Implementer menneskelig validering på en delmængde af output som standard, brug confidence-score-thresholds og rules-baserede fallback-regler for kritiske beslutninger. Log resultater, kør regelmæssige stikprøver og etabler en feedback-loop, så modellen kalibreres løbende og fejl hurtigt rettes.
Undgå at starte for bredt eller lade teknologien drive initiativet uden ejerskab og procesforankring. Sæt et snævert pilotscope, definer klare succeskriterier, involver både indkøb, IT og juridisk samt plan for change management, så løsningen skaleres med governance og ansvar på plads.

Rasmus Bendtsen

nørdet iværksættertype med hang til regneark og forretningsmodeller

Rasmus Bendtsen skriver for Eagle insights som den der altid lige laver et ekstra regneark for at forstå, hvad der faktisk foregår bag tallene. Han brænder for at omsætte markedsdata, teknologi og forretningsmodeller til jordnære indsigter, du kan bruge i virkelige beslutninger.

5 articles

Jeg stoler mere på et ærligt regneark og en konkret kundeobservation end på den næste store trend-slide. Hvis vi ikke kan forklare en idé på helt almindeligt dansk, er den som regel ikke klar til at blive til virkelighed endnu.
— Rasmus Bendtsen

Related Posts

Hvorfor 110 % vækst kan være dårligt nyt – sandheden om net revenue retention

Net revenue retention kan være dit skarpeste nøgletal i B2B/SaaS – eller dit farligste selvbedrag. Her får du en praktisk, dansk opskrift på definitioner, beregning og konkrete greb, der faktisk flytter NRR.

Dashboards der ikke spilder nogens tid

De fleste dashboards ser flotte ud, men ændrer meget lidt i praksis. Her får du en decision-first tilgang til KPI’er, møderytme og ejerskab, så tallene faktisk bliver brugt til beslutninger i hverdagen.