Datakvalitet for AI er fundamentet der afgør om kunstig intelligens skaber værdi eller producerer meningsløse resultater. AI-systemer er kun så gode som de data de fodres med — og for de fleste danske SMV’er er data den reelle flaskehals, ikke teknologien. DI Handel har dokumenteret at manglende datamodenhed er den primære årsag til at SMV’er ikke høster AI-gevinsterne.

61 procent af danske virksomheder tror at AI kan gøre dem mere succesfulde med kundedata. Men færre end 20 procent har den datakvalitet der kræves for at AI leverer pålidelige resultater. Denne guide viser dig hvordan du lukker det gap.

Hvad er datakvalitet — og hvorfor er det vigtigt for AI?

Datakvalitet er et mål for om virksomhedens data er nøjagtig, komplet, konsistent, aktuel og tilgængelig nok til at understøtte de beslutninger og systemer der bruger den.

For AI betyder dårlig datakvalitet konkret:

Forkerte prognoser: AI-baseret salgsprognose der bygger på ufuldstændige salgsdata giver misvisende budgetter
Biased beslutninger: AI-rekruttering der trænes på skæve historiske data reproducerer bias
Spildt investering: Automatiseringer der fejler fordi stamdata i ERP/CRM er forældede eller inkonsistente
Tabt troværdighed: Når AI-systemet giver forkerte svar, mister medarbejderne tilliden — og stopper med at bruge det

“Garbage in, garbage out” er ikke bare et kliché. Det er den mest præcise beskrivelse af forholdet mellem datakvalitet og AI-resultater. I vores arbejde med danske virksomheder ser vi at 40-60 procent af AI-implementeringsfejl skyldes dataproblemer — ikke teknologiproblemer.

De 5 dimensioner af datakvalitet

1. Nøjagtighed: Er data korrekt?

Stemmer dataene overens med virkeligheden? Fejlagtige postadresser, forkerte telefonnumre, forældede jobtitler og dobbeltregistrerede kunder — alle er nøjagtighedsproblemer der påvirker AI.

Test: Tag 50 tilfældige kunderegistreringer og verificér manuelt. Hvis mere end 10 procent har fejl, har I et nøjagtighedsproblem.

2. Komplethed: Mangler der data?

Tomme felter, manglende registreringer og huller i tidsserier. AI kan håndtere lidt manglende data, men store huller giver upålidelige resultater.

Test: Kør en simpel rapport over tomme felter i jeres CRM/ERP. Felter med over 30 procent tomme værdier er problematiske for AI.

3. Konsistens: Er data ens på tværs af systemer?

Samme kunde med tre forskellige navnevariationer i CRM, ERP og email-system. Samme produkt med forskellige kategorier i webshop og lager. Inkonsistens forvirrer AI og giver duplikerede eller modstridende resultater.

4. Aktualitet: Er data opdateret?

Kundelister fra 2022 er ikke brugbare for AI-baseret leadscoring i 2026. Prislister der ikke matcher de aktuelle priser giver forkerte tilbudsberegninger.

5. Tilgængelighed: Kan data bruges?

Data der sidder fast i Excel-ark på enkeltpersoners computere, i papirmapper eller i systemer uden API er utilgængelige for AI. Tilgængelighed handler om at samle data der kan bruges programmatisk. Naar dine data er tilgaengelige, kan du bruge AI-dataanalyse uden kodning til at faa indsigter direkte fra dine forretningssystemer.

AI-AG’s 5-trins dataklarhedsmodel

Baseret på vores erfaringer med danske virksomheder har vi hos AI-AG udviklet en pragmatisk model til at vurdere og forbedre datakvalitet:

Trin	Varighed	Aktivitet	Output
1. Data-audit	1 uge	Kortlæg alle datakilder, systemer og datakvalitet	Dataoverblik + quality score
2. Stamdata-oprydning	2-4 uger	Deduplikér, korriger og standardiser kernedata	Ren stamdata
3. Dataintegration	2-3 uger	Forbind systemer så data flyder automatisk	Sammenhængende datalandskab
4. Datakvalitetskontrol	1 uge	Opsæt automatiske kvalitetstjek og alerts	Løbende kvalitetssikring
5. AI-klar validering	1 uge	Test data mod AI use case-krav	Grønt lys til AI-implementering

Trin 1: Data-audit — Forstå hvad du har

Start med at kortlægge:

Hvilke systemer indeholder data? (CRM, ERP, regnskab, email, Excel-filer)
Hvilke data har I? (kunder, produkter, transaktioner, medarbejdere)
Hvor er overlapppen? (samme data i flere systemer — potentiel inkonsistens)
Hvad mangler? (data I gerne ville have men ikke indsamler)

Brug vores AI-modenhedsmodel til at vurdere jeres datamodenhed som del af den bredere AI-parathedsvurdering.

Trin 2: Stamdata-oprydning

Stamdata er kernedata der bruges på tværs af systemer: kunder, produkter, leverandører, medarbejdere. Oprydning indebærer:

Deduplikering: Find og sammenflet dobbeltregistreringer
Standardisering: Ens format for adresser, telefonnumre, firmanaVne
Korrektion: Ret kendte fejl og opdatér forældede data
Berigelse: Tilføj manglende data fra pålidelige kilder (CVR-registret, Google Places)

En dansk handelsvirksomhed med 8.000 kunder i deres CRM opdagede under data-auditten at 23 procent var duplikater. Det betød at deres AI-baserede kundesegmentering var fundamentalt misvisende. Efter oprydning gav den samme AI-model 3 gange mere præcise segmenter.

Trin 3: Dataintegration

Data der lever i siloer er ubrugelig for AI. Forbind jeres systemer så data flyder automatisk:

CRM ↔ ERP: Kundedata synkroniseres automatisk
Regnskab ↔ CRM: Omsætningsdata beriger kundeprofiler
Webshop ↔ Lager: Salgsdata driver lagerstyring

Værktøjer som n8n, Make og Zapier kan bygge disse integrationer uden tung IT-investering.

Trin 4: Løbende kvalitetskontrol

Datakvalitet er ikke et engangsprojekt — det er en løbende disciplin. Opsæt:

Automatiske valideringer ved datainddatering (format, completeness)
Ugentlige data quality-rapporter med key metrics
Kvartalsvise reviews af stamdata
Klare ejerskaber: hvem er ansvarlig for hvilke data?

Trin 5: AI-klar validering

Før du bygger AI-løsninger, valider at data opfylder de specifikke krav:

Er der nok datapunkter? (AI kræver typisk 100+ eksempler for mønstergenkendelse)
Er tidsserier komplette? (huller ødelægger forecasting-modeller)
Er labels korrekte? (AI-klassificering kræver korrekte kategoriseringer)
Er data repræsentativ? (skæve data giver skæve AI-resultater)

Hvad koster dataklarhed?

Virksomhedsstørrelse	Typisk investering	Varighed
5-20 ansatte	15.000-40.000 kr.	4-6 uger
20-50 ansatte	40.000-100.000 kr.	6-10 uger
50-100 ansatte	100.000-250.000 kr.	8-16 uger

Investeringen betaler sig tilbage i form af:

Bedre AI-resultater (færre fejl, mere præcise prognoser)
Hurtigere AI-implementering (mindre debugging)
Bedre beslutningsgrundlag (også uden AI)
Compliance-fordele (GDPR kræver overblik over persondata)

Husk at SMV:Digital kan dække en del af omkostningerne til datakvalitetsrådgivning.

Start i dag: 3 ting du kan gøre nu

Kør en simpel data-audit: Lav en liste over alle systemer der indeholder data. Notér hvad de indeholder og hvem der er ansvarlig.
Test nøjagtighed: Tag 50 tilfældige kunderegistreringer og tjek om de er korrekte. Resultatet fortæller dig om I har et problem.
Identificér datasiloer: Hvor lever data der ikke er forbundet med andre systemer? Det er jeres første integrationsprojekt.

For den overordnede AI-implementeringstilgang, se vores AI-strategi guide og implementeringstjekliste.

Vil du have hjælp til at vurdere jeres datakvalitet og AI-parathed? Book en uforpligtende snak med AI-AG.

FAQ

Hvor god skal datakvaliteten være for at bruge AI?

Det afhænger af use casen. Simple automatiseringer (email-kategorisering, rapportgenerering) kræver mindre end prædiktiv analyse (salgsprognose, lead scoring). Som tommelfingerregel: nøjagtighed over 90 procent, komplethed over 80 procent, og ingen systematiske bias. Test altid med jeres specifikke data.

Kan AI selv rense data?

Delvist. AI kan hjælpe med at finde duplikater, standardisere formater og identificere anomalier. Men den endelige validering kræver menneskelig vurdering — kun I ved om “Martin Terp” og “M. Terp” er samme person. Brug AI som assistent i oprydningen, ikke som eneste ansvarlig.

Hvad er det vigtigste dataproblem for danske SMV’er?

Datasiloer. Data der lever i separate systemer (CRM, ERP, regnskab, Excel) uden forbindelse. Det betyder at AI kun ser en brøkdel af billedet. Integration af kernesystemer er typisk det vigtigste første skridt.

Hvor lang tid tager det at gøre data AI-klar?

For en typisk dansk SMV med 20-50 ansatte: 6-10 uger fra audit til AI-klar validering. Den længste fase er stamdata-oprydning (2-4 uger), fordi det kræver både teknisk og forretningsmæssig vurdering.

Hvad gør vi hvis vi slet ikke har data?

Start med at indsamle. Opsæt tracking i jeres eksisterende systemer, begynd at registrere processer digitalt, og etablér dataindsamling som en del af daglige workflows. AI kan bruges meningsfuldt efter 3-6 måneders systematisk dataindsamling for de fleste formål.

Ja. GDPR kræver at I kan dokumentere hvilke persondata I behandler, hvor de opbevares, og hvem der har adgang. En data-audit til AI-formål giver jer samtidig det overblik GDPR kræver — to fluer med ét smæk.

Indholdet er udarbejdet med AI-assisteret teknologi og gennemgået af Martin Terp.

Datakvalitet for AI: Gør din virksomhed dataklar

Hvad er datakvalitet — og hvorfor er det vigtigt for AI?

De 5 dimensioner af datakvalitet

1. Nøjagtighed: Er data korrekt?

2. Komplethed: Mangler der data?

3. Konsistens: Er data ens på tværs af systemer?

4. Aktualitet: Er data opdateret?

5. Tilgængelighed: Kan data bruges?

AI-AG’s 5-trins dataklarhedsmodel

Trin 1: Data-audit — Forstå hvad du har

Trin 2: Stamdata-oprydning

Trin 3: Dataintegration

Trin 4: Løbende kvalitetskontrol

Trin 5: AI-klar validering

Hvad koster dataklarhed?

Start i dag: 3 ting du kan gøre nu

FAQ

Hvor god skal datakvaliteten være for at bruge AI?

Kan AI selv rense data?

Hvad er det vigtigste dataproblem for danske SMV’er?

Hvor lang tid tager det at gøre data AI-klar?

Hvad gør vi hvis vi slet ikke har data?

Få en gratis system-analyse

Hvad er datakvalitet — og hvorfor er det vigtigt for AI?

De 5 dimensioner af datakvalitet

1. Nøjagtighed: Er data korrekt?

2. Komplethed: Mangler der data?

3. Konsistens: Er data ens på tværs af systemer?

4. Aktualitet: Er data opdateret?

5. Tilgængelighed: Kan data bruges?

AI-AG’s 5-trins dataklarhedsmodel

Trin 1: Data-audit — Forstå hvad du har

Trin 2: Stamdata-oprydning

Trin 3: Dataintegration

Trin 4: Løbende kvalitetskontrol

Trin 5: AI-klar validering

Hvad koster dataklarhed?

Start i dag: 3 ting du kan gøre nu

FAQ

Hvor god skal datakvaliteten være for at bruge AI?

Kan AI selv rense data?

Hvad er det vigtigste dataproblem for danske SMV’er?

Hvor lang tid tager det at gøre data AI-klar?

Hvad gør vi hvis vi slet ikke har data?

Kræver GDPR at vi har styr på vores data?

Få en gratis system-analyse