Datakvalitet for AI er fundamentet der afgør om kunstig intelligens skaber værdi eller producerer meningsløse resultater. AI-systemer er kun så gode som de data de fodres med — og for de fleste danske SMV’er er data den reelle flaskehals, ikke teknologien. DI Handel har dokumenteret at manglende datamodenhed er den primære årsag til at SMV’er ikke høster AI-gevinsterne.
61 procent af danske virksomheder tror at AI kan gøre dem mere succesfulde med kundedata. Men færre end 20 procent har den datakvalitet der kræves for at AI leverer pålidelige resultater. Denne guide viser dig hvordan du lukker det gap.
Hvad er datakvalitet — og hvorfor er det vigtigt for AI?
Datakvalitet er et mål for om virksomhedens data er nøjagtig, komplet, konsistent, aktuel og tilgængelig nok til at understøtte de beslutninger og systemer der bruger den.
For AI betyder dårlig datakvalitet konkret:
- Forkerte prognoser: AI-baseret salgsprognose der bygger på ufuldstændige salgsdata giver misvisende budgetter
- Biased beslutninger: AI-rekruttering der trænes på skæve historiske data reproducerer bias
- Spildt investering: Automatiseringer der fejler fordi stamdata i ERP/CRM er forældede eller inkonsistente
- Tabt troværdighed: Når AI-systemet giver forkerte svar, mister medarbejderne tilliden — og stopper med at bruge det
“Garbage in, garbage out” er ikke bare et kliché. Det er den mest præcise beskrivelse af forholdet mellem datakvalitet og AI-resultater. I vores arbejde med danske virksomheder ser vi at 40-60 procent af AI-implementeringsfejl skyldes dataproblemer — ikke teknologiproblemer.
De 5 dimensioner af datakvalitet
1. Nøjagtighed: Er data korrekt?
Stemmer dataene overens med virkeligheden? Fejlagtige postadresser, forkerte telefonnumre, forældede jobtitler og dobbeltregistrerede kunder — alle er nøjagtighedsproblemer der påvirker AI.
Test: Tag 50 tilfældige kunderegistreringer og verificér manuelt. Hvis mere end 10 procent har fejl, har I et nøjagtighedsproblem.
2. Komplethed: Mangler der data?
Tomme felter, manglende registreringer og huller i tidsserier. AI kan håndtere lidt manglende data, men store huller giver upålidelige resultater.
Test: Kør en simpel rapport over tomme felter i jeres CRM/ERP. Felter med over 30 procent tomme værdier er problematiske for AI.
3. Konsistens: Er data ens på tværs af systemer?
Samme kunde med tre forskellige navnevariationer i CRM, ERP og email-system. Samme produkt med forskellige kategorier i webshop og lager. Inkonsistens forvirrer AI og giver duplikerede eller modstridende resultater.
4. Aktualitet: Er data opdateret?
Kundelister fra 2022 er ikke brugbare for AI-baseret leadscoring i 2026. Prislister der ikke matcher de aktuelle priser giver forkerte tilbudsberegninger.
5. Tilgængelighed: Kan data bruges?
Data der sidder fast i Excel-ark på enkeltpersoners computere, i papirmapper eller i systemer uden API er utilgængelige for AI. Tilgængelighed handler om at samle data der kan bruges programmatisk. Naar dine data er tilgaengelige, kan du bruge AI-dataanalyse uden kodning til at faa indsigter direkte fra dine forretningssystemer.
AI-AG’s 5-trins dataklarhedsmodel
Baseret på vores erfaringer med danske virksomheder har vi hos AI-AG udviklet en pragmatisk model til at vurdere og forbedre datakvalitet:
| Trin | Varighed | Aktivitet | Output |
|---|---|---|---|
| 1. Data-audit | 1 uge | Kortlæg alle datakilder, systemer og datakvalitet | Dataoverblik + quality score |
| 2. Stamdata-oprydning | 2-4 uger | Deduplikér, korriger og standardiser kernedata | Ren stamdata |
| 3. Dataintegration | 2-3 uger | Forbind systemer så data flyder automatisk | Sammenhængende datalandskab |
| 4. Datakvalitetskontrol | 1 uge | Opsæt automatiske kvalitetstjek og alerts | Løbende kvalitetssikring |
| 5. AI-klar validering | 1 uge | Test data mod AI use case-krav | Grønt lys til AI-implementering |
Trin 1: Data-audit — Forstå hvad du har
Start med at kortlægge:
- Hvilke systemer indeholder data? (CRM, ERP, regnskab, email, Excel-filer)
- Hvilke data har I? (kunder, produkter, transaktioner, medarbejdere)
- Hvor er overlapppen? (samme data i flere systemer — potentiel inkonsistens)
- Hvad mangler? (data I gerne ville have men ikke indsamler)
Brug vores AI-modenhedsmodel til at vurdere jeres datamodenhed som del af den bredere AI-parathedsvurdering.
Trin 2: Stamdata-oprydning
Stamdata er kernedata der bruges på tværs af systemer: kunder, produkter, leverandører, medarbejdere. Oprydning indebærer:
- Deduplikering: Find og sammenflet dobbeltregistreringer
- Standardisering: Ens format for adresser, telefonnumre, firmanaVne
- Korrektion: Ret kendte fejl og opdatér forældede data
- Berigelse: Tilføj manglende data fra pålidelige kilder (CVR-registret, Google Places)
En dansk handelsvirksomhed med 8.000 kunder i deres CRM opdagede under data-auditten at 23 procent var duplikater. Det betød at deres AI-baserede kundesegmentering var fundamentalt misvisende. Efter oprydning gav den samme AI-model 3 gange mere præcise segmenter.
Trin 3: Dataintegration
Data der lever i siloer er ubrugelig for AI. Forbind jeres systemer så data flyder automatisk:
- CRM ↔ ERP: Kundedata synkroniseres automatisk
- Regnskab ↔ CRM: Omsætningsdata beriger kundeprofiler
- Webshop ↔ Lager: Salgsdata driver lagerstyring
Værktøjer som n8n, Make og Zapier kan bygge disse integrationer uden tung IT-investering.
Trin 4: Løbende kvalitetskontrol
Datakvalitet er ikke et engangsprojekt — det er en løbende disciplin. Opsæt:
- Automatiske valideringer ved datainddatering (format, completeness)
- Ugentlige data quality-rapporter med key metrics
- Kvartalsvise reviews af stamdata
- Klare ejerskaber: hvem er ansvarlig for hvilke data?
Trin 5: AI-klar validering
Før du bygger AI-løsninger, valider at data opfylder de specifikke krav:
- Er der nok datapunkter? (AI kræver typisk 100+ eksempler for mønstergenkendelse)
- Er tidsserier komplette? (huller ødelægger forecasting-modeller)
- Er labels korrekte? (AI-klassificering kræver korrekte kategoriseringer)
- Er data repræsentativ? (skæve data giver skæve AI-resultater)
Hvad koster dataklarhed?
| Virksomhedsstørrelse | Typisk investering | Varighed |
|---|---|---|
| 5-20 ansatte | 15.000-40.000 kr. | 4-6 uger |
| 20-50 ansatte | 40.000-100.000 kr. | 6-10 uger |
| 50-100 ansatte | 100.000-250.000 kr. | 8-16 uger |
Investeringen betaler sig tilbage i form af:
- Bedre AI-resultater (færre fejl, mere præcise prognoser)
- Hurtigere AI-implementering (mindre debugging)
- Bedre beslutningsgrundlag (også uden AI)
- Compliance-fordele (GDPR kræver overblik over persondata)
Husk at SMV:Digital kan dække en del af omkostningerne til datakvalitetsrådgivning.
Start i dag: 3 ting du kan gøre nu
- Kør en simpel data-audit: Lav en liste over alle systemer der indeholder data. Notér hvad de indeholder og hvem der er ansvarlig.
- Test nøjagtighed: Tag 50 tilfældige kunderegistreringer og tjek om de er korrekte. Resultatet fortæller dig om I har et problem.
- Identificér datasiloer: Hvor lever data der ikke er forbundet med andre systemer? Det er jeres første integrationsprojekt.
For den overordnede AI-implementeringstilgang, se vores AI-strategi guide og implementeringstjekliste.
Vil du have hjælp til at vurdere jeres datakvalitet og AI-parathed? Book en uforpligtende snak med AI-AG.
FAQ
Hvor god skal datakvaliteten være for at bruge AI?
Det afhænger af use casen. Simple automatiseringer (email-kategorisering, rapportgenerering) kræver mindre end prædiktiv analyse (salgsprognose, lead scoring). Som tommelfingerregel: nøjagtighed over 90 procent, komplethed over 80 procent, og ingen systematiske bias. Test altid med jeres specifikke data.
Kan AI selv rense data?
Delvist. AI kan hjælpe med at finde duplikater, standardisere formater og identificere anomalier. Men den endelige validering kræver menneskelig vurdering — kun I ved om “Martin Terp” og “M. Terp” er samme person. Brug AI som assistent i oprydningen, ikke som eneste ansvarlig.
Hvad er det vigtigste dataproblem for danske SMV’er?
Datasiloer. Data der lever i separate systemer (CRM, ERP, regnskab, Excel) uden forbindelse. Det betyder at AI kun ser en brøkdel af billedet. Integration af kernesystemer er typisk det vigtigste første skridt.
Hvor lang tid tager det at gøre data AI-klar?
For en typisk dansk SMV med 20-50 ansatte: 6-10 uger fra audit til AI-klar validering. Den længste fase er stamdata-oprydning (2-4 uger), fordi det kræver både teknisk og forretningsmæssig vurdering.
Hvad gør vi hvis vi slet ikke har data?
Start med at indsamle. Opsæt tracking i jeres eksisterende systemer, begynd at registrere processer digitalt, og etablér dataindsamling som en del af daglige workflows. AI kan bruges meningsfuldt efter 3-6 måneders systematisk dataindsamling for de fleste formål.
Kræver GDPR at vi har styr på vores data?
Ja. GDPR kræver at I kan dokumentere hvilke persondata I behandler, hvor de opbevares, og hvem der har adgang. En data-audit til AI-formål giver jer samtidig det overblik GDPR kræver — to fluer med ét smæk.