Skip to main content

Wat is datakwaliteit?

Leer wat datakwaliteit betekent, hoe u het meet en waarom het het succes van uw rapportage-, automatiserings- en AI-initiatieven bepaalt.

Datakwaliteit definiëren

Datakwaliteit meet hoe goed uw data zijn beoogde doel dient. Het gaat er niet om of data „correct” is in absolute termen. Het gaat erom of uw data geschikt is voor gebruik bij besluitvorming, operaties en analyses.

Een klantadres is van hoge kwaliteit als het de klant bereikt. Een productcode is van hoge kwaliteit als uw systemen deze herkennen. Kwaliteit hangt af van context.

Het principe van „geschiktheid voor het doel”

Datakwaliteit is contextueel. Een verzendadres vereist precisie op straatniveau. Een marketingregio heeft alleen land of staat nodig. Beide kunnen „van hoge kwaliteit” zijn op verschillende precisieniveaus.

Vraag bij het beoordelen van datakwaliteit: Wat moet deze data doen? Meet vervolgens of het dat kan.

Het raamwerk van vijf dimensies

Datakwaliteit wordt gemeten over vijf sleuteldimensies. Dit raamwerk is in sectoren overgenomen en vormt de basis van de ISO 8000- en DAMA-standaarden.

DimensieWat het meetVoorbeeld
VolledigheidVereiste data is aanwezigAlle verplichte velden zijn gevuld
GeldigheidData voldoet aan indelingenE-mailadressen hebben een geldig formaat
UniciteitGeen dubbele recordsÉén record per klant
TijdigheidData is actueelContactinfo bijgewerkt binnen 90 dagen
ConsistentieData is uniform„USA” consistent gebruikt, niet „US” of „United States”

Elke dimensie beantwoordt een specifieke vraag over uw data. Samen geven ze een volledig beeld van de datagezondheid.

Voor gedetailleerde begeleiding over elke dimensie, zie:

Branchestandaarden en -raamwerken

ISO 8000

De ISO 8000-standaard definieert datakwaliteitsvereisten voor de uitwisseling van masterdata. Het stelt principes vast voor datanauwkeurigheid, volledigheid en consistentie tussen organisaties.

DAMA-DMBOK

Het Data Management Association’s Body of Knowledge (DAMA-DMBOK) definieert datakwaliteit als een van de elf kennisgebieden in databeheer. Het biedt begeleiding bij meet-, bewakings- en verbeteringsprocessen.

De 1-10-100-regel

Dit principe illustreert de toenemende kosten van slechte datakwaliteit:

FaseKostenVoorbeeld
Preventie€1Validatie bij gegevensinvoer
Correctie€10Data opschonen na invoer
Mislukking€100Zakelijke impact van slechte data

Investeren in datakwaliteit aan de bron bespaart aanzienlijke kosten stroomafwaarts.

Datakwaliteit vs. verwante concepten

Datakwaliteit vs. databeheer

Databeheer is de bredere praktijk van het verzamelen, opslaan en onderhouden van data. Datakwaliteit is een onderdeel van databeheer, gericht op geschiktheid voor gebruik.

ConceptBereikFocus
DatabeheerAlle datapraktijkenOpslag, toegang, beveiliging, levenscyclus
DatakwaliteitGeschiktheid voor het doelVolledigheid, geldigheid, uniciteit, tijdigheid, consistentie
Data-governanceBeleid en eigenaarschapWie bezit data, wie kan het wijzigen, welke regels zijn van toepassing

Datakwaliteit vs. datanauwkeurigheid

Nauwkeurigheid vraagt: Weerspiegelt deze waarde de werkelijkheid? Kwaliteit vraagt: Werkt deze data voor zijn doel?

Een e-mailadres kan geldig zijn (correct formaat) maar onnauwkeurig (persoon gebruikt het niet meer). DQS meet kwaliteit omdat indeling en volledigheid geautomatiseerd kunnen worden. Nauwkeurigheid vereist doorgaans externe verificatie.

Hoe datakwaliteit wordt gemeten

Kwantitatieve statistieken

Datakwaliteit wordt uitgedrukt via meetbare indicatoren:

StatistiektypeVoorbeeldBerekening
PercentageVulpercentage(Gevulde records / Totaal records) x 100
AantalDuplicaataantalAantal records met overeenkomende waarden
ScoreGeligheidsscoreGewogen gemiddelde over validatieregels
RatioConformiteitspercentageConforme waarden / Totale waarden

Drempelwaarden en doelen

Organisaties stellen drempelwaarden vast op basis van zakelijke vereisten:

NiveauDrempelwaardeGebruiksgeval
Kritiek99%+Velden voor regelgevende rapportage
Hoog95%+Klantgerichte data
Standaard85%+Operationele data
Laag70%+Historische of archiefdata

Continue vs. momentopname-meting

Momentopname-meting biedt een momentopname. Continue meting volgt trends en signaleert degradatie vroegtijdig.

DQS ondersteunt beide benaderingen:

  • Voer ad-hocscans uit voor directe beoordeling
  • Plan terugkerende scans voor voortdurende bewaking

Waarom organisaties moeite hebben

1. Datasilo’s

Wanneer data in niet-verbonden systemen leeft, treden inconsistenties van nature op. Sales heeft één versie van een klantrecord. Support heeft een andere. Niemand weet welke correct is.

2. Handmatige invoerfouten

Handmatige gegevensinvoer is gevoelig voor typefouten, inconsistente opmaak en ontbrekende informatie. Zonder validatieregels stapelen deze fouten zich in de loop van de tijd op.

3. Geen duidelijk eigenaarschap

Wanneer niemand verantwoordelijk is voor datakwaliteit, wordt het ieders probleem en niemands prioriteit. Dataverzorging vereist expliciete toewijzing.

4. Gebrek aan meting

U kunt niet verbeteren wat u niet meet. Veel organisaties gaan ervan uit dat hun data goed genoeg is zonder basislijnen te bepalen of statistieken bij te houden.

5. Eenmalige opschoonprojecten

Datakwaliteit behandelen als een project in plaats van een proces leidt tot tijdelijke verbeteringen die in de loop van de tijd degraderen.

De zakelijke impact

Slechte datakwaliteit treft elke functie:

FunctieImpact
MarketingCampagnes verzonden naar verkeerde adressen, verspild budget
SalesTijd verspild aan dubbele leads, verloren context
FinanciënOnnauwkeurige rapporten, compliancerisico’s
OperatiesBeslissingen op basis van foutieve data
AI/MLModellen getraind op slechte data produceren slechte uitkomsten

De kosten kwantificeren

Onderzoek van MIT Sloan en branchestudies toont aan:

  • Organisaties verliezen jaarlijks 15-25% van hun omzet door slechte datakwaliteit
  • Meer dan 25% van de organisaties verliest meer dan $5 miljoen per jaar aan dataproblemen (IBM 2025)
  • Medewerkers besteden tot 27% van hun tijd aan het corrigeren van slechte data

Verbinding met AI-gereedheid

Traditionele datakwaliteit (de vijf dimensies) bereidt uw data voor op rapportage en automatisering. AI-applicaties zoals Agentforce zijn afhankelijk van dezelfde grondslagen: volledige records, geldige indelingen, consistente waarden, actuele data en geen duplicaten.

Bovenop die vijf dimensies introduceert AI-implementatie één aanvullende bezorgdheid: blootstelling van gevoelige data. Voordat u AI-agents verbindt met uw Salesforce-data, moet u weten waar PII zich bevindt, zodat u het kunt maskeren of uitsluiten.

DQS meet zowel traditionele datakwaliteit als AI-gereedheid in één platform:

  • Vijf datakwaliteitsdimensies: Volledigheid, Geldigheid, Uniciteit, Tijdigheid, Consistentie
  • PII-detectie: Scant tekstvelden op gevoelige data (burgerservicenummers, creditcards, persoonlijke informatie) vóór AI-blootstelling

Een datakwaliteitspraktijk opbouwen

Effectieve datakwaliteit vereist drie elementen:

1. Meting

Stel basislijnen vast vóór verbetering. Weet waar u staat over elke dimensie en elk veld.

2. Proces

Definieer workflows voor voortdurend dataonderhoud:

  • Validatieregels voor gegevensinvoer
  • Regelmatige opschoonschema’s
  • Procedures voor escalatie van problemen
  • Protocollen voor wijzigingsbeheer

3. Cultuur

Bouw organisatiebrede toewijding:

  • Wijs dataverzorgers toe voor elk domein
  • Neem datakwaliteit op in prestatiemetrics
  • Vier verbeteringen en deel successen
  • Maak kwaliteit zichtbaar via dashboards

Aan de slag met DQS

DQS biedt het meetfundament voor uw datakwaliteitspraktijk:

  1. Selecteer mogelijkheden: Kies welke dimensies u wilt meten
  2. Definieer toepassingsgebied: Selecteer de objecten en velden om te analyseren
  3. Configureer drempelwaarden: Stel uw kwaliteitsstandaarden in
  4. Voer scans uit: Voer analyses over uw data uit
  5. Bekijk resultaten: Identificeer problemen en prioriteer oplossingen

De eerste stap is het begrijpen van uw huidige situatie. Neem de AI-gereedheidsbeoordeling om uw datakwaliteitsvolwassenheid in 3 minuten te benchmarken.

Volgende stappen