Datakwaliteit definiëren
Datakwaliteit meet hoe goed uw data zijn beoogde doel dient. Het gaat er niet om of data „correct” is in absolute termen. Het gaat erom of uw data geschikt is voor gebruik bij besluitvorming, operaties en analyses.
Een klantadres is van hoge kwaliteit als het de klant bereikt. Een productcode is van hoge kwaliteit als uw systemen deze herkennen. Kwaliteit hangt af van context.
Het principe van „geschiktheid voor het doel”
Datakwaliteit is contextueel. Een verzendadres vereist precisie op straatniveau. Een marketingregio heeft alleen land of staat nodig. Beide kunnen „van hoge kwaliteit” zijn op verschillende precisieniveaus.
Vraag bij het beoordelen van datakwaliteit: Wat moet deze data doen? Meet vervolgens of het dat kan.
Het raamwerk van vijf dimensies
Datakwaliteit wordt gemeten over vijf sleuteldimensies. Dit raamwerk is in sectoren overgenomen en vormt de basis van de ISO 8000- en DAMA-standaarden.
| Dimensie | Wat het meet | Voorbeeld |
|---|---|---|
| Volledigheid | Vereiste data is aanwezig | Alle verplichte velden zijn gevuld |
| Geldigheid | Data voldoet aan indelingen | E-mailadressen hebben een geldig formaat |
| Uniciteit | Geen dubbele records | Één record per klant |
| Tijdigheid | Data is actueel | Contactinfo bijgewerkt binnen 90 dagen |
| Consistentie | Data is uniform | „USA” consistent gebruikt, niet „US” of „United States” |
Elke dimensie beantwoordt een specifieke vraag over uw data. Samen geven ze een volledig beeld van de datagezondheid.
Voor gedetailleerde begeleiding over elke dimensie, zie:
Branchestandaarden en -raamwerken
ISO 8000
De ISO 8000-standaard definieert datakwaliteitsvereisten voor de uitwisseling van masterdata. Het stelt principes vast voor datanauwkeurigheid, volledigheid en consistentie tussen organisaties.
DAMA-DMBOK
Het Data Management Association’s Body of Knowledge (DAMA-DMBOK) definieert datakwaliteit als een van de elf kennisgebieden in databeheer. Het biedt begeleiding bij meet-, bewakings- en verbeteringsprocessen.
De 1-10-100-regel
Dit principe illustreert de toenemende kosten van slechte datakwaliteit:
| Fase | Kosten | Voorbeeld |
|---|---|---|
| Preventie | €1 | Validatie bij gegevensinvoer |
| Correctie | €10 | Data opschonen na invoer |
| Mislukking | €100 | Zakelijke impact van slechte data |
Investeren in datakwaliteit aan de bron bespaart aanzienlijke kosten stroomafwaarts.
Datakwaliteit vs. verwante concepten
Datakwaliteit vs. databeheer
Databeheer is de bredere praktijk van het verzamelen, opslaan en onderhouden van data. Datakwaliteit is een onderdeel van databeheer, gericht op geschiktheid voor gebruik.
| Concept | Bereik | Focus |
|---|---|---|
| Databeheer | Alle datapraktijken | Opslag, toegang, beveiliging, levenscyclus |
| Datakwaliteit | Geschiktheid voor het doel | Volledigheid, geldigheid, uniciteit, tijdigheid, consistentie |
| Data-governance | Beleid en eigenaarschap | Wie bezit data, wie kan het wijzigen, welke regels zijn van toepassing |
Datakwaliteit vs. datanauwkeurigheid
Nauwkeurigheid vraagt: Weerspiegelt deze waarde de werkelijkheid? Kwaliteit vraagt: Werkt deze data voor zijn doel?
Een e-mailadres kan geldig zijn (correct formaat) maar onnauwkeurig (persoon gebruikt het niet meer). DQS meet kwaliteit omdat indeling en volledigheid geautomatiseerd kunnen worden. Nauwkeurigheid vereist doorgaans externe verificatie.
Hoe datakwaliteit wordt gemeten
Kwantitatieve statistieken
Datakwaliteit wordt uitgedrukt via meetbare indicatoren:
| Statistiektype | Voorbeeld | Berekening |
|---|---|---|
| Percentage | Vulpercentage | (Gevulde records / Totaal records) x 100 |
| Aantal | Duplicaataantal | Aantal records met overeenkomende waarden |
| Score | Geligheidsscore | Gewogen gemiddelde over validatieregels |
| Ratio | Conformiteitspercentage | Conforme waarden / Totale waarden |
Drempelwaarden en doelen
Organisaties stellen drempelwaarden vast op basis van zakelijke vereisten:
| Niveau | Drempelwaarde | Gebruiksgeval |
|---|---|---|
| Kritiek | 99%+ | Velden voor regelgevende rapportage |
| Hoog | 95%+ | Klantgerichte data |
| Standaard | 85%+ | Operationele data |
| Laag | 70%+ | Historische of archiefdata |
Continue vs. momentopname-meting
Momentopname-meting biedt een momentopname. Continue meting volgt trends en signaleert degradatie vroegtijdig.
DQS ondersteunt beide benaderingen:
- Voer ad-hocscans uit voor directe beoordeling
- Plan terugkerende scans voor voortdurende bewaking
Waarom organisaties moeite hebben
1. Datasilo’s
Wanneer data in niet-verbonden systemen leeft, treden inconsistenties van nature op. Sales heeft één versie van een klantrecord. Support heeft een andere. Niemand weet welke correct is.
2. Handmatige invoerfouten
Handmatige gegevensinvoer is gevoelig voor typefouten, inconsistente opmaak en ontbrekende informatie. Zonder validatieregels stapelen deze fouten zich in de loop van de tijd op.
3. Geen duidelijk eigenaarschap
Wanneer niemand verantwoordelijk is voor datakwaliteit, wordt het ieders probleem en niemands prioriteit. Dataverzorging vereist expliciete toewijzing.
4. Gebrek aan meting
U kunt niet verbeteren wat u niet meet. Veel organisaties gaan ervan uit dat hun data goed genoeg is zonder basislijnen te bepalen of statistieken bij te houden.
5. Eenmalige opschoonprojecten
Datakwaliteit behandelen als een project in plaats van een proces leidt tot tijdelijke verbeteringen die in de loop van de tijd degraderen.
De zakelijke impact
Slechte datakwaliteit treft elke functie:
| Functie | Impact |
|---|---|
| Marketing | Campagnes verzonden naar verkeerde adressen, verspild budget |
| Sales | Tijd verspild aan dubbele leads, verloren context |
| Financiën | Onnauwkeurige rapporten, compliancerisico’s |
| Operaties | Beslissingen op basis van foutieve data |
| AI/ML | Modellen getraind op slechte data produceren slechte uitkomsten |
De kosten kwantificeren
Onderzoek van MIT Sloan en branchestudies toont aan:
- Organisaties verliezen jaarlijks 15-25% van hun omzet door slechte datakwaliteit
- Meer dan 25% van de organisaties verliest meer dan $5 miljoen per jaar aan dataproblemen (IBM 2025)
- Medewerkers besteden tot 27% van hun tijd aan het corrigeren van slechte data
Verbinding met AI-gereedheid
Traditionele datakwaliteit (de vijf dimensies) bereidt uw data voor op rapportage en automatisering. AI-applicaties zoals Agentforce zijn afhankelijk van dezelfde grondslagen: volledige records, geldige indelingen, consistente waarden, actuele data en geen duplicaten.
Bovenop die vijf dimensies introduceert AI-implementatie één aanvullende bezorgdheid: blootstelling van gevoelige data. Voordat u AI-agents verbindt met uw Salesforce-data, moet u weten waar PII zich bevindt, zodat u het kunt maskeren of uitsluiten.
DQS meet zowel traditionele datakwaliteit als AI-gereedheid in één platform:
- Vijf datakwaliteitsdimensies: Volledigheid, Geldigheid, Uniciteit, Tijdigheid, Consistentie
- PII-detectie: Scant tekstvelden op gevoelige data (burgerservicenummers, creditcards, persoonlijke informatie) vóór AI-blootstelling
Een datakwaliteitspraktijk opbouwen
Effectieve datakwaliteit vereist drie elementen:
1. Meting
Stel basislijnen vast vóór verbetering. Weet waar u staat over elke dimensie en elk veld.
2. Proces
Definieer workflows voor voortdurend dataonderhoud:
- Validatieregels voor gegevensinvoer
- Regelmatige opschoonschema’s
- Procedures voor escalatie van problemen
- Protocollen voor wijzigingsbeheer
3. Cultuur
Bouw organisatiebrede toewijding:
- Wijs dataverzorgers toe voor elk domein
- Neem datakwaliteit op in prestatiemetrics
- Vier verbeteringen en deel successen
- Maak kwaliteit zichtbaar via dashboards
Aan de slag met DQS
DQS biedt het meetfundament voor uw datakwaliteitspraktijk:
- Selecteer mogelijkheden: Kies welke dimensies u wilt meten
- Definieer toepassingsgebied: Selecteer de objecten en velden om te analyseren
- Configureer drempelwaarden: Stel uw kwaliteitsstandaarden in
- Voer scans uit: Voer analyses over uw data uit
- Bekijk resultaten: Identificeer problemen en prioriteer oplossingen
De eerste stap is het begrijpen van uw huidige situatie. Neem de AI-gereedheidsbeoordeling om uw datakwaliteitsvolwassenheid in 3 minuten te benchmarken.
Volgende stappen
- Verdiep u in Volledigheid, de eerste dimensie
- Lees over De vijf dimensies voor een volledig overzicht
- Leer over Agentforce-voorbereiding voor AI-specifieke vereisten
- Neem de AI-gereedheidsbeoordeling om uw huidige scores te zien