Definition von Datenqualität
Datenqualität misst, wie gut Ihre Daten ihrem vorgesehenen Zweck dienen. Es geht nicht darum, ob Daten im absoluten Sinne „korrekt” sind. Es geht darum, ob Ihre Daten für Entscheidungsfindung, Betrieb und Analytik geeignet sind.
Eine Kundenadresse ist von hoher Qualität, wenn sie den Kunden erreicht. Ein Produktcode ist von hoher Qualität, wenn Ihre Systeme ihn erkennen. Qualität hängt vom Kontext ab.
Das Prinzip der „Zweckmäßigkeit”
Datenqualität ist kontextabhängig. Eine Lieferadresse benötigt Präzision auf Straßenebene. Eine Marketingregion benötigt nur Land oder Bundesland. Beide können auf unterschiedlichen Präzisionsstufen „hohe Qualität” aufweisen.
Fragen Sie bei der Bewertung der Datenqualität: Was sollen diese Daten leisten? Messen Sie dann, ob sie dies leisten können.
Das Framework der fünf Dimensionen
Datenqualität wird anhand von fünf Schlüsseldimensionen gemessen. Dieses Framework hat sich branchenübergreifend durchgesetzt und bildet die Grundlage der Standards ISO 8000 und DAMA.
| Dimension | Was sie misst | Beispiel |
|---|---|---|
| Vollständigkeit | Erforderliche Daten sind vorhanden | Alle Pflichtfelder sind ausgefüllt |
| Gültigkeit | Daten entsprechen Formaten | E-Mail-Adressen haben gültiges Format |
| Eindeutigkeit | Keine Dubletten | Ein Datensatz pro Kunde |
| Aktualität | Daten sind aktuell | Kontaktdaten innerhalb von 90 Tagen aktualisiert |
| Konsistenz | Daten sind einheitlich | „USA” konsistent verwendet, nicht „US” oder „United States” |
Jede Dimension beantwortet eine spezifische Frage zu Ihren Daten. Gemeinsam liefern sie ein vollständiges Bild der Datengesundheit.
Ausführliche Hinweise zu jeder Dimension finden Sie hier:
Branchenstandards und Frameworks
ISO 8000
Der ISO 8000-Standard definiert Anforderungen an die Datenqualität für den Austausch von Stammdaten. Er legt Prinzipien für Datengenauigkeit, Vollständigkeit und Konsistenz zwischen Organisationen fest.
DAMA-DMBOK
Der Body of Knowledge der Data Management Association (DAMA-DMBOK) definiert Datenqualität als einen von elf Wissensbereichen im Datenmanagement. Er bietet Leitlinien für Mess-, Überwachungs- und Verbesserungsprozesse.
Die 1-10-100-Regel
Dieses Prinzip veranschaulicht die eskalierenden Kosten mangelhafter Datenqualität:
| Phase | Kosten | Beispiel |
|---|---|---|
| Prävention | 1 $ | Validierung bei der Dateneingabe |
| Korrektur | 10 $ | Datenbereinigung nach der Eingabe |
| Folgeschäden | 100 $ | Geschäftliche Auswirkungen schlechter Daten |
Investitionen in Datenqualität an der Quelle sparen erhebliche Folgekosten.
Datenqualität und verwandte Konzepte
Datenqualität vs. Datenmanagement
Datenmanagement ist die breitere Praxis des Sammelns, Speicherns und Pflegens von Daten. Datenqualität ist eine Komponente des Datenmanagements und konzentriert sich speziell auf die Zweckmäßigkeit.
| Konzept | Umfang | Schwerpunkt |
|---|---|---|
| Datenmanagement | Alle Datenpraktiken | Speicherung, Zugriff, Sicherheit, Lebenszyklus |
| Datenqualität | Zweckmäßigkeit | Vollständigkeit, Gültigkeit, Eindeutigkeit, Aktualität, Konsistenz |
| Data Governance | Richtlinien und Zuständigkeiten | Wer besitzt Daten, wer darf sie ändern, welche Regeln gelten |
Datenqualität vs. Datengenauigkeit
Genauigkeit fragt: Spiegelt dieser Wert die Realität wider? Qualität fragt: Funktionieren diese Daten für ihren Zweck?
Eine E-Mail-Adresse kann gültig (korrektes Format) aber ungenau (Person nutzt sie nicht mehr) sein. DQS misst Qualität, weil Format und Vollständigkeit automatisiert werden können. Genauigkeit erfordert typischerweise externe Verifizierung.
Wie Datenqualität gemessen wird
Quantitative Metriken
Datenqualität wird durch messbare Indikatoren ausgedrückt:
| Metrik-Typ | Beispiel | Berechnung |
|---|---|---|
| Prozentsatz | Befüllungsrate | (Befüllte Datensätze / Gesamtdatensätze) x 100 |
| Anzahl | Dublettenanzahl | Anzahl der Datensätze mit übereinstimmenden Werten |
| Score | Gültigkeits-Score | Gewichteter Durchschnitt über Validierungsregeln |
| Verhältnis | Konformitätsrate | Konforme Werte / Gesamtwerte |
Schwellenwerte und Ziele
Organisationen legen Schwellenwerte basierend auf Geschäftsanforderungen fest:
| Stufe | Schwellenwert | Anwendungsfall |
|---|---|---|
| Kritisch | 99%+ | Felder für regulatorische Berichterstattung |
| Hoch | 95%+ | Kundenrelevante Daten |
| Standard | 85%+ | Betriebsdaten |
| Niedrig | 70%+ | Historische oder Archivdaten |
Kontinuierliche vs. punktuelle Messung
Punktuelle Messung liefert eine Momentaufnahme. Kontinuierliche Messung verfolgt Trends und erkennt Verschlechterungen frühzeitig.
DQS unterstützt beide Ansätze:
- Ad-hoc-Scans für sofortige Bewertung ausführen
- Wiederkehrende Scans für laufende Überwachung planen
Warum Organisationen Schwierigkeiten haben
1. Datensilos
Wenn Daten in isolierten Systemen leben, entstehen Inkonsistenzen ganz natürlich. Sales hat eine Version eines Kundendatensatzes. Support hat eine andere. Keiner weiß, welche korrekt ist.
2. Fehler bei manueller Eingabe
Manuelle Dateneingabe ist anfällig für Tippfehler, inkonsistente Formatierung und fehlende Informationen. Ohne Validierungsregeln häufen sich diese Fehler mit der Zeit.
3. Keine klare Verantwortung
Wenn niemand für Datenqualität verantwortlich ist, wird sie zum Problem aller und Priorität von niemandem. Data Stewardship erfordert explizite Zuweisung.
4. Fehlende Messung
Sie können nicht verbessern, was Sie nicht messen. Viele Organisationen nehmen an, dass ihre Daten gut genug seien, ohne Basiswerte zu etablieren oder Metriken zu verfolgen.
5. Einmalige Bereinigungsprojekte
Datenqualität als Projekt statt als Prozess zu behandeln, führt zu temporären Verbesserungen, die sich im Laufe der Zeit verschlechtern.
Die geschäftlichen Auswirkungen
Schlechte Datenqualität betrifft jeden Bereich:
| Bereich | Auswirkung |
|---|---|
| Marketing | Kampagnen an falsche Adressen, verschwendete Ausgaben |
| Sales | Zeitverlust durch doppelte Leads, verlorener Kontext |
| Finanzen | Ungenaue Berichte, Compliance-Risiken |
| Betrieb | Entscheidungen auf Basis fehlerhafter Daten |
| KI/ML | Mit schlechten Daten trainierte Modelle liefern schlechte Ergebnisse |
Quantifizierung der Kosten
Forschungen von MIT Sloan und Branchenstudien zeigen:
- Organisationen verlieren jährlich 15-25 % des Umsatzes aufgrund schlechter Datenqualität
- Über 25 % der Organisationen verlieren mehr als 5 Millionen $ pro Jahr durch Datenprobleme (IBM 2025)
- Mitarbeiter verbringen bis zu 27 % ihrer Zeit mit der Korrektur schlechter Daten
Verbindung zur KI-Bereitschaft
Traditionelle Datenqualität (die fünf Dimensionen) bereitet Ihre Daten für Reporting und Automatisierung vor. KI-Anwendungen wie Agentforce hängen von denselben Grundlagen ab: vollständige Datensätze, gültige Formate, konsistente Werte, aktuelle Daten und keine Dubletten.
Zusätzlich zu diesen fünf Dimensionen bringt die KI-Bereitstellung eine weitere Herausforderung mit sich: die Offenlegung sensibler Daten. Bevor Sie KI-Agenten mit Ihren Salesforce-Daten verbinden, müssen Sie wissen, wo sich PII befinden, um diese zu maskieren oder auszuschließen.
DQS misst sowohl traditionelle Datenqualität als auch KI-Bereitschaft auf einer einzigen Plattform:
- Fünf Datenqualitätsdimensionen: Vollständigkeit, Gültigkeit, Eindeutigkeit, Aktualität, Konsistenz
- PII-Erkennung: Scannt Textfelder auf sensible Daten (Sozialversicherungsnummern, Kreditkarten, persönliche Daten) vor der KI-Exposition
Aufbau einer Datenqualitätspraxis
Effektive Datenqualität erfordert drei Elemente:
1. Messung
Etablieren Sie Basiswerte vor der Verbesserung. Wissen Sie, wo Sie in jeder Dimension und bei jedem Feld stehen.
2. Prozess
Definieren Sie Workflows für die laufende Datenpflege:
- Validierungsregeln für die Dateneingabe
- Regelmäßige Bereinigungspläne
- Eskalationsverfahren bei Problemen
- Change-Management-Protokolle
3. Kultur
Bauen Sie organisationsweites Engagement auf:
- Weisen Sie Data Stewards für jede Domäne zu
- Beziehen Sie Datenqualität in Leistungskennzahlen ein
- Feiern Sie Verbesserungen und teilen Sie Erfolge
- Machen Sie Qualität durch Dashboards sichtbar
Erste Schritte mit DQS
DQS bietet die Messgrundlage für Ihre Datenqualitätspraxis:
- Funktionen auswählen: Wählen Sie, welche Dimensionen gemessen werden sollen
- Umfang definieren: Wählen Sie die zu analysierenden Objekte und Felder
- Schwellenwerte konfigurieren: Legen Sie Ihre Qualitätsstandards fest
- Scans ausführen: Führen Sie Analysen über Ihre Daten durch
- Ergebnisse prüfen: Identifizieren Sie Probleme und priorisieren Sie Fixes
Der erste Schritt besteht darin, Ihren aktuellen Zustand zu verstehen. Nehmen Sie am AI Readiness Assessment teil, um Ihren Datenqualitätsreifegrad in 3 Minuten zu bewerten.
Nächste Schritte
- Vertiefen Sie sich in Vollständigkeit, die erste Dimension
- Lesen Sie über Die fünf Dimensionen für einen vollständigen Überblick
- Erfahren Sie mehr über Agentforce-Vorbereitung für KI-spezifische Anforderungen
- Nehmen Sie am AI Readiness Assessment teil, um Ihre aktuellen Scores zu sehen