Skip to main content

Was ist Datenqualität?

Erfahren Sie, was Datenqualität bedeutet, wie sie gemessen wird und warum sie über den Erfolg Ihrer Reporting-, Automatisierungs- und KI-Initiativen entscheidet.

Definition von Datenqualität

Datenqualität misst, wie gut Ihre Daten ihrem vorgesehenen Zweck dienen. Es geht nicht darum, ob Daten im absoluten Sinne „korrekt” sind. Es geht darum, ob Ihre Daten für Entscheidungsfindung, Betrieb und Analytik geeignet sind.

Eine Kundenadresse ist von hoher Qualität, wenn sie den Kunden erreicht. Ein Produktcode ist von hoher Qualität, wenn Ihre Systeme ihn erkennen. Qualität hängt vom Kontext ab.

Das Prinzip der „Zweckmäßigkeit”

Datenqualität ist kontextabhängig. Eine Lieferadresse benötigt Präzision auf Straßenebene. Eine Marketingregion benötigt nur Land oder Bundesland. Beide können auf unterschiedlichen Präzisionsstufen „hohe Qualität” aufweisen.

Fragen Sie bei der Bewertung der Datenqualität: Was sollen diese Daten leisten? Messen Sie dann, ob sie dies leisten können.

Das Framework der fünf Dimensionen

Datenqualität wird anhand von fünf Schlüsseldimensionen gemessen. Dieses Framework hat sich branchenübergreifend durchgesetzt und bildet die Grundlage der Standards ISO 8000 und DAMA.

DimensionWas sie misstBeispiel
VollständigkeitErforderliche Daten sind vorhandenAlle Pflichtfelder sind ausgefüllt
GültigkeitDaten entsprechen FormatenE-Mail-Adressen haben gültiges Format
EindeutigkeitKeine DublettenEin Datensatz pro Kunde
AktualitätDaten sind aktuellKontaktdaten innerhalb von 90 Tagen aktualisiert
KonsistenzDaten sind einheitlich„USA” konsistent verwendet, nicht „US” oder „United States”

Jede Dimension beantwortet eine spezifische Frage zu Ihren Daten. Gemeinsam liefern sie ein vollständiges Bild der Datengesundheit.

Ausführliche Hinweise zu jeder Dimension finden Sie hier:

Branchenstandards und Frameworks

ISO 8000

Der ISO 8000-Standard definiert Anforderungen an die Datenqualität für den Austausch von Stammdaten. Er legt Prinzipien für Datengenauigkeit, Vollständigkeit und Konsistenz zwischen Organisationen fest.

DAMA-DMBOK

Der Body of Knowledge der Data Management Association (DAMA-DMBOK) definiert Datenqualität als einen von elf Wissensbereichen im Datenmanagement. Er bietet Leitlinien für Mess-, Überwachungs- und Verbesserungsprozesse.

Die 1-10-100-Regel

Dieses Prinzip veranschaulicht die eskalierenden Kosten mangelhafter Datenqualität:

PhaseKostenBeispiel
Prävention1 $Validierung bei der Dateneingabe
Korrektur10 $Datenbereinigung nach der Eingabe
Folgeschäden100 $Geschäftliche Auswirkungen schlechter Daten

Investitionen in Datenqualität an der Quelle sparen erhebliche Folgekosten.

Datenqualität und verwandte Konzepte

Datenqualität vs. Datenmanagement

Datenmanagement ist die breitere Praxis des Sammelns, Speicherns und Pflegens von Daten. Datenqualität ist eine Komponente des Datenmanagements und konzentriert sich speziell auf die Zweckmäßigkeit.

KonzeptUmfangSchwerpunkt
DatenmanagementAlle DatenpraktikenSpeicherung, Zugriff, Sicherheit, Lebenszyklus
DatenqualitätZweckmäßigkeitVollständigkeit, Gültigkeit, Eindeutigkeit, Aktualität, Konsistenz
Data GovernanceRichtlinien und ZuständigkeitenWer besitzt Daten, wer darf sie ändern, welche Regeln gelten

Datenqualität vs. Datengenauigkeit

Genauigkeit fragt: Spiegelt dieser Wert die Realität wider? Qualität fragt: Funktionieren diese Daten für ihren Zweck?

Eine E-Mail-Adresse kann gültig (korrektes Format) aber ungenau (Person nutzt sie nicht mehr) sein. DQS misst Qualität, weil Format und Vollständigkeit automatisiert werden können. Genauigkeit erfordert typischerweise externe Verifizierung.

Wie Datenqualität gemessen wird

Quantitative Metriken

Datenqualität wird durch messbare Indikatoren ausgedrückt:

Metrik-TypBeispielBerechnung
ProzentsatzBefüllungsrate(Befüllte Datensätze / Gesamtdatensätze) x 100
AnzahlDublettenanzahlAnzahl der Datensätze mit übereinstimmenden Werten
ScoreGültigkeits-ScoreGewichteter Durchschnitt über Validierungsregeln
VerhältnisKonformitätsrateKonforme Werte / Gesamtwerte

Schwellenwerte und Ziele

Organisationen legen Schwellenwerte basierend auf Geschäftsanforderungen fest:

StufeSchwellenwertAnwendungsfall
Kritisch99%+Felder für regulatorische Berichterstattung
Hoch95%+Kundenrelevante Daten
Standard85%+Betriebsdaten
Niedrig70%+Historische oder Archivdaten

Kontinuierliche vs. punktuelle Messung

Punktuelle Messung liefert eine Momentaufnahme. Kontinuierliche Messung verfolgt Trends und erkennt Verschlechterungen frühzeitig.

DQS unterstützt beide Ansätze:

  • Ad-hoc-Scans für sofortige Bewertung ausführen
  • Wiederkehrende Scans für laufende Überwachung planen

Warum Organisationen Schwierigkeiten haben

1. Datensilos

Wenn Daten in isolierten Systemen leben, entstehen Inkonsistenzen ganz natürlich. Sales hat eine Version eines Kundendatensatzes. Support hat eine andere. Keiner weiß, welche korrekt ist.

2. Fehler bei manueller Eingabe

Manuelle Dateneingabe ist anfällig für Tippfehler, inkonsistente Formatierung und fehlende Informationen. Ohne Validierungsregeln häufen sich diese Fehler mit der Zeit.

3. Keine klare Verantwortung

Wenn niemand für Datenqualität verantwortlich ist, wird sie zum Problem aller und Priorität von niemandem. Data Stewardship erfordert explizite Zuweisung.

4. Fehlende Messung

Sie können nicht verbessern, was Sie nicht messen. Viele Organisationen nehmen an, dass ihre Daten gut genug seien, ohne Basiswerte zu etablieren oder Metriken zu verfolgen.

5. Einmalige Bereinigungsprojekte

Datenqualität als Projekt statt als Prozess zu behandeln, führt zu temporären Verbesserungen, die sich im Laufe der Zeit verschlechtern.

Die geschäftlichen Auswirkungen

Schlechte Datenqualität betrifft jeden Bereich:

BereichAuswirkung
MarketingKampagnen an falsche Adressen, verschwendete Ausgaben
SalesZeitverlust durch doppelte Leads, verlorener Kontext
FinanzenUngenaue Berichte, Compliance-Risiken
BetriebEntscheidungen auf Basis fehlerhafter Daten
KI/MLMit schlechten Daten trainierte Modelle liefern schlechte Ergebnisse

Quantifizierung der Kosten

Forschungen von MIT Sloan und Branchenstudien zeigen:

  • Organisationen verlieren jährlich 15-25 % des Umsatzes aufgrund schlechter Datenqualität
  • Über 25 % der Organisationen verlieren mehr als 5 Millionen $ pro Jahr durch Datenprobleme (IBM 2025)
  • Mitarbeiter verbringen bis zu 27 % ihrer Zeit mit der Korrektur schlechter Daten

Verbindung zur KI-Bereitschaft

Traditionelle Datenqualität (die fünf Dimensionen) bereitet Ihre Daten für Reporting und Automatisierung vor. KI-Anwendungen wie Agentforce hängen von denselben Grundlagen ab: vollständige Datensätze, gültige Formate, konsistente Werte, aktuelle Daten und keine Dubletten.

Zusätzlich zu diesen fünf Dimensionen bringt die KI-Bereitstellung eine weitere Herausforderung mit sich: die Offenlegung sensibler Daten. Bevor Sie KI-Agenten mit Ihren Salesforce-Daten verbinden, müssen Sie wissen, wo sich PII befinden, um diese zu maskieren oder auszuschließen.

DQS misst sowohl traditionelle Datenqualität als auch KI-Bereitschaft auf einer einzigen Plattform:

  • Fünf Datenqualitätsdimensionen: Vollständigkeit, Gültigkeit, Eindeutigkeit, Aktualität, Konsistenz
  • PII-Erkennung: Scannt Textfelder auf sensible Daten (Sozialversicherungsnummern, Kreditkarten, persönliche Daten) vor der KI-Exposition

Aufbau einer Datenqualitätspraxis

Effektive Datenqualität erfordert drei Elemente:

1. Messung

Etablieren Sie Basiswerte vor der Verbesserung. Wissen Sie, wo Sie in jeder Dimension und bei jedem Feld stehen.

2. Prozess

Definieren Sie Workflows für die laufende Datenpflege:

  • Validierungsregeln für die Dateneingabe
  • Regelmäßige Bereinigungspläne
  • Eskalationsverfahren bei Problemen
  • Change-Management-Protokolle

3. Kultur

Bauen Sie organisationsweites Engagement auf:

  • Weisen Sie Data Stewards für jede Domäne zu
  • Beziehen Sie Datenqualität in Leistungskennzahlen ein
  • Feiern Sie Verbesserungen und teilen Sie Erfolge
  • Machen Sie Qualität durch Dashboards sichtbar

Erste Schritte mit DQS

DQS bietet die Messgrundlage für Ihre Datenqualitätspraxis:

  1. Funktionen auswählen: Wählen Sie, welche Dimensionen gemessen werden sollen
  2. Umfang definieren: Wählen Sie die zu analysierenden Objekte und Felder
  3. Schwellenwerte konfigurieren: Legen Sie Ihre Qualitätsstandards fest
  4. Scans ausführen: Führen Sie Analysen über Ihre Daten durch
  5. Ergebnisse prüfen: Identifizieren Sie Probleme und priorisieren Sie Fixes

Der erste Schritt besteht darin, Ihren aktuellen Zustand zu verstehen. Nehmen Sie am AI Readiness Assessment teil, um Ihren Datenqualitätsreifegrad in 3 Minuten zu bewerten.

Nächste Schritte