Die fünf Dimensionen verstehen
Datenqualität wird anhand von fünf Schlüsseldimensionen gemessen. Jede Dimension beantwortet eine spezifische Frage zu Ihren Daten, und zusammen bestimmen sie, ob Ihre Daten zweckmäßig sind.
DQS misst alle fünf Dimensionen nativ innerhalb von Salesforce.
| Dimension | Kernfrage | Beispielproblem |
|---|---|---|
| Vollständigkeit | Sind die Daten vorhanden? | Fehlende E-Mail-Adressen |
| Gültigkeit | Ist das Format korrekt? | Fehlerhafte Telefonnummern |
| Eindeutigkeit | Ist jeder Datensatz eindeutig? | Doppelte Contacts |
| Aktualität | Sind die Daten aktuell? | Veraltete Opportunity-Daten |
| Konsistenz | Sind die Daten einheitlich? | „USA” vs. „United States” |
1. Vollständigkeit
Vollständigkeit misst, ob erforderliche Datenwerte vorhanden sind und nicht fehlen.
Was DQS misst
- Befüllungsrate: Prozentsatz der Datensätze mit nicht-leeren Werten
- Leer-Erkennung: Leere Zeichenketten und nur aus Leerzeichen bestehende Werte
- Platzhalter-Erkennung: Werte wie „N/A”, „TBD” oder „Unknown”
Warum Vollständigkeit wichtig ist
Unvollständige Daten brechen Automatisierung. Wenn ein Workflow eine nicht vorhandene E-Mail-Adresse erfordert, schlägt der Workflow fehl. Wenn ein Bericht nach Branche filtert, aber der Hälfte Ihrer Datensätze die Branchenwerte fehlen, zeigt Ihre Analyse nur einen Teil des Bildes.
Häufige Vollständigkeitsprobleme
| Problem | Beispiel | Auswirkung |
|---|---|---|
| Leere Felder | Leeres Contact-Telefon | Keine Anrufe bei Interessenten möglich |
| Platzhalterwerte | „TBD” im Firmennamen | Ungültig für Reporting |
| Nur Leerzeichen | „ ” in Beschreibung | Wirkt befüllt, ist es aber nicht |
Tipp: Beginnen Sie mit Ihren kritischsten Feldern. Sie benötigen nicht 100 % Vollständigkeit bei jedem Feld, nur bei denen, die für Ihren Anwendungsfall relevant sind.
2. Gültigkeit
Gültigkeit misst, ob Datenwerte erwarteten Formaten und Mustern entsprechen.
Was DQS misst
- Formatvalidierung: E-Mail-, Telefon-, URL-Muster
- Musterabgleich: Benutzerdefinierte Regex-Muster
- Domänenvalidierung: Listen erlaubter Werte
Gültigkeit vs. Genauigkeit
Gültigkeit und Genauigkeit sind unterschiedlich. Eine E-Mail-Adresse kann gültig (korrektes Format) aber ungenau (falsche Person) sein. DQS misst Gültigkeit, weil Formatvalidierung automatisiert werden kann. Genauigkeit erfordert externe Verifizierung.
| Prüfung | Gültig? | Genau? |
|---|---|---|
| john@company.com | Ja | Ohne Verifizierung unbekannt |
| john@company | Nein | N/A (Format ist falsch) |
| john.smith@oldcompany.com | Ja | Nein (Person hat Unternehmen verlassen) |
Häufige Gültigkeitsprobleme in Salesforce
- E-Mail-Adressen ohne „@” oder Domäne
- Telefonnummern mit falscher Ziffernanzahl
- URLs ohne Protokoll (http/https)
- Freitext, wo Picklist-Werte erwartet werden
3. Eindeutigkeit
Eindeutigkeit misst, ob Datenwerte distinkt und nicht dupliziert sind.
Was DQS misst
- Dublettenerkennung: Exakte Übereinstimmungen zwischen Datensätzen
- Distinkt-Anzahl: Gesamtzahl eindeutiger Werte pro Feld
- Entropie-Analyse: Wertvielfalt und -verteilung
Die Kosten von Dubletten
Doppelte Datensätze verschwenden Speicher, verwirren Benutzer und erzeugen überhöhte Metriken. Wenn Sales zwei Datensätze für dasselbe Unternehmen hat, verlieren sie den Kontext und riskieren peinliche doppelte Ansprache.
Forschungen zeigen:
- B2B-Datenbanken enthalten durchschnittlich 10-30 % Dubletten
- Jede Dublette kostet Organisationen durch verschwendete E-Mail-Versendungen, verwirrtes Reporting und fragmentierte Kundenhistorie
Dublettenvermeidung vs. -erkennung
DQS konzentriert sich auf Erkennung, die Ihnen hilft, bereits existierende Dubletten zu identifizieren. Vermeidung (Verhindern von Dubletten bei der Erstellung) erfordert Validierungsregeln und Matching-Regeln in der Salesforce-Konfiguration.
4. Aktualität
Aktualität misst, ob Daten für ihren vorgesehenen Zweck aktuell genug sind.
Was DQS misst
- Aktualitätsrate: Prozentsatz der Datensätze innerhalb eines akzeptablen Alters
- Veraltungserkennung: Datensätze, die Ihren Schwellenwert überschreiten
- Durchschnittsalter: Mittleres Alter der Datumsfeldwerte
- Erkennung zukünftiger Daten: Ungültige Daten in der Zukunft
Festlegung von Aktualitätsschwellen
Unterschiedliche Datentypen haben unterschiedliche Aktualitätsanforderungen:
| Datentyp | Typischer Schwellenwert | Warum |
|---|---|---|
| Lead Last Activity | 30 Tage | Kalte Leads verlieren an Wert |
| Kontaktinfo | 90 Tage | Menschen wechseln Jobs |
| Opportunity Close Date | Aktuelles Quartal | Prognosegenauigkeit |
| Account Annual Revenue | 1 Jahr | Jährliche Aktualisierungen erwartet |
Warum Aktualität für KI wichtig ist
KI- und Machine-Learning-Modelle lernen aus Ihren Daten. Wenn Ihre Daten veraltet sind, lernt die KI veraltete Muster. Agentforce beispielsweise nutzt Ihre Salesforce-Daten, um Antworten zu informieren. Veraltete Kontaktinformationen führen zu falschen Empfehlungen.
5. Konsistenz
Konsistenz misst, ob Datenwerte einheitlich und standardisiert sind.
Was DQS misst
- Konformitätsrate: Prozentsatz, der erwarteten Mustern entspricht
- Variantenerkennung: Unterschiedliche Darstellungen desselben Werts
- Dominante-Wert-Analyse: Häufigster Wert pro Feld
Arten von Inkonsistenz
| Typ | Beispiel | Problem |
|---|---|---|
| Formatvariation | „USA” vs. „United States” vs. „US” | Bricht Filterung und Gruppierung |
| Schreibweisenvariation | „Acme Corp” vs. „ACME Corporation” | Erzeugt falsche Dubletten |
| Groß-/Kleinschreibung | „new york” vs. „New York” | Wirkt unprofessionell in Berichten |
Warum Konsistenz für KI wichtig ist
KI-Modelle behandeln „USA” und „United States” als unterschiedliche Werte. Wenn Ihre Datensätze beide verwenden, kann die KI sie nicht korrekt gruppieren. Inkonsistente Daten fragmentieren das Verständnis Ihrer KI und erzeugen unzuverlässige Ergebnisse.
Konsistenz erreichen
- Verwenden Sie nach Möglichkeit Picklists statt Freitext
- Standardisieren Sie ein einheitliches Format für jedes Feld
- Importieren Sie aus Picklist-Werten beim Konfigurieren von DQS-Konsistenzprüfungen
Die Dimensionen ausbalancieren
Nicht jede Dimension ist für jeden Anwendungsfall gleich wichtig. Überlegen Sie, was Sie benötigen:
| Anwendungsfall | Prioritätsdimensionen |
|---|---|
| Marketingkampagnen | Vollständigkeit, Gültigkeit (für Zustellbarkeit) |
| Vertriebsprognose | Aktualität, Vollständigkeit |
| Kundenservice | Eindeutigkeit (eine verlässliche Quelle) |
| KI/Agentforce | Alle fünf, plus AI-Readiness-Prüfungen |
DQS-Abdeckung der Dimensionen
DQS misst alle fünf Dimensionen mit umfassenden Fähigkeiten:
| Dimension | Was DQS misst |
|---|---|
| Vollständigkeit | Befüllungsrate, Null-Erkennung, Leer-Erkennung, Platzhalter-Erkennung, kontextbezogene Logik |
| Gültigkeit | Formatvalidierung, benutzerdefinierte Regex-Muster, Identifizierung ungültiger Datensätze |
| Eindeutigkeit | Dublettenerkennung, Entropie-Analyse, Häufigkeitsverteilung |
| Aktualität | Aktualitätsrate, Veraltungserkennung, Durchschnittsalter, Erkennung zukünftiger Daten |
| Konsistenz | Konformitätsprüfung, Variantenerkennung, Dominante-Wert-Analyse |
Nächste Schritte
Jetzt, wo Sie die fünf Dimensionen verstehen:
- Nehmen Sie am AI Readiness Assessment teil, um Ihre aktuellen Scores zu sehen
- Lesen Sie über Agentforce-Vorbereitung für zusätzliche Prüfungen über die grundlegende Datenqualität hinaus
- Erfahren Sie, wie Sie den Definition Builder verwenden, um Ihren ersten Scan zu konfigurieren