Was ist Konsistenz?
Konsistenz misst, ob Ihre Datenwerte einem vereinbarten Standard entsprechen. Ein Feld ist konsistent, wenn jeder Datensatz denselben Begriff für dasselbe Konzept verwendet. Ein Feld ist inkonsistent, wenn Variationen existieren, die dasselbe bedeuten, aber unterschiedlich ausgedrückt werden.
„USA”, „United States” und „US” beziehen sich alle auf dasselbe Land. Für Salesforce sind sie drei distinkte Werte. Ein nach Land gruppierter Bericht erzeugt drei Zeilen statt einer. Eine Automatisierung, die nach „USA” filtert, verpasst 230 Datensätze, die „United States” enthalten.
Conformance Rate = (Konforme Datensätze / Gesamtdatensätze) x 100
Wenn 850 von 1.000 Account-Datensätzen einen Country-Wert haben, der Ihrer Liste erlaubter Werte entspricht, beträgt Ihre Country-Conformance-Rate 85 %. Die verbleibenden 15 % enthalten Variationen, die standardisiert werden müssen.
Warum Konsistenz wichtig ist
Reporting
Inkonsistente Daten fragmentieren Ihre Berichte. Wenn Ihr Country-Feld fünf verschiedene Schreibweisen desselben Landes enthält, zeigt ein nach Country gruppierter Bericht fünf Zeilen statt einer. Die Summe ist korrekt, aber die Gruppierung ist falsch. Executive-Dashboards, die auf diesen Berichten aufbauen, erzählen eine irreführende Geschichte.
Automatisierung
Salesforce-Automatisierung hängt von exakten Wertübereinstimmungen ab. Ein Workflow, der nach Country = "USA" filtert, verpasst Datensätze mit „United States” und „US”. Die Automatisierung läuft korrekt auf übereinstimmenden Datensätzen, überspringt aber stillschweigend alles andere.
KI und Agentforce
KI-Modelle behandeln jede Variation als separates Konzept. „USA” und „United States” werden zu zwei verschiedenen Ländern in der Ansicht des Modells. Agentforce generiert Antworten mit Ihren Feldwerten. Inkonsistente Werte erzeugen inkonsistente KI-Ausgaben.
| System | Auswirkung der Konsistenz |
|---|---|
| Berichte | Fragmentierte Gruppierungen, irreführende Summen |
| Workflows | Filter verpassen nicht übereinstimmende Variationen |
| Dublettenregeln | Variationen verhindern korrektes Matching |
| Agentforce | Inkonsistente Feldwerte erzeugen unzuverlässige KI-Antworten |
Wie DQS Konsistenz misst
DQS erzeugt 6 Konsistenzmetriken rund um eine diagnostische Frage: „Entsprechen Ihre Feldwerte einem Standard, und wenn nicht, was tun sie stattdessen?”
Betrachten Sie diese Metriken als diagnostischen Ablauf. Jeder Schritt offenbart eine andere Ebene des Problems.
Schritt 1: Wie konsistent ist es?
Conformance Rate ist die Leitmetrik. Sie berechnet den Prozentsatz der Datensätze, bei denen der Feldwert einem Ihrer definierten erlaubten Werte entspricht. Dies ist die Zahl, die Sie auf ein Dashboard setzen.
Sie führen einen Scan auf dem Account-Objekt durch. Das Feld Country zeigt eine Conformance Rate von 72 %. Das bedeutet, 28 % Ihrer Accounts enthalten Country-Werte außerhalb Ihrer erlaubten Liste. Ihre Territoriumszuweisungsregeln, regionalen Dashboards und Lokalisierungslogik arbeiten alle mit unvollständigen Daten.
Jede andere Konsistenzmetrik existiert, um zu erklären, wie die nicht-konformen 28 % aussehen.
Schritt 2: Was ist das Ausmaß?
Raten sagen Ihnen den Schweregrad. Zählungen sagen Ihnen den Arbeitsaufwand. Zwei Metriken beantworten die Ausmaß-Frage:
| Metrik | Was sie Ihnen sagt |
|---|---|
| Conformance Count | Wie viele Datensätze Ihren erlaubten Werten entsprechen. Verwenden Sie dies für Abdeckungsberichte. |
| Non-Conforming Count | Wie viele Datensätze außerhalb Ihrer erlaubten Werte fallen. Verwenden Sie dies, um Bereinigungsprojekte zu skopieren. |
Diese beiden Zahlen ergeben immer die Gesamtdatensätze. Wenn Ihr Conformance Count 720 und Non-Conforming Count 280 beträgt, haben Sie genau 1.000 ausgewertete Datensätze.
Beispiel: Ihre Data Stewardin muss das Feld Industry bereinigen. Non-Conforming Count beträgt 3.400. Sie kennt jetzt den Umfang des Projekts, kann Ressourcen zuweisen und einen realistischen Zeitplan für die Standardisierung festlegen.
Schritt 3: Wie fragmentiert sind die Daten?
Variant Count misst die Anzahl distinkter Werte, die in einem Feld über alle Datensätze hinweg gefunden werden. Es beantwortet: „Auf wie viele verschiedene Weisen drücken Menschen diese Daten aus?”
Diese Metrik funktioniert als Schema-Gesundheitsindikator. Ein Country-Feld mit 5 distinkten Werten ist wahrscheinlich gut kontrolliert. Ein Country-Feld mit 47 distinkten Werten signalisiert ernsthafte Fragmentierung, selbst bevor Sie die Konformität prüfen.
| Feld | Gesamtdatensätze | Variant Count | Bewertung |
|---|---|---|---|
| Country | 1.000 | 5 | Gut kontrolliert, wahrscheinlich konsistent |
| Country | 1.000 | 47 | Stark fragmentiert, benötigt Standardisierung |
| Industry | 500 | 12 | Angemessen, wahrscheinlich Picklist-beschränkt |
| Industry | 500 | 89 | Freitext-Chaos, benötigt sofortige Aufmerksamkeit |
Beispiel: Während eines Org-Audits scannen Sie Lead_Source__c auf Leads. Variant Count gibt 34 zurück. Ihr Marketing-Team hat 8 Lead-Quellen definiert. Die verbleibenden 26 Varianten sind Rechtschreibfehler, Abkürzungen und Ad-hoc-Einträge aus Integrationen. Die Picklist ist an der UI technisch erzwungen, aber über API erstellte Datensätze umgehen sie.
Schritt 4: Was sind die tatsächlichen Werte?
Dominant Values gibt die Top N häufigsten Werte im Feld zurück, zusammen mit der Häufigkeitszählung jedes Werts. Dies sagt Ihnen, wie Ihre Daten tatsächlich aussehen, nicht wie Sie erwarten, dass sie aussehen.
| Rang | Wert | Anzahl | Prozentsatz |
|---|---|---|---|
| 1 | United States | 450 | 45 % |
| 2 | USA | 230 | 23 % |
| 3 | US | 180 | 18 % |
| 4 | U.S.A. | 45 | 4,5 % |
| 5 | United States of America | 15 | 1,5 % |
Diese Tabelle offenbart drei Dinge. Erstens, den De-facto-Standard: „United States” mit 45 % ist das, was die meisten Benutzer eingeben. Zweitens, die häufigen Variationen: „USA” und „US” machen weitere 41 % aus. Drittens, den Long Tail: „U.S.A.” und „United States of America” sind selten, aber vorhanden.
Beispiel: Ihr Team debattiert, ob Country-Werte zu ISO-Codes („US”) oder vollständigen Namen („United States”) standardisiert werden sollen. Dominant Values zeigt, dass 45 % der Datensätze bereits „United States” verwenden. Die Standardisierung auf diesen Wert erfordert die Änderung von 55 % der Datensätze. Die Standardisierung auf „US” erfordert die Änderung von 82 %. Die Daten sagen Ihnen den günstigeren Weg.
Warum Raten und Zählungen paarweise kommen
Konformitätsmetriken kommen als Rate (Conformance Rate) und deren Inverse (Non-Conformance Rate), plus absolute Zählungen für beide Seiten. Dies ist beabsichtigt:
- Raten sind für Dashboards, Executive Reporting und Trendverfolgung. „Die Konformität verbesserte sich in diesem Quartal von 72 % auf 94 %.”
- Zählungen sind für Projektplanung, Arbeitsaufwandsschätzung und Bereinigungsplanung. „Wir haben 3.400 nicht-konforme Datensätze zu reparieren.”
Verwenden Sie Raten, um Fortschritt zu kommunizieren. Verwenden Sie Zählungen, um Arbeit zu planen.
Metrik-Referenz
Basismetriken
Diese 2 Metriken bilden die Basis jeder Konsistenzanalyse. Sie sagen Ihnen die Konformitätsrate und die Anzahl der übereinstimmenden Datensätze.
| Metrik | Typ | Was sie misst |
|---|---|---|
| Conformance Rate | Prozentsatz | Anteil der Datensätze, die Ihren erlaubten Werten entsprechen |
| Conformance Count | Anzahl | Anzahl der Datensätze, die Ihren erlaubten Werten entsprechen |
Erweiterte Metriken
Diese 4 Metriken gehen über „entspricht es?” hinaus, um zu fragen „wie sehen die nicht übereinstimmenden Daten aus?”. Sie erfordern den Analysemodus Advanced Conformance Analysis.
| Metrik | Typ | Was sie misst |
|---|---|---|
| Non-Conforming Count | Anzahl | Datensätze mit Werten außerhalb Ihrer erlaubten Liste |
| Non-Conformance Rate | Prozentsatz | Anteil der Datensätze außerhalb Ihrer erlaubten Liste |
| Variant Count | Anzahl | Gesamtzahl distinkter Werte im Feld |
| Dominant Values | Liste | Top N häufigste Werte mit Häufigkeitszählung |
Feldtyp-Abdeckung
DQS unterstützt Konsistenzprüfungen auf den folgenden Salesforce-Feldtypen:
| Feldtyp | Konsistenzfokus |
|---|---|
| String (Text) | Abkürzungen, Schreibweise, Groß-/Kleinschreibung |
| TextArea | Freitext-Standardisierung |
| Picklist | Validierung tatsächlicher Werte gegen erwartete Optionen |
| Domänen-Standardisierung, Format-Konsistenz | |
| Phone | Format-Standardisierung (Vorwahlen, Trennzeichen) |
| URL | Protokoll- und Pfadkonsistenz |
Zwei Analysemodi
DQS bietet zwei Konsistenzanalysemodi:
Conformance Check beantwortet die Frage: „Entsprechen Feldwerte meiner erlaubten Liste?” Es erzeugt die 2 Basismetriken und deckt die Grundlagen für ein schnelles Konformitätsaudit ab.
Advanced Conformance Analysis geht tiefer. Es erzeugt alle 6 Metriken, einschließlich nicht-konformer Zählungen, Variantenerkennung und dominanter Wertverteilung. Verwenden Sie diesen Modus, wenn Sie die vollständige Landschaft der Wertfragmentierung verstehen müssen, nicht nur den Konformitäts-Score.
| Geschäftsanforderung | Empfohlener Modus |
|---|---|
| Schnelles Konformitätsaudit oder Baseline-Prüfung | Conformance Check |
| Bereinigung einer Datenmigration | Advanced (Variant Count offenbart importiertes Chaos) |
| KI-Bereitschaftsbewertung | Advanced (Dominant Values zeigen, wovon die KI lernen wird) |
| Laufende Data Governance | Beginnen Sie mit Conformance Check, wechseln Sie zu Advanced, wenn Sie bereit für tiefere Analysen sind |
Konsistenz konfigurieren
DQS bietet vier Konfigurationseingaben für Konsistenz. Jede kann auf globaler Ebene (gilt für alle Felder) festgelegt und auf Feldebene überschrieben werden.
| Einstellung | Was sie steuert |
|---|---|
| Expected Values | Die Liste der Werte, die DQS als „konform” behandelt. Jeder Feldwert, der nicht auf dieser Liste steht, wird als nicht-konform markiert. Erforderlich: Sie müssen mindestens einen Wert definieren, bevor Sie einen Scan ausführen. |
| Case Sensitive | Steuert, ob der Wertabgleich Groß-/Kleinschreibung berücksichtigt. Wenn deaktiviert (Standard), passen „Premium”, „PREMIUM” und „premium” alle zum erlaubten Wert „Premium”. Wenn aktiviert, zählt nur eine exakte Übereinstimmung. |
| Top N | Wie viele dominante Werte zurückgegeben werden sollen (1 bis 100). Steuert die Größe der Dominant-Values-Ausgabe. Standard: 5. |
| Min Frequency | Die Mindestanzahl an Vorkommen, die ein Wert haben muss, um in die Dominant-Values-Ausgabe aufgenommen zu werden (1 bis 1.000). Filtert ultra-seltene Werte heraus, die Rauschen hinzufügen. Standard: 1. |
Tipp: Beginnen Sie mit Import from Field, um zu sehen, welche Werte in Ihren Daten tatsächlich existieren, bevor Sie Ihre erlaubte Werteliste definieren.
Import from Field: Discovery-First-Konfiguration
Eine häufige Herausforderung bei der Konsistenz ist zu wissen, welche Werte erwartet werden sollen. Sie können erlaubte Werte nicht definieren, wenn Sie nicht wissen, was Ihre Daten enthalten.
Import from Field löst dies. Es fragt die tatsächlichen Felddaten ab, gruppiert Werte nach Häufigkeit und zeigt die Ergebnisse als Checkliste an.
So funktioniert es:
- Öffnen Sie die Expected-Values-Konfiguration.
- Klicken Sie auf Import from Field. DQS fragt die Live-Daten ab und gibt distinkte Werte sortiert nach Häufigkeit zurück.
- Überprüfen Sie die Checkliste. Jeder Wert zeigt, wie viele Datensätze ihn enthalten.
- Markieren Sie die Werte, die Sie für korrekt halten. Lassen Sie falsche, fehlerhafte oder Platzhalterwerte unmarkiert.
- Klicken Sie auf Add Selected. Die markierten Werte befüllen Ihre erlaubte Werteliste.
Beispiel: Sie konfigurieren Konsistenz für ein Feld Rating__c. Import from Field gibt zurück:
| Wert | Datensätze |
|---|---|
| Hot | 284 |
| Warm | 198 |
| Cold | 156 |
| Very High | 23 |
| 240 km/h | 12 |
| N/A | 8 |
Die ersten drei Werte sind Ihre echten Ratings. Sie markieren diese. „Very High” ist ein Dateneingabefehler. „240 km/h” ist offensichtlich Daten im falschen Feld. „N/A” ist ein Platzhalter. Diese lassen Sie unmarkiert. Wenn der Scan läuft, erscheinen diese 43 Datensätze als nicht-konform, und Ihre erlaubte Werteliste wird aus dem aufgebaut, was Ihre Daten tatsächlich enthalten.
Dieser Workflow kehrt den traditionellen „Erst raten, dann reparieren”-Ansatz um. Sie entdecken zuerst, dann definieren Sie Ihren Standard.
Häufige Konsistenzprobleme
Land- und Staaten-Variationen
Die häufigste Inkonsistenz in Salesforce-Daten. Ohne Standardisierung erscheint ein einzelnes Konzept wie „United States” als 5 oder mehr distinkte Werte. Berichte fragmentieren. Filter verpassen Datensätze. Territoriumsregeln schlagen fehl.
Fix: Aktivieren Sie Salesforce State- und Country-Picklists für alle Adressfelder. Verwenden Sie DQS, um vorhandene nicht-konforme Werte zu finden und zu bereinigen.
Freitextfelder ohne Governance
Textfelder, die keine Picklist-Einschränkungen haben, akkumulieren mit der Zeit Variationen. Industry-, Jobtitel-, Lead-Source- und Abteilungsfelder sind häufige Übeltäter, wenn sie als Freitext implementiert sind.
Fix: Konvertieren Sie wertvolle Freitextfelder in Picklists. Verwenden Sie Import from Field, um Ihre aktuelle Wertverteilung zu sehen, bevor Sie die Picklist-Optionen definieren.
Integrations-erzeugte Variationen
Externe Systeme und APIs schreiben Datensätze, die die Salesforce-UI-Validierung umgehen. Eine Marketing-Automatisierungsplattform schreibt „Info Technology”, während Ihr Standard „Information Technology” ist. Diese Variationen akkumulieren stillschweigend.
Fix: Wenden Sie Wertmappingregeln in Ihrer Integrationsschicht an. Führen Sie regelmäßige Konsistenz-Scans aus, um neue Variationen aus Datenquellen zu erfassen, die Sie nicht kontrollieren.
Groß-/Kleinschreibungs-Inkonsistenzen
Benutzer geben „Active”, „active” und „ACTIVE” über verschiedene Datensätze hinweg ein. Mit deaktiviertem case-sensitivem Abgleich zählt DQS alle drei als konform. Aber das Feld enthält immer noch drei verschiedene Schreibweisen in den Rohdaten.
Fix: Entscheiden Sie, ob Groß-/Kleinschreibung für Ihren Anwendungsfall wichtig ist. Für anzeigbezogene Felder standardisieren Sie die Schreibweise durch Datenbereinigung. Für Abgleichszwecke deaktivieren Sie Case Sensitivity in Ihrer DQS-Konfiguration.
Best Practices
Standards vor dem Scannen definieren
Dokumentieren Sie den erwarteten Wert für jedes eingeschränkte Feld, bevor Sie Ihren ersten Scan ausführen. Ohne klaren Standard haben Sie keine Baseline, gegen die gemessen werden kann.
| Feld | Standard | Begründung |
|---|---|---|
| Country | ISO 3166-1 Alpha-2-Codes (US, CA, DE) | Branchenstandard, kompakt |
| Industry | 15-Werte benutzerdefinierte Taxonomie | Passt zu Reporting-Kategorien |
| Lead Source | 8 marketing-definierte Quellen | Stimmt mit Kampagnen-Tracking überein |
Discovery-Workflow für unbekannte Felder verwenden
Für Felder, bei denen Sie keinen vordefinierten Standard haben, verwenden Sie zuerst Import from Field. Lassen Sie die Daten Ihnen sagen, was der De-facto-Standard ist. Der Wert mit der höchsten Häufigkeit ist oft die richtige Wahl als Ihr kanonischer Wert.
Konformität über die Zeit verfolgen
Ein einzelner Konformitäts-Score ist eine Momentaufnahme. Verfolgen Sie Scores über mehrere Scans, um Verschlechterungen frühzeitig zu erkennen, den Bereinigungsfortschritt zu messen und Datenquellen zu identifizieren, die neue Variationen einführen.
Variant Count als Frühwarnung verwenden
Überwachen Sie Variant Count über Scans. Ein Feld, das zwischen Scans von 12 auf 28 distinkte Werte springt, hat eine neue Variationsquelle. Untersuchen Sie, bevor das Problem skaliert.
Nach geschäftlicher Wirkung priorisieren
Nicht jedes Feld benötigt 100 % Konformität. Konzentrieren Sie sich auf Felder, die Reporting antreiben (Country, Industry), Automatisierung speisen (Status, Stage) oder Daten an KI und Agentforce liefern.
Nächste Schritte
Sie haben nun alle fünf Datenqualitätsdimensionen abgeschlossen. Setzen Sie Ihr Lernen fort:
- In Salesforce: Datenqualität in Salesforce - standardisieren Sie Picklist- und Referenzwerte in Salesforce
- Nächste: Agentforce-Vorbereitung - Erfahren Sie mehr über KI-spezifische Datenanforderungen
- Vorherige: Aktualität - Messen Sie Datenfrische und -aktualität
- Überblick: Die fünf Dimensionen - Überprüfen Sie alle Dimensionen zusammen
- Aktion: AI Readiness Assessment - Sehen Sie Ihre Konsistenz-Scores und mehr