Konsistenz: Konfigurationsszenarien

Was diese Szenarien abdecken

Diese Seite führt durch drei praxisnahe Konsistenzkonfigurationen, von der Ersteinrichtung bis zum Lesen der Scan-Ergebnisse. Jedes Szenario verwendet einen anderen geschäftlichen Kontext und Analysemodus.

Diese Szenarien bauen auf den Konzepten und Metriken auf, die im Hauptartikel Konsistenz behandelt werden. Lesen Sie diesen zuerst, falls Begriffe wie Conformance Rate, Variant Count und Dominant Values für Sie neu sind.

Szenario 1: Standardisierung des Country-Felds mit Discovery

Der geschäftliche Kontext

Ihre Org enthält 15.000 Account-Datensätze aus 3 fusionierten Unternehmen. Das Feld Country ist Freitext. Regionale Dashboards zeigen fragmentierte Daten: „United States” erscheint als eine Zeile, „USA” als eine weitere, „US” als dritte. Regeln zur Gebietszuordnung übersehen Datensätze, weil sie nach einer einzigen Schreibweise filtern. Sie müssen standardisieren, wissen aber nicht, welche Werte in den drei Altsystemen existieren.

Konfiguration Schritt für Schritt

Beginnen Sie mit Import from Field, um herauszufinden, was Ihre Daten tatsächlich enthalten, bevor Sie die zulässigen Werte definieren.

Öffnen Sie die Konfiguration der Expected Values für das Feld Country.
Klicken Sie auf Import from Field. DQS fragt die Live-Daten ab und liefert distinkte Werte nach Häufigkeit sortiert.
Prüfen Sie die Checkliste. Der Import zeigt das vollständige Bild:

Wert	Datensätze
United States	4.500
USA	2.300
US	1.800
Canada	1.400
U.S.A.	450
United States of America	150
… (41 weitere Varianten)	…

Entscheiden Sie sich für Ihren Standard. ISO-Ländercodes („US”, „CA”, „UK”) sind kompakt, branchenüblich und eindeutig. Setzen Sie Häkchen bei den ISO-Codes aus der Importliste.
Klicken Sie auf Add Selected, um Ihre zulässigen Werte zu befüllen.

Setzen Sie die restliche Konfiguration:

Einstellung	Wert	Begründung
Analysemodus	Advanced Conformance Analysis	Sie benötigen Variant Counts und Dominant Values, um die Bereinigung zu dimensionieren
Expected Values	US, CA, UK, DE, FR, AU, JP	ISO-Codes für Ihre aktiven Märkte
Case Sensitive	AUS	Erfasst „us”, „Us” und „US” als denselben Wert
Top N	10	Zeigt die häufigsten Variationen
Min Frequency	5	Filtert einmalige Tippfehler heraus

Was der Scan liefert

Metrik	Wert
Conformance Rate	12 %
Conformance Count	1.800
Non-Conforming Count	13.200
Variant Count	47
Dominant Values	Top-10-Werte mit Häufigkeiten (siehe Importtabelle oben)

Ergebnisse interpretieren

12 % Konformität sind zu erwarten. Sie haben einen neuen Standard (ISO-Codes) definiert, auf den die Daten nie normalisiert wurden. Nur die 1.800 Datensätze, die bereits „US” enthalten, passen. Das ist kein schlechter Wert. Es ist Ihr Ausgangspunkt.

47 Varianten offenbaren das Ausmaß der Fragmentierung. Drei fusionierte Systeme haben 47 verschiedene Schreibweisen für Ländernamen erzeugt. Ohne diese Zahl würden Sie den Bereinigungsaufwand unterschätzen.

Dominant Values zeigt, wo Sie ansetzen sollten. Die Top-3-Varianten („United States”, „USA”, „US”) machen 8.600 Datensätze aus. Allein die Standardisierung dieser drei Werte hebt Ihre Konformität von 12 % auf 69 %. Beginnen Sie dort.

Non-Conforming Count (13.200) ist Ihr exakter Bereinigungsumfang. Ihr Data Steward hat nun eine konkrete Projektgröße, keine Schätzung.

Nächster Schritt

Erstellen Sie eine Wertzuordnungstabelle auf Basis der Dominant-Values-Ausgabe. Ordnen Sie „United States” zu „US”, „USA” zu „US” usw. zu. Führen Sie die Datennormalisierung durch. Scannen Sie erneut, um Ihre neue Conformance Rate zu überprüfen.

Szenario 2: Lead-Rating-Validierung

Der geschäftliche Kontext

Ihr Lead-Rating-Feld (Rating__c) ist ein Textfeld, das „Hot”, „Warm” oder „Cold” akzeptiert. Sales Manager berichten von seltsamen Werten in ihren Pipeline-Berichten. Ein Filter für Rating = "Hot" liefert weniger Datensätze als erwartet. Sie benötigen ein schnelles Konformitäts-Audit, um zu erfahren, was im Feld steht und wie viele Datensätze bereinigt werden müssen.

Konfiguration Schritt für Schritt

Beginnen Sie mit Import from Field, um die tatsächlichen Werte zu sehen, bevor Sie Ihren Scan konfigurieren.

Öffnen Sie die Expected-Values-Konfiguration für Rating__c.
Klicken Sie auf Import from Field. Der Import liefert:

Wert	Datensätze
Hot	284
Warm	198
Cold	156
Very High	23
240 km/h	12
N/A	8

Die ersten drei Werte sind Ihre echten Ratings. „Very High” stammt aus einer anderen Picklist (jemand hat aus dem falschen Feld eingefügt). „240 km/h” sind eindeutig Daten aus einem völlig falschen Feld. „N/A” ist ein Platzhalter.

Wählen Sie „Hot”, „Warm” und „Cold” aus. Lassen Sie den Rest unmarkiert.
Klicken Sie auf Add Selected.

Setzen Sie die restliche Konfiguration:

Einstellung	Wert	Begründung
Analysemodus	Conformance Check	Sie benötigen eine Ja/Nein-Antwort, keine tiefgehende Analyse
Expected Values	Hot, Warm, Cold	Ihre drei gültigen Ratings
Case Sensitive	AUS	Erfasst „hot”, „HOT” und „Hot” als Treffer

Was der Scan liefert

Metrik	Wert
Conformance Rate	93,7 %
Conformance Count	638

Ergebnisse interpretieren

93,7 % konform. Das bedeutet, dass 43 Datensätze Datenmüll enthalten. Für ein schnelles Audit liefert der Modus Conformance Check die Antwort zügig, ohne fortgeschrittene Metriken zu berechnen.

Der Schritt Import from Field hat Ihnen bereits gezeigt, wie der Datenmüll aussieht. „Very High” (23 Datensätze aus einem falschen Picklist-Wert), „240 km/h” (12 Datensätze mit Daten aus dem falschen Feld) und „N/A” (8 Platzhaltereinträge). Sie benötigen Dominant Values hier nicht, da der Import Ihnen die Aufschlüsselung schon vor dem Scan geliefert hat.

43 Datensätze sind eine überschaubare Bereinigung. Dies ist kein Datenmigrationsprojekt. Es ist eine 30-minütige manuelle Korrektur oder ein einzelner Datenaktualisierungs-Job.

Nächster Schritt

Korrigieren Sie die 43 nicht-konformen Datensätze. Wandeln Sie dann Rating__c von einem Textfeld in eine Picklist um, um künftige Probleme zu verhindern. Per API erstellte Datensätze umgehen die Picklist-Validierung; führen Sie daher regelmäßig Konsistenzscans durch, um neue Variationen aus Integrationen zu erkennen.

Szenario 3: Job-Title-Konformität für Persona-Targeting

Der geschäftliche Kontext

Ihr Marketingteam führt persona-basierte Kampagnen durch, die Contacts „VP und höher” adressieren. Das Feld Title ist Freitext mit Tausenden von Variationen. Vor jeder Kampagne sucht jemand manuell nach Title-Stichwörtern, übersieht die Hälfte der Varianten und erstellt eine unvollständige Zielgruppenliste. Das Team braucht eine datengetriebene Antwort auf zwei Fragen: „Wie viele VP+-Contacts haben wir?” und „Welche Titles haben die restlichen Contacts?”

Konfiguration Schritt für Schritt

Öffnen Sie die Expected-Values-Konfiguration für das Feld Title auf Contacts.
Klicken Sie auf Import from Field. Der Import liefert Hunderte Werte. Zu viele, um sie einzeln auszuwählen, aber die Häufigkeiten sind als Kontext hilfreich.
Definieren Sie Ihre zulässigen Werte basierend auf Ihrer Persona-Zuordnung. Markieren oder tippen Sie die Title-Werte, die Ihr Team als „VP und höher” betrachtet:

VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President

Klicken Sie auf Add Selected.

Setzen Sie die restliche Konfiguration:

Einstellung	Wert	Begründung
Analysemodus	Advanced Conformance Analysis	Sie benötigen die vollständige Werteverteilung, um zu sehen, welche Titles existieren
Expected Values	(16 oben aufgelistete Title-Werte)	Ihre VP+-Persona-Definition
Case Sensitive	AUS	Erfasst „vp of sales”, „VP of Sales”, „VP OF SALES”
Top N	20	Sehen Sie eine breite Streuung
Min Frequency	5	Filtert Einmaleinträge wie „Chief Happiness Officer”

Was der Scan liefert

Metrik	Wert
Conformance Rate	34 %
Conformance Count	3.400
Non-Conforming Count	6.600
Variant Count	312

Dominant Values (Top 20):

Rang	Wert	Anzahl
1	Manager	820
2	Sales Representative	650
3	Account Executive	480
4	Director of Marketing	340
5	VP of Sales	290
6	Senior Manager	275
7	Consultant	240
8	Engineer	210
9	CEO	195
10	Head of Operations	180
…	(10 weitere)	…

Ergebnisse interpretieren

34 % Konformität ist kein Misserfolg. Dies ist kein Datenqualitätsproblem. Es bedeutet, dass 34 % Ihrer Contacts VP+-Titles haben, und das ist Ihre Kampagnen-Zielgruppe. Die Zahl beantwortet die Frage, an der Ihr Marketingteam bisher gerätselt hat.

312 Variant Count bestätigt, dass der Freitext-Title stark fragmentiert ist. 312 unterschiedliche Title-Werte über 10.000 Contacts. Das ist normal für Freitextfelder und erklärt, warum manuelle Suchen Personen übersehen.

Dominant Values zeigt, welche Titles Ihre Contacts tatsächlich haben. Viele der Spitzenwerte liegen unterhalb der VP-Ebene (Manager, Sales Rep, Account Executive). Das ist zu erwarten. Diese Contacts sind gültige Datensätze mit gültigen Titles. Sie fallen außerhalb Ihrer Zielpersona.

Non-Conforming Count (6.600) ist KEIN Bereinigungsumfang. Im Unterschied zum Country-Szenario sind dies keine schmutzigen Datensätze. Es sind Contacts mit Titles außerhalb Ihres VP+-Filters. „Manager” ist ein echter Title, kein Datenfehler. Betrachten Sie Non-Conforming Count als „Contacts außerhalb dieser Persona”, nicht als „zu korrigierende Datensätze”.

Die eigentliche Erkenntnis: Sie haben jetzt eine datengetriebene Zielgruppengröße. 3.400 VP+-Contacts, verifiziert durch Scannen der tatsächlichen Daten. Keine manuellen Stichwortsuchen mehr.

Nächster Schritt

Verwenden Sie den Conformance Count (3.400) als Zielgruppengröße Ihrer VP+-Kampagne. Überprüfen Sie die Dominant-Values-Liste auf Titles, die Sie übersehen haben. „Senior Manager” (275 Datensätze) und „Head of Operations” (180 Datensätze) sind Grenzfälle. Falls diese Rollen für Ihre Kampagnen in Frage kommen, fügen Sie sie den zulässigen Werten hinzu und scannen Sie erneut.

Ihre Konfiguration wählen

Wenn Sie … müssen	Beginnen Sie mit	Wichtige Einstellungen
Ein kontrolliertes Feld (Picklist, Rating, Status) prüfen	Import from Field, dann Conformance Check	Expected Values aus Import, Case Sensitive AUS
Ein fragmentiertes Feld (Country, Industry) standardisieren	Import from Field, dann Advanced Conformance Analysis	Expected Values als Zielstandard, Top N 10+, Min Frequency 5+
Eine Zielgruppe oder ein Segment aus Freitextdaten dimensionieren	Import from Field, dann Advanced Conformance Analysis	Expected Values als Segmentdefinition, Top N 20, Min Frequency 5
Eine schnelle Baseline vor einem Bereinigungsprojekt	Import from Field, dann Conformance Check	Expected Values aus Ihrem Datenstandard

Für eine vollständige Erläuterung aller 6 Konsistenzmetriken, Analysemodi und Konfigurationseingaben kehren Sie zum Hauptartikel Konsistenz zurück.

Bereit, Ihre eigene Datenqualität zu messen? Nehmen Sie am AI Readiness Assessment teil, um Ihre Konsistenzwerte und mehr zu sehen.