Skip to main content

Konsistenz: Konfigurationsszenarien

Drei praxisnahe Anleitungen, die zeigen, wie Sie die DQS-Konsistenzanalyse für unterschiedliche Geschäftsanforderungen konfigurieren.

Was diese Szenarien abdecken

Diese Seite führt durch drei praxisnahe Konsistenzkonfigurationen, von der Ersteinrichtung bis zum Lesen der Scan-Ergebnisse. Jedes Szenario verwendet einen anderen geschäftlichen Kontext und Analysemodus.

Diese Szenarien bauen auf den Konzepten und Metriken auf, die im Hauptartikel Konsistenz behandelt werden. Lesen Sie diesen zuerst, falls Begriffe wie Conformance Rate, Variant Count und Dominant Values für Sie neu sind.

Szenario 1: Standardisierung des Country-Felds mit Discovery

Der geschäftliche Kontext

Ihre Org enthält 15.000 Account-Datensätze aus 3 fusionierten Unternehmen. Das Feld Country ist Freitext. Regionale Dashboards zeigen fragmentierte Daten: „United States” erscheint als eine Zeile, „USA” als eine weitere, „US” als dritte. Regeln zur Gebietszuordnung übersehen Datensätze, weil sie nach einer einzigen Schreibweise filtern. Sie müssen standardisieren, wissen aber nicht, welche Werte in den drei Altsystemen existieren.

Konfiguration Schritt für Schritt

Beginnen Sie mit Import from Field, um herauszufinden, was Ihre Daten tatsächlich enthalten, bevor Sie die zulässigen Werte definieren.

  1. Öffnen Sie die Konfiguration der Expected Values für das Feld Country.
  2. Klicken Sie auf Import from Field. DQS fragt die Live-Daten ab und liefert distinkte Werte nach Häufigkeit sortiert.
  3. Prüfen Sie die Checkliste. Der Import zeigt das vollständige Bild:
WertDatensätze
United States4.500
USA2.300
US1.800
Canada1.400
U.S.A.450
United States of America150
… (41 weitere Varianten)
  1. Entscheiden Sie sich für Ihren Standard. ISO-Ländercodes („US”, „CA”, „UK”) sind kompakt, branchenüblich und eindeutig. Setzen Sie Häkchen bei den ISO-Codes aus der Importliste.
  2. Klicken Sie auf Add Selected, um Ihre zulässigen Werte zu befüllen.

Setzen Sie die restliche Konfiguration:

EinstellungWertBegründung
AnalysemodusAdvanced Conformance AnalysisSie benötigen Variant Counts und Dominant Values, um die Bereinigung zu dimensionieren
Expected ValuesUS, CA, UK, DE, FR, AU, JPISO-Codes für Ihre aktiven Märkte
Case SensitiveAUSErfasst „us”, „Us” und „US” als denselben Wert
Top N10Zeigt die häufigsten Variationen
Min Frequency5Filtert einmalige Tippfehler heraus

Was der Scan liefert

MetrikWert
Conformance Rate12 %
Conformance Count1.800
Non-Conforming Count13.200
Variant Count47
Dominant ValuesTop-10-Werte mit Häufigkeiten (siehe Importtabelle oben)

Ergebnisse interpretieren

12 % Konformität sind zu erwarten. Sie haben einen neuen Standard (ISO-Codes) definiert, auf den die Daten nie normalisiert wurden. Nur die 1.800 Datensätze, die bereits „US” enthalten, passen. Das ist kein schlechter Wert. Es ist Ihr Ausgangspunkt.

47 Varianten offenbaren das Ausmaß der Fragmentierung. Drei fusionierte Systeme haben 47 verschiedene Schreibweisen für Ländernamen erzeugt. Ohne diese Zahl würden Sie den Bereinigungsaufwand unterschätzen.

Dominant Values zeigt, wo Sie ansetzen sollten. Die Top-3-Varianten („United States”, „USA”, „US”) machen 8.600 Datensätze aus. Allein die Standardisierung dieser drei Werte hebt Ihre Konformität von 12 % auf 69 %. Beginnen Sie dort.

Non-Conforming Count (13.200) ist Ihr exakter Bereinigungsumfang. Ihr Data Steward hat nun eine konkrete Projektgröße, keine Schätzung.

Nächster Schritt

Erstellen Sie eine Wertzuordnungstabelle auf Basis der Dominant-Values-Ausgabe. Ordnen Sie „United States” zu „US”, „USA” zu „US” usw. zu. Führen Sie die Datennormalisierung durch. Scannen Sie erneut, um Ihre neue Conformance Rate zu überprüfen.

Szenario 2: Lead-Rating-Validierung

Der geschäftliche Kontext

Ihr Lead-Rating-Feld (Rating__c) ist ein Textfeld, das „Hot”, „Warm” oder „Cold” akzeptiert. Sales Manager berichten von seltsamen Werten in ihren Pipeline-Berichten. Ein Filter für Rating = "Hot" liefert weniger Datensätze als erwartet. Sie benötigen ein schnelles Konformitäts-Audit, um zu erfahren, was im Feld steht und wie viele Datensätze bereinigt werden müssen.

Konfiguration Schritt für Schritt

Beginnen Sie mit Import from Field, um die tatsächlichen Werte zu sehen, bevor Sie Ihren Scan konfigurieren.

  1. Öffnen Sie die Expected-Values-Konfiguration für Rating__c.
  2. Klicken Sie auf Import from Field. Der Import liefert:
WertDatensätze
Hot284
Warm198
Cold156
Very High23
240 km/h12
N/A8

Die ersten drei Werte sind Ihre echten Ratings. „Very High” stammt aus einer anderen Picklist (jemand hat aus dem falschen Feld eingefügt). „240 km/h” sind eindeutig Daten aus einem völlig falschen Feld. „N/A” ist ein Platzhalter.

  1. Wählen Sie „Hot”, „Warm” und „Cold” aus. Lassen Sie den Rest unmarkiert.
  2. Klicken Sie auf Add Selected.

Setzen Sie die restliche Konfiguration:

EinstellungWertBegründung
AnalysemodusConformance CheckSie benötigen eine Ja/Nein-Antwort, keine tiefgehende Analyse
Expected ValuesHot, Warm, ColdIhre drei gültigen Ratings
Case SensitiveAUSErfasst „hot”, „HOT” und „Hot” als Treffer

Was der Scan liefert

MetrikWert
Conformance Rate93,7 %
Conformance Count638

Ergebnisse interpretieren

93,7 % konform. Das bedeutet, dass 43 Datensätze Datenmüll enthalten. Für ein schnelles Audit liefert der Modus Conformance Check die Antwort zügig, ohne fortgeschrittene Metriken zu berechnen.

Der Schritt Import from Field hat Ihnen bereits gezeigt, wie der Datenmüll aussieht. „Very High” (23 Datensätze aus einem falschen Picklist-Wert), „240 km/h” (12 Datensätze mit Daten aus dem falschen Feld) und „N/A” (8 Platzhaltereinträge). Sie benötigen Dominant Values hier nicht, da der Import Ihnen die Aufschlüsselung schon vor dem Scan geliefert hat.

43 Datensätze sind eine überschaubare Bereinigung. Dies ist kein Datenmigrationsprojekt. Es ist eine 30-minütige manuelle Korrektur oder ein einzelner Datenaktualisierungs-Job.

Nächster Schritt

Korrigieren Sie die 43 nicht-konformen Datensätze. Wandeln Sie dann Rating__c von einem Textfeld in eine Picklist um, um künftige Probleme zu verhindern. Per API erstellte Datensätze umgehen die Picklist-Validierung; führen Sie daher regelmäßig Konsistenzscans durch, um neue Variationen aus Integrationen zu erkennen.

Szenario 3: Job-Title-Konformität für Persona-Targeting

Der geschäftliche Kontext

Ihr Marketingteam führt persona-basierte Kampagnen durch, die Contacts „VP und höher” adressieren. Das Feld Title ist Freitext mit Tausenden von Variationen. Vor jeder Kampagne sucht jemand manuell nach Title-Stichwörtern, übersieht die Hälfte der Varianten und erstellt eine unvollständige Zielgruppenliste. Das Team braucht eine datengetriebene Antwort auf zwei Fragen: „Wie viele VP+-Contacts haben wir?” und „Welche Titles haben die restlichen Contacts?”

Konfiguration Schritt für Schritt

  1. Öffnen Sie die Expected-Values-Konfiguration für das Feld Title auf Contacts.
  2. Klicken Sie auf Import from Field. Der Import liefert Hunderte Werte. Zu viele, um sie einzeln auszuwählen, aber die Häufigkeiten sind als Kontext hilfreich.
  3. Definieren Sie Ihre zulässigen Werte basierend auf Ihrer Persona-Zuordnung. Markieren oder tippen Sie die Title-Werte, die Ihr Team als „VP und höher” betrachtet:
VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President
  1. Klicken Sie auf Add Selected.

Setzen Sie die restliche Konfiguration:

EinstellungWertBegründung
AnalysemodusAdvanced Conformance AnalysisSie benötigen die vollständige Werteverteilung, um zu sehen, welche Titles existieren
Expected Values(16 oben aufgelistete Title-Werte)Ihre VP+-Persona-Definition
Case SensitiveAUSErfasst „vp of sales”, „VP of Sales”, „VP OF SALES”
Top N20Sehen Sie eine breite Streuung
Min Frequency5Filtert Einmaleinträge wie „Chief Happiness Officer”

Was der Scan liefert

MetrikWert
Conformance Rate34 %
Conformance Count3.400
Non-Conforming Count6.600
Variant Count312

Dominant Values (Top 20):

RangWertAnzahl
1Manager820
2Sales Representative650
3Account Executive480
4Director of Marketing340
5VP of Sales290
6Senior Manager275
7Consultant240
8Engineer210
9CEO195
10Head of Operations180
(10 weitere)

Ergebnisse interpretieren

34 % Konformität ist kein Misserfolg. Dies ist kein Datenqualitätsproblem. Es bedeutet, dass 34 % Ihrer Contacts VP+-Titles haben, und das ist Ihre Kampagnen-Zielgruppe. Die Zahl beantwortet die Frage, an der Ihr Marketingteam bisher gerätselt hat.

312 Variant Count bestätigt, dass der Freitext-Title stark fragmentiert ist. 312 unterschiedliche Title-Werte über 10.000 Contacts. Das ist normal für Freitextfelder und erklärt, warum manuelle Suchen Personen übersehen.

Dominant Values zeigt, welche Titles Ihre Contacts tatsächlich haben. Viele der Spitzenwerte liegen unterhalb der VP-Ebene (Manager, Sales Rep, Account Executive). Das ist zu erwarten. Diese Contacts sind gültige Datensätze mit gültigen Titles. Sie fallen außerhalb Ihrer Zielpersona.

Non-Conforming Count (6.600) ist KEIN Bereinigungsumfang. Im Unterschied zum Country-Szenario sind dies keine schmutzigen Datensätze. Es sind Contacts mit Titles außerhalb Ihres VP+-Filters. „Manager” ist ein echter Title, kein Datenfehler. Betrachten Sie Non-Conforming Count als „Contacts außerhalb dieser Persona”, nicht als „zu korrigierende Datensätze”.

Die eigentliche Erkenntnis: Sie haben jetzt eine datengetriebene Zielgruppengröße. 3.400 VP+-Contacts, verifiziert durch Scannen der tatsächlichen Daten. Keine manuellen Stichwortsuchen mehr.

Nächster Schritt

Verwenden Sie den Conformance Count (3.400) als Zielgruppengröße Ihrer VP+-Kampagne. Überprüfen Sie die Dominant-Values-Liste auf Titles, die Sie übersehen haben. „Senior Manager” (275 Datensätze) und „Head of Operations” (180 Datensätze) sind Grenzfälle. Falls diese Rollen für Ihre Kampagnen in Frage kommen, fügen Sie sie den zulässigen Werten hinzu und scannen Sie erneut.

Ihre Konfiguration wählen

Wenn Sie … müssenBeginnen Sie mitWichtige Einstellungen
Ein kontrolliertes Feld (Picklist, Rating, Status) prüfenImport from Field, dann Conformance CheckExpected Values aus Import, Case Sensitive AUS
Ein fragmentiertes Feld (Country, Industry) standardisierenImport from Field, dann Advanced Conformance AnalysisExpected Values als Zielstandard, Top N 10+, Min Frequency 5+
Eine Zielgruppe oder ein Segment aus Freitextdaten dimensionierenImport from Field, dann Advanced Conformance AnalysisExpected Values als Segmentdefinition, Top N 20, Min Frequency 5
Eine schnelle Baseline vor einem BereinigungsprojektImport from Field, dann Conformance CheckExpected Values aus Ihrem Datenstandard

Für eine vollständige Erläuterung aller 6 Konsistenzmetriken, Analysemodi und Konfigurationseingaben kehren Sie zum Hauptartikel Konsistenz zurück.

Bereit, Ihre eigene Datenqualität zu messen? Nehmen Sie am AI Readiness Assessment teil, um Ihre Konsistenzwerte und mehr zu sehen.