Validität: Konfigurationsszenarien

Was diese Szenarien abdecken

Diese Seite führt durch drei praxisnahe Konfigurationen der DQS-Validitätsanalyse. Jedes Szenario behandelt ein konkretes geschäftliches Problem, zeigt die exakten Einstellungen und erklärt, wie die Ergebnisse zu lesen sind.

Diese Anleitungen bauen auf den Konzepten aus dem Hauptartikel Validität auf. Lesen Sie diesen zuerst, falls Validitätsmetriken, der diagnostische Ablauf oder Musterkonfiguration neu für Sie sind.

Szenario 1: Validierung einer Zweit-E-Mail in einem benutzerdefinierten Textfeld

Das Problem

Ihre Organisation speichert eine zweite E-Mail-Adresse in einem benutzerdefinierten Textfeld Secondary_Email__c auf dem Contact-Objekt. Anders als das Standard-Salesforce-Email-Feld hat ein Textfeld keine eingebaute Formatvalidierung. Benutzer fügen ein, tippen und importieren alles hinein. Marketing möchte diese Zweitadressen für eine Re-Engagement-Kampagne verwenden, aber niemand weiß, wie viele strukturell gültig sind. Sie benötigen eine konkrete Zahl, damit Marketing realistische Kampagnenprognosen setzen kann und Ihr Ops-Team den Bereinigungsaufwand dimensionieren kann.

Warum nicht das Standard-Email-Feld? Der native Email-Feldtyp von Salesforce validiert das Format bei der Eingabe. Werte in einem Standard-Email-Feld bestehen bereits grundlegende Formatprüfungen. Die DQS-E-Mail-Validierung ist nützlich auf benutzerdefinierten Textfeldern, die E-Mail-Adressen ohne die integrierte Salesforce-Durchsetzung speichern.

Konfiguration

Verwenden Sie den Modus Format Validation auf dem Contact-Objekt mit dem Zielfeld Secondary_Email__c. Sie benötigen die Headline-Validitätsrate und eine Anzahl nutzbarer Datensätze. Platzhaltererkennung und Rauschanalyse sind hier nicht relevant, da E-Mail-Adressen entweder dem Format entsprechen oder nicht.

Einstellung	Wert	Warum
Analysemodus	Format Validation	Sie benötigen die Match-Rate und gültige Anzahl, keine vollständige Ungültig-Aufschlüsselung
Pattern Type	Email	Eingebautes Muster: `^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$`
Include Blanks	AUS	Leere E-Mails sind ein Vollständigkeitsproblem, kein Validitätsproblem. Lassen Sie sie aus dieser Analyse heraus.
Case Sensitive	AUS	E-Mail-Adressen sind per Definition nicht case-sensitiv

Das Email-Muster ist ein eingebautes Preset. Sie müssen keinen Regex schreiben. Wählen Sie „Email” aus dem Musterauswahl-Menü, und der Regex wird automatisch angewendet.

Beispielergebnisse

Metrik	Wert
Validity Rate	71 %
Valid Count	35.500

Gesamtzahl ausgewerteter Contact-Datensätze: 50.000.

Ergebnisse interpretieren

Beginnen Sie mit der Schlagzeile: 71 % Validität. Das bedeutet, dass 29 % der Zweit-E-Mail-Adressen die Formatprüfung nicht bestehen. Von 50.000 Contacts mit befülltem Secondary_Email__c haben nur 35.500 eine strukturell gültige Adresse.

Wie 29 % ungültig in der Praxis aussehen: Dies sind Werte ohne „@“-Symbol (john.company.com), ohne Domain-Endung (john@company), mit doppelten Punkten (john@company..com) oder mit Leerzeichen (john @company.com). Weil es sich um ein Textfeld handelt, hat Salesforce sie alle bei der Eingabe akzeptiert. Jede an diese Adressen gesendete Kampagne landet als Bounce.

Die Kampagnenrechnung ändert sich. Marketing hatte die Re-Engagement-Reichweite auf Basis von 50.000 Zweitadressen prognostiziert. Die tatsächlich adressierbare Zielgruppe umfasst 35.500. Öffnungsraten, Klickraten und Konversionsprognosen müssen alle gegen die gültige Basis neu berechnet werden, nicht gegen die überhöhte Gesamtzahl.

Warum Format Validation hier ausreicht. Sie benötigen den Advanced-Modus für dieses Szenario nicht. Die Frage ist einfach: „Wie viele Zweit-E-Mails entsprechen einem gültigen Format?” Validity Rate und Valid Count beantworten diese Frage. Wenn Sie später ein Bereinigungsprojekt mit exakten Ungültig-Zahlen dimensionieren müssen, wechseln Sie zu Advanced Format Validation für die vollständige Aufschlüsselung.

Was als Nächstes zu tun ist

Verwenden Sie Valid Count (35.500) als reale adressierbare Zielgruppe für die Kampagnenplanung. Dimensionieren Sie ein Bereinigungsprojekt für die verbleibenden 14.500 Datensätze: Exportieren Sie sie, identifizieren Sie die häufigsten Formatfehler und beheben Sie sie durch Datenanreicherung oder manuelle Korrektur. Erwägen Sie das Hinzufügen einer Salesforce-Validierungsregel auf Secondary_Email__c, um das E-Mail-Format bei künftigen Einträgen zu erzwingen, oder wandeln Sie das Feld in den Email-Typ um, wenn Ihre Prozesse dies zulassen.

Szenario 2: Produktcode-Validierung mit fester Länge

Das Problem

Ihr Unternehmen verwendet 8-stellige Produktcodes in einem benutzerdefinierten Feld Product_Code__c auf dem Opportunity Product-Objekt. Diese Codes steuern Inventurabfragen, Preisregeln und ERP-Integration. Die ERP-Synchronisation schlägt jede Woche bei etwa 5 % der Datensätze fehl, und das Integrationsteam vermutet fehlerhafte Produktcodes. Sie müssen bestätigen, wie viele Codes die Formatprüfung nicht bestehen, und den exakten Bereinigungsumfang erhalten.

Konfiguration

Verwenden Sie den Modus Advanced Format Validation auf dem Opportunity Product-Objekt mit dem Zielfeld Product_Code__c. Sie benötigen die vollständige Gültig/Ungültig-Aufschlüsselung, damit das Integrationsteam exakte Datensatzanzahlen für sein Remediationsprojekt hat.

Einstellung	Wert	Warum
Analysemodus	Advanced Format Validation	Sie benötigen Invalid Count zur Dimensionierung der Bereinigung, plus Noise Rate zur Prüfung auf Datenmüll
Pattern Type	Fixed Length	Produktcodes sind immer exakt 8 Zeichen lang
Fixed Length	8	Ihre Standardcodelänge
Include Blanks	EIN	Ein leerer Produktcode ist ungültig für die ERP-Sync. Als Fehler zählen.
Case Sensitive	AUS	Produktcodes sind in Ihrem System nicht fallabhängig

Das Fixed-Length-Muster erzeugt automatisch den Regex ^.{8}$. Jeder Wert, der nicht exakt 8 Zeichen lang ist, besteht die Validierung nicht.

Beispielergebnisse

Grundmetriken:

Metrik	Wert
Validity Rate	94,2 %
Valid Count	9.420

Erweiterte Metriken:

Metrik	Wert
Invalid Rate	5,8 %
Invalid Count	580
Noise Rate	0,4 %
Noisy Records Count	40

Gesamtzahl ausgewerteter Datensätze: 10.000.

Ergebnisse interpretieren

5,8 % ungültig bestätigen die Schätzung des Integrationsteams. 580 Produktcodes von 10.000 entsprechen nicht dem 8-Zeichen-Format. Dies sind die Datensätze, die die ERP-Sync stören.

Invalid Count (580) ist der Bereinigungsumfang. Ihr Integrationsteam hat nun eine konkrete Zahl. Anstatt jede Sync-Fehlermeldung einzeln zu untersuchen, können sie die 580 Datensätze ziehen, Formatfehler kategorisieren und in Batches korrigieren. Häufige Probleme in Produktcode-Feldern umfassen abgeschnittene Codes (5–7 Zeichen aus Copy-Paste-Fehlern), Codes mit abschließenden Leerzeichen (9 Zeichen wegen eines unsichtbaren Leerzeichens) und Codes mit von Benutzern hinzugefügten Bindestrichen oder Präfixen („PC-12345678”).

Noise Rate (0,4 %) ist niedrig, aber erwähnenswert. 40 Datensätze enthalten Rauschmuster: wiederholte Zeichen („XXXXXXXX”), Tastatureingaben („asdfghjk”) oder Sonderzeichenfolgen. Diese 40 Datensätze sind keine Formatfehler. Es sind Datenmüll-Einträge, die zufällig genau 8 Zeichen lang sind. Validity Rate hat sie als gültig gezählt, weil sie die Längenprüfung bestehen, aber sie sind Müll, der aus einem anderen Grund bei der ERP-Abfrage fehlschlagen wird. Noise Rate erfasst, was die Formatprüfung übersieht.

Include Blanks EIN ist hier entscheidend. Mit aktiviertem Include Blanks zählt jeder Datensatz, bei dem Product_Code__c leer ist, als ungültig. Hätten Sie diese Einstellung aus gelassen, wären diese leeren Datensätze vollständig von der Auswertung ausgeschlossen worden, und Ihr Invalid Count wäre niedriger als die tatsächliche Anzahl der ERP-Sync-Fehler. Da ein leerer Produktcode die Integration genauso bricht wie ein fehlerhafter, gibt Ihnen das Einbeziehen von Blanks den genauen Fehlerumfang.

Was als Nächstes zu tun ist

Exportieren Sie die 580 ungültigen Datensätze für das Integrationsteam. Kategorisieren Sie Fehler nach Typ: abgeschnittene Codes, zusätzliche Zeichen, abschließende Leerzeichen. Beheben Sie sie in Bulk mit einem Datenaktualisierungs-Job. Untersuchen Sie bei den 40 verrauschten Datensätzen die Quelle. Wenn sie aus einem bestimmten Import oder Benutzer stammen, beheben Sie die Ursache. Fügen Sie nach der Bereinigung eine Salesforce-Validierungsregel hinzu, die die 8-Zeichen-Länge auf Product_Code__c erzwingt, um neue fehlerhafte Einträge zu verhindern. Scannen Sie erneut, um Ihre neue Validity Rate zu überprüfen.

Szenario 3: Web-to-Lead Company Name - Rauscherkennung

Das Problem

Ihr Web-to-Lead-Formular verlangt das Feld Company. Das Lead-Volumen ist stark: 20.000 neue Leads pro Quartal. Aber das SDR-Team meldet, dass viele Leads unbrauchbare Firmennamen haben, Einträge wie „asdf”, „test”, „xxx” oder „na na na”. Diese Leads verschwenden SDR-Zeit und verunreinigen Ihre Segmentierung. Eine einfache Vollständigkeitsprüfung zeigt, dass 98 % der Leads einen Company-Wert haben. Sie vermuten, dass die 98 % irreführend sind, weil Datenmüll-Einträge technisch „befüllt” sind.

Konfiguration

Verwenden Sie den Modus Advanced Format Validation auf dem Lead-Objekt mit dem Zielfeld Company. Sie benötigen Noise Rate, um den Müll zu quantifizieren, der sich hinter einer gesunden Vollständigkeitszahl verbirgt.

Für das Formatmuster gibt es keine strikte Formatregel für Firmennamen. Firmennamen sind Freitext. Verwenden Sie eine minimale Textvalidierung, um zu prüfen, dass der Wert mindestens ein alphanumerisches Zeichen enthält.

Einstellung	Wert	Warum
Analysemodus	Advanced Format Validation	Sie benötigen Noise Rate und Noisy Records Count, um Datenmüll zu quantifizieren
Pattern Type	Custom	Kein eingebautes Muster passt zu Freitext-Firmennamen
Custom Pattern	`^.[a-zA-Z0-9].$`	Matcht jeden Wert, der mindestens einen Buchstaben oder eine Ziffer enthält. Erfasst Werte, die nur aus Sonderzeichen bestehen.
Include Blanks	EIN	Leere Firmennamen sind ebenfalls ein Problem. In die Fehlerzahl einbeziehen.
Case Sensitive	AUS	Für dieses Muster nicht relevant, aber als Standard auf AUS lassen

Der eigentliche Wert dieses Scans liegt in den Rauschmetriken, nicht in der Formatvalidierung. Das benutzerdefinierte Muster ist absichtlich locker, weil Sie kein bestimmtes Firmennamen-Format erzwingen. Sie führen den Scan im Advanced-Modus aus, um Zugriff auf Noise Rate und Noisy Records Count zu erhalten.

Beispielergebnisse

Grundmetriken:

Metrik	Wert
Validity Rate	97,5 %
Valid Count	19.500

Erweiterte Metriken:

Metrik	Wert
Invalid Rate	2,5 %
Invalid Count	500
Noise Rate	12 %
Noisy Records Count	2.400

Gesamtzahl ausgewerteter Lead-Datensätze: 20.000.

Ergebnisse interpretieren

97,5 % Validität sind erwartet und nicht der Punkt. Fast jeder Wert besteht die lockere Formatprüfung, weil das Muster nur ein alphanumerisches Zeichen verlangt. Die 500 ungültigen Datensätze sind Einträge mit nur Sonderzeichen oder Whitespace, Werte wie „---”, „…” oder „!!!”. Diese sind einfach zu identifizieren und zu löschen.

Noise Rate (12 %) ist der eigentliche Befund. 2.400 Leads haben Firmennamen, die Rauschmuster enthalten. Dies sind Einträge mit wiederholten Zeichen („aaaa”, „xxxxx”), aufeinanderfolgenden Sonderzeichen („!@#$%”) oder Steuerzeichen. Sie bestehen die Formatprüfung, weil sie alphanumerische Zeichen enthalten, aber die Werte sind Datenmüll.

Das wahre Datenqualitätsbild:

Kategorie	Datensätze	Was es bedeutet
Sauber und gültig	17.100	Echte Firmennamen, bereit für SDR-Outreach
Ungültig (reiner Müll)	500	Gar kein alphanumerischer Inhalt. Löschen oder in Quarantäne.
Verrauscht (versteckter Müll)	2.400	Sieht befüllt aus, enthält aber Datenmüll. Manuelle Prüfung oder automatisches Flag.

Ihr SDR-Team hat recht: Das Lead-Qualitätsproblem ist real. 2.900 von 20.000 Leads (14,5 %) haben unbrauchbare Firmendaten. Das sind 14,5 % SDR-Zeit, die auf Leads verschwendet wird, die nie richtig geroutet, angereichert oder segmentiert werden können.

Die Lücke zwischen Vollständigkeit und Validität. Vollständigkeit sagt, dass 98 % der Leads einen Company-Wert haben. Validität sagt, dass 97,5 % die Formatprüfung bestehen. Noise Rate sagt, dass 12 % der bestehenden Werte Datenmüll sind. Jede Dimension offenbart eine andere Schicht des Problems. Vollständigkeit allein übersieht den Müll, den Noise Rate erfasst.

Was als Nächstes zu tun ist

Bauen Sie eine Bereinigungs-Queue für die 2.900 kombinierten ungültigen und verrauschten Datensätze. Für die 500 rein ungültigen Datensätze: automatisches Löschen oder Quarantäne. Für die 2.400 verrauschten Datensätze entscheiden: Leads ohne andere nützliche Daten automatisch löschen oder für manuelle Prüfung kennzeichnen, wenn Telefon- oder E-Mail-Daten noch nutzbar sind.

Beheben Sie die Quelle. Der Müll kommt von Ihrem Webformular. Fügen Sie clientseitige Validierung hinzu: eine Mindestzeichenlänge, blockieren Sie Muster mit wiederholten Zeichen und erwägen Sie CAPTCHA zur Bot-Prävention. Führen Sie nach Implementierung der Formularänderungen den Scan nächstes Quartal erneut durch und vergleichen Sie Noise Rate mit dieser Baseline.

Ihre Konfiguration wählen

Nutzen Sie diese Tabelle, um den richtigen Ausgangspunkt für Ihre Validitätsanalyse zu wählen.

Wenn Sie … müssen	Beginnen Sie mit	Wichtige Einstellungen
E-Mail-Format auf benutzerdefinierten Textfeldern prüfen	Format Validation	Pattern Type: Email, Include Blanks: AUS
Codes mit fester Länge validieren (Produktcodes, SKUs, Postleitzahlen)	Advanced Format Validation	Pattern Type: Fixed Length, Zeichenanzahl festlegen, Include Blanks: EIN
URL-Format auf Website-Feldern validieren	Format Validation	Pattern Type: URL, Include Blanks: AUS
Ein benutzerdefiniertes Business-Format (Regex) erzwingen	Advanced Format Validation	Pattern Type: Custom, Regex-Muster eingeben
Datenmüll und Rauschen in Freitextfeldern erkennen	Advanced Format Validation	Lockeres Formatmuster verwenden, auf Noise Rate und Noisy Records Count fokussieren
Ein Datenbereinigungsprojekt für eine Integration dimensionieren	Advanced Format Validation	Include Blanks: EIN, Invalid Count und Noisy Records Count für die Projektdimensionierung nutzen

Für eine vollständige Referenz aller 6 Validitätsmetriken, Mustertypen und Details zur Rauscherkennung kehren Sie zum Hauptartikel Validität zurück.

Bereit, Ihre eigene Datenqualität zu messen? Nehmen Sie am AI Readiness Assessment teil, um Ihre Validitätswerte und mehr zu sehen.