Skip to main content

Validität: Konfigurationsszenarien

Drei praxisnahe Anleitungen, die zeigen, wie Sie die DQS-Validitätsanalyse für unterschiedliche Geschäftsanforderungen konfigurieren.

Was diese Szenarien abdecken

Diese Seite führt durch drei praxisnahe Konfigurationen der DQS-Validitätsanalyse. Jedes Szenario behandelt ein konkretes geschäftliches Problem, zeigt die exakten Einstellungen und erklärt, wie die Ergebnisse zu lesen sind.

Diese Anleitungen bauen auf den Konzepten aus dem Hauptartikel Validität auf. Lesen Sie diesen zuerst, falls Validitätsmetriken, der diagnostische Ablauf oder Musterkonfiguration neu für Sie sind.

Szenario 1: Validierung einer Zweit-E-Mail in einem benutzerdefinierten Textfeld

Das Problem

Ihre Organisation speichert eine zweite E-Mail-Adresse in einem benutzerdefinierten Textfeld Secondary_Email__c auf dem Contact-Objekt. Anders als das Standard-Salesforce-Email-Feld hat ein Textfeld keine eingebaute Formatvalidierung. Benutzer fügen ein, tippen und importieren alles hinein. Marketing möchte diese Zweitadressen für eine Re-Engagement-Kampagne verwenden, aber niemand weiß, wie viele strukturell gültig sind. Sie benötigen eine konkrete Zahl, damit Marketing realistische Kampagnenprognosen setzen kann und Ihr Ops-Team den Bereinigungsaufwand dimensionieren kann.

Warum nicht das Standard-Email-Feld? Der native Email-Feldtyp von Salesforce validiert das Format bei der Eingabe. Werte in einem Standard-Email-Feld bestehen bereits grundlegende Formatprüfungen. Die DQS-E-Mail-Validierung ist nützlich auf benutzerdefinierten Textfeldern, die E-Mail-Adressen ohne die integrierte Salesforce-Durchsetzung speichern.

Konfiguration

Verwenden Sie den Modus Format Validation auf dem Contact-Objekt mit dem Zielfeld Secondary_Email__c. Sie benötigen die Headline-Validitätsrate und eine Anzahl nutzbarer Datensätze. Platzhaltererkennung und Rauschanalyse sind hier nicht relevant, da E-Mail-Adressen entweder dem Format entsprechen oder nicht.

EinstellungWertWarum
AnalysemodusFormat ValidationSie benötigen die Match-Rate und gültige Anzahl, keine vollständige Ungültig-Aufschlüsselung
Pattern TypeEmailEingebautes Muster: ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$
Include BlanksAUSLeere E-Mails sind ein Vollständigkeitsproblem, kein Validitätsproblem. Lassen Sie sie aus dieser Analyse heraus.
Case SensitiveAUSE-Mail-Adressen sind per Definition nicht case-sensitiv

Das Email-Muster ist ein eingebautes Preset. Sie müssen keinen Regex schreiben. Wählen Sie „Email” aus dem Musterauswahl-Menü, und der Regex wird automatisch angewendet.

Beispielergebnisse

MetrikWert
Validity Rate71 %
Valid Count35.500

Gesamtzahl ausgewerteter Contact-Datensätze: 50.000.

Ergebnisse interpretieren

Beginnen Sie mit der Schlagzeile: 71 % Validität. Das bedeutet, dass 29 % der Zweit-E-Mail-Adressen die Formatprüfung nicht bestehen. Von 50.000 Contacts mit befülltem Secondary_Email__c haben nur 35.500 eine strukturell gültige Adresse.

Wie 29 % ungültig in der Praxis aussehen: Dies sind Werte ohne „@“-Symbol (john.company.com), ohne Domain-Endung (john@company), mit doppelten Punkten (john@company..com) oder mit Leerzeichen (john @company.com). Weil es sich um ein Textfeld handelt, hat Salesforce sie alle bei der Eingabe akzeptiert. Jede an diese Adressen gesendete Kampagne landet als Bounce.

Die Kampagnenrechnung ändert sich. Marketing hatte die Re-Engagement-Reichweite auf Basis von 50.000 Zweitadressen prognostiziert. Die tatsächlich adressierbare Zielgruppe umfasst 35.500. Öffnungsraten, Klickraten und Konversionsprognosen müssen alle gegen die gültige Basis neu berechnet werden, nicht gegen die überhöhte Gesamtzahl.

Warum Format Validation hier ausreicht. Sie benötigen den Advanced-Modus für dieses Szenario nicht. Die Frage ist einfach: „Wie viele Zweit-E-Mails entsprechen einem gültigen Format?” Validity Rate und Valid Count beantworten diese Frage. Wenn Sie später ein Bereinigungsprojekt mit exakten Ungültig-Zahlen dimensionieren müssen, wechseln Sie zu Advanced Format Validation für die vollständige Aufschlüsselung.

Was als Nächstes zu tun ist

Verwenden Sie Valid Count (35.500) als reale adressierbare Zielgruppe für die Kampagnenplanung. Dimensionieren Sie ein Bereinigungsprojekt für die verbleibenden 14.500 Datensätze: Exportieren Sie sie, identifizieren Sie die häufigsten Formatfehler und beheben Sie sie durch Datenanreicherung oder manuelle Korrektur. Erwägen Sie das Hinzufügen einer Salesforce-Validierungsregel auf Secondary_Email__c, um das E-Mail-Format bei künftigen Einträgen zu erzwingen, oder wandeln Sie das Feld in den Email-Typ um, wenn Ihre Prozesse dies zulassen.


Szenario 2: Produktcode-Validierung mit fester Länge

Das Problem

Ihr Unternehmen verwendet 8-stellige Produktcodes in einem benutzerdefinierten Feld Product_Code__c auf dem Opportunity Product-Objekt. Diese Codes steuern Inventurabfragen, Preisregeln und ERP-Integration. Die ERP-Synchronisation schlägt jede Woche bei etwa 5 % der Datensätze fehl, und das Integrationsteam vermutet fehlerhafte Produktcodes. Sie müssen bestätigen, wie viele Codes die Formatprüfung nicht bestehen, und den exakten Bereinigungsumfang erhalten.

Konfiguration

Verwenden Sie den Modus Advanced Format Validation auf dem Opportunity Product-Objekt mit dem Zielfeld Product_Code__c. Sie benötigen die vollständige Gültig/Ungültig-Aufschlüsselung, damit das Integrationsteam exakte Datensatzanzahlen für sein Remediationsprojekt hat.

EinstellungWertWarum
AnalysemodusAdvanced Format ValidationSie benötigen Invalid Count zur Dimensionierung der Bereinigung, plus Noise Rate zur Prüfung auf Datenmüll
Pattern TypeFixed LengthProduktcodes sind immer exakt 8 Zeichen lang
Fixed Length8Ihre Standardcodelänge
Include BlanksEINEin leerer Produktcode ist ungültig für die ERP-Sync. Als Fehler zählen.
Case SensitiveAUSProduktcodes sind in Ihrem System nicht fallabhängig

Das Fixed-Length-Muster erzeugt automatisch den Regex ^.{8}$. Jeder Wert, der nicht exakt 8 Zeichen lang ist, besteht die Validierung nicht.

Beispielergebnisse

Grundmetriken:

MetrikWert
Validity Rate94,2 %
Valid Count9.420

Erweiterte Metriken:

MetrikWert
Invalid Rate5,8 %
Invalid Count580
Noise Rate0,4 %
Noisy Records Count40

Gesamtzahl ausgewerteter Datensätze: 10.000.

Ergebnisse interpretieren

5,8 % ungültig bestätigen die Schätzung des Integrationsteams. 580 Produktcodes von 10.000 entsprechen nicht dem 8-Zeichen-Format. Dies sind die Datensätze, die die ERP-Sync stören.

Invalid Count (580) ist der Bereinigungsumfang. Ihr Integrationsteam hat nun eine konkrete Zahl. Anstatt jede Sync-Fehlermeldung einzeln zu untersuchen, können sie die 580 Datensätze ziehen, Formatfehler kategorisieren und in Batches korrigieren. Häufige Probleme in Produktcode-Feldern umfassen abgeschnittene Codes (5–7 Zeichen aus Copy-Paste-Fehlern), Codes mit abschließenden Leerzeichen (9 Zeichen wegen eines unsichtbaren Leerzeichens) und Codes mit von Benutzern hinzugefügten Bindestrichen oder Präfixen („PC-12345678”).

Noise Rate (0,4 %) ist niedrig, aber erwähnenswert. 40 Datensätze enthalten Rauschmuster: wiederholte Zeichen („XXXXXXXX”), Tastatureingaben („asdfghjk”) oder Sonderzeichenfolgen. Diese 40 Datensätze sind keine Formatfehler. Es sind Datenmüll-Einträge, die zufällig genau 8 Zeichen lang sind. Validity Rate hat sie als gültig gezählt, weil sie die Längenprüfung bestehen, aber sie sind Müll, der aus einem anderen Grund bei der ERP-Abfrage fehlschlagen wird. Noise Rate erfasst, was die Formatprüfung übersieht.

Include Blanks EIN ist hier entscheidend. Mit aktiviertem Include Blanks zählt jeder Datensatz, bei dem Product_Code__c leer ist, als ungültig. Hätten Sie diese Einstellung aus gelassen, wären diese leeren Datensätze vollständig von der Auswertung ausgeschlossen worden, und Ihr Invalid Count wäre niedriger als die tatsächliche Anzahl der ERP-Sync-Fehler. Da ein leerer Produktcode die Integration genauso bricht wie ein fehlerhafter, gibt Ihnen das Einbeziehen von Blanks den genauen Fehlerumfang.

Was als Nächstes zu tun ist

Exportieren Sie die 580 ungültigen Datensätze für das Integrationsteam. Kategorisieren Sie Fehler nach Typ: abgeschnittene Codes, zusätzliche Zeichen, abschließende Leerzeichen. Beheben Sie sie in Bulk mit einem Datenaktualisierungs-Job. Untersuchen Sie bei den 40 verrauschten Datensätzen die Quelle. Wenn sie aus einem bestimmten Import oder Benutzer stammen, beheben Sie die Ursache. Fügen Sie nach der Bereinigung eine Salesforce-Validierungsregel hinzu, die die 8-Zeichen-Länge auf Product_Code__c erzwingt, um neue fehlerhafte Einträge zu verhindern. Scannen Sie erneut, um Ihre neue Validity Rate zu überprüfen.


Szenario 3: Web-to-Lead Company Name - Rauscherkennung

Das Problem

Ihr Web-to-Lead-Formular verlangt das Feld Company. Das Lead-Volumen ist stark: 20.000 neue Leads pro Quartal. Aber das SDR-Team meldet, dass viele Leads unbrauchbare Firmennamen haben, Einträge wie „asdf”, „test”, „xxx” oder „na na na”. Diese Leads verschwenden SDR-Zeit und verunreinigen Ihre Segmentierung. Eine einfache Vollständigkeitsprüfung zeigt, dass 98 % der Leads einen Company-Wert haben. Sie vermuten, dass die 98 % irreführend sind, weil Datenmüll-Einträge technisch „befüllt” sind.

Konfiguration

Verwenden Sie den Modus Advanced Format Validation auf dem Lead-Objekt mit dem Zielfeld Company. Sie benötigen Noise Rate, um den Müll zu quantifizieren, der sich hinter einer gesunden Vollständigkeitszahl verbirgt.

Für das Formatmuster gibt es keine strikte Formatregel für Firmennamen. Firmennamen sind Freitext. Verwenden Sie eine minimale Textvalidierung, um zu prüfen, dass der Wert mindestens ein alphanumerisches Zeichen enthält.

EinstellungWertWarum
AnalysemodusAdvanced Format ValidationSie benötigen Noise Rate und Noisy Records Count, um Datenmüll zu quantifizieren
Pattern TypeCustomKein eingebautes Muster passt zu Freitext-Firmennamen
Custom Pattern^.*[a-zA-Z0-9].*$Matcht jeden Wert, der mindestens einen Buchstaben oder eine Ziffer enthält. Erfasst Werte, die nur aus Sonderzeichen bestehen.
Include BlanksEINLeere Firmennamen sind ebenfalls ein Problem. In die Fehlerzahl einbeziehen.
Case SensitiveAUSFür dieses Muster nicht relevant, aber als Standard auf AUS lassen

Der eigentliche Wert dieses Scans liegt in den Rauschmetriken, nicht in der Formatvalidierung. Das benutzerdefinierte Muster ist absichtlich locker, weil Sie kein bestimmtes Firmennamen-Format erzwingen. Sie führen den Scan im Advanced-Modus aus, um Zugriff auf Noise Rate und Noisy Records Count zu erhalten.

Beispielergebnisse

Grundmetriken:

MetrikWert
Validity Rate97,5 %
Valid Count19.500

Erweiterte Metriken:

MetrikWert
Invalid Rate2,5 %
Invalid Count500
Noise Rate12 %
Noisy Records Count2.400

Gesamtzahl ausgewerteter Lead-Datensätze: 20.000.

Ergebnisse interpretieren

97,5 % Validität sind erwartet und nicht der Punkt. Fast jeder Wert besteht die lockere Formatprüfung, weil das Muster nur ein alphanumerisches Zeichen verlangt. Die 500 ungültigen Datensätze sind Einträge mit nur Sonderzeichen oder Whitespace, Werte wie „---”, „…” oder „!!!”. Diese sind einfach zu identifizieren und zu löschen.

Noise Rate (12 %) ist der eigentliche Befund. 2.400 Leads haben Firmennamen, die Rauschmuster enthalten. Dies sind Einträge mit wiederholten Zeichen („aaaa”, „xxxxx”), aufeinanderfolgenden Sonderzeichen („!@#$%”) oder Steuerzeichen. Sie bestehen die Formatprüfung, weil sie alphanumerische Zeichen enthalten, aber die Werte sind Datenmüll.

Das wahre Datenqualitätsbild:

KategorieDatensätzeWas es bedeutet
Sauber und gültig17.100Echte Firmennamen, bereit für SDR-Outreach
Ungültig (reiner Müll)500Gar kein alphanumerischer Inhalt. Löschen oder in Quarantäne.
Verrauscht (versteckter Müll)2.400Sieht befüllt aus, enthält aber Datenmüll. Manuelle Prüfung oder automatisches Flag.

Ihr SDR-Team hat recht: Das Lead-Qualitätsproblem ist real. 2.900 von 20.000 Leads (14,5 %) haben unbrauchbare Firmendaten. Das sind 14,5 % SDR-Zeit, die auf Leads verschwendet wird, die nie richtig geroutet, angereichert oder segmentiert werden können.

Die Lücke zwischen Vollständigkeit und Validität. Vollständigkeit sagt, dass 98 % der Leads einen Company-Wert haben. Validität sagt, dass 97,5 % die Formatprüfung bestehen. Noise Rate sagt, dass 12 % der bestehenden Werte Datenmüll sind. Jede Dimension offenbart eine andere Schicht des Problems. Vollständigkeit allein übersieht den Müll, den Noise Rate erfasst.

Was als Nächstes zu tun ist

Bauen Sie eine Bereinigungs-Queue für die 2.900 kombinierten ungültigen und verrauschten Datensätze. Für die 500 rein ungültigen Datensätze: automatisches Löschen oder Quarantäne. Für die 2.400 verrauschten Datensätze entscheiden: Leads ohne andere nützliche Daten automatisch löschen oder für manuelle Prüfung kennzeichnen, wenn Telefon- oder E-Mail-Daten noch nutzbar sind.

Beheben Sie die Quelle. Der Müll kommt von Ihrem Webformular. Fügen Sie clientseitige Validierung hinzu: eine Mindestzeichenlänge, blockieren Sie Muster mit wiederholten Zeichen und erwägen Sie CAPTCHA zur Bot-Prävention. Führen Sie nach Implementierung der Formularänderungen den Scan nächstes Quartal erneut durch und vergleichen Sie Noise Rate mit dieser Baseline.


Ihre Konfiguration wählen

Nutzen Sie diese Tabelle, um den richtigen Ausgangspunkt für Ihre Validitätsanalyse zu wählen.

Wenn Sie … müssenBeginnen Sie mitWichtige Einstellungen
E-Mail-Format auf benutzerdefinierten Textfeldern prüfenFormat ValidationPattern Type: Email, Include Blanks: AUS
Codes mit fester Länge validieren (Produktcodes, SKUs, Postleitzahlen)Advanced Format ValidationPattern Type: Fixed Length, Zeichenanzahl festlegen, Include Blanks: EIN
URL-Format auf Website-Feldern validierenFormat ValidationPattern Type: URL, Include Blanks: AUS
Ein benutzerdefiniertes Business-Format (Regex) erzwingenAdvanced Format ValidationPattern Type: Custom, Regex-Muster eingeben
Datenmüll und Rauschen in Freitextfeldern erkennenAdvanced Format ValidationLockeres Formatmuster verwenden, auf Noise Rate und Noisy Records Count fokussieren
Ein Datenbereinigungsprojekt für eine Integration dimensionierenAdvanced Format ValidationInclude Blanks: EIN, Invalid Count und Noisy Records Count für die Projektdimensionierung nutzen

Für eine vollständige Referenz aller 6 Validitätsmetriken, Mustertypen und Details zur Rauscherkennung kehren Sie zum Hauptartikel Validität zurück.

Bereit, Ihre eigene Datenqualität zu messen? Nehmen Sie am AI Readiness Assessment teil, um Ihre Validitätswerte und mehr zu sehen.