Was diese Szenarien abdecken
Diese Seite führt durch drei praxisnahe Konfigurationen der DQS-Validitätsanalyse. Jedes Szenario behandelt ein konkretes geschäftliches Problem, zeigt die exakten Einstellungen und erklärt, wie die Ergebnisse zu lesen sind.
Diese Anleitungen bauen auf den Konzepten aus dem Hauptartikel Validität auf. Lesen Sie diesen zuerst, falls Validitätsmetriken, der diagnostische Ablauf oder Musterkonfiguration neu für Sie sind.
Szenario 1: Validierung einer Zweit-E-Mail in einem benutzerdefinierten Textfeld
Das Problem
Ihre Organisation speichert eine zweite E-Mail-Adresse in einem benutzerdefinierten Textfeld Secondary_Email__c auf dem Contact-Objekt. Anders als das Standard-Salesforce-Email-Feld hat ein Textfeld keine eingebaute Formatvalidierung. Benutzer fügen ein, tippen und importieren alles hinein. Marketing möchte diese Zweitadressen für eine Re-Engagement-Kampagne verwenden, aber niemand weiß, wie viele strukturell gültig sind. Sie benötigen eine konkrete Zahl, damit Marketing realistische Kampagnenprognosen setzen kann und Ihr Ops-Team den Bereinigungsaufwand dimensionieren kann.
Warum nicht das Standard-Email-Feld? Der native Email-Feldtyp von Salesforce validiert das Format bei der Eingabe. Werte in einem Standard-Email-Feld bestehen bereits grundlegende Formatprüfungen. Die DQS-E-Mail-Validierung ist nützlich auf benutzerdefinierten Textfeldern, die E-Mail-Adressen ohne die integrierte Salesforce-Durchsetzung speichern.
Konfiguration
Verwenden Sie den Modus Format Validation auf dem Contact-Objekt mit dem Zielfeld Secondary_Email__c. Sie benötigen die Headline-Validitätsrate und eine Anzahl nutzbarer Datensätze. Platzhaltererkennung und Rauschanalyse sind hier nicht relevant, da E-Mail-Adressen entweder dem Format entsprechen oder nicht.
| Einstellung | Wert | Warum |
|---|---|---|
| Analysemodus | Format Validation | Sie benötigen die Match-Rate und gültige Anzahl, keine vollständige Ungültig-Aufschlüsselung |
| Pattern Type | Eingebautes Muster: ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$ | |
| Include Blanks | AUS | Leere E-Mails sind ein Vollständigkeitsproblem, kein Validitätsproblem. Lassen Sie sie aus dieser Analyse heraus. |
| Case Sensitive | AUS | E-Mail-Adressen sind per Definition nicht case-sensitiv |
Das Email-Muster ist ein eingebautes Preset. Sie müssen keinen Regex schreiben. Wählen Sie „Email” aus dem Musterauswahl-Menü, und der Regex wird automatisch angewendet.
Beispielergebnisse
| Metrik | Wert |
|---|---|
| Validity Rate | 71 % |
| Valid Count | 35.500 |
Gesamtzahl ausgewerteter Contact-Datensätze: 50.000.
Ergebnisse interpretieren
Beginnen Sie mit der Schlagzeile: 71 % Validität. Das bedeutet, dass 29 % der Zweit-E-Mail-Adressen die Formatprüfung nicht bestehen. Von 50.000 Contacts mit befülltem Secondary_Email__c haben nur 35.500 eine strukturell gültige Adresse.
Wie 29 % ungültig in der Praxis aussehen: Dies sind Werte ohne „@“-Symbol (john.company.com), ohne Domain-Endung (john@company), mit doppelten Punkten (john@company..com) oder mit Leerzeichen (john @company.com). Weil es sich um ein Textfeld handelt, hat Salesforce sie alle bei der Eingabe akzeptiert. Jede an diese Adressen gesendete Kampagne landet als Bounce.
Die Kampagnenrechnung ändert sich. Marketing hatte die Re-Engagement-Reichweite auf Basis von 50.000 Zweitadressen prognostiziert. Die tatsächlich adressierbare Zielgruppe umfasst 35.500. Öffnungsraten, Klickraten und Konversionsprognosen müssen alle gegen die gültige Basis neu berechnet werden, nicht gegen die überhöhte Gesamtzahl.
Warum Format Validation hier ausreicht. Sie benötigen den Advanced-Modus für dieses Szenario nicht. Die Frage ist einfach: „Wie viele Zweit-E-Mails entsprechen einem gültigen Format?” Validity Rate und Valid Count beantworten diese Frage. Wenn Sie später ein Bereinigungsprojekt mit exakten Ungültig-Zahlen dimensionieren müssen, wechseln Sie zu Advanced Format Validation für die vollständige Aufschlüsselung.
Was als Nächstes zu tun ist
Verwenden Sie Valid Count (35.500) als reale adressierbare Zielgruppe für die Kampagnenplanung. Dimensionieren Sie ein Bereinigungsprojekt für die verbleibenden 14.500 Datensätze: Exportieren Sie sie, identifizieren Sie die häufigsten Formatfehler und beheben Sie sie durch Datenanreicherung oder manuelle Korrektur. Erwägen Sie das Hinzufügen einer Salesforce-Validierungsregel auf Secondary_Email__c, um das E-Mail-Format bei künftigen Einträgen zu erzwingen, oder wandeln Sie das Feld in den Email-Typ um, wenn Ihre Prozesse dies zulassen.
Szenario 2: Produktcode-Validierung mit fester Länge
Das Problem
Ihr Unternehmen verwendet 8-stellige Produktcodes in einem benutzerdefinierten Feld Product_Code__c auf dem Opportunity Product-Objekt. Diese Codes steuern Inventurabfragen, Preisregeln und ERP-Integration. Die ERP-Synchronisation schlägt jede Woche bei etwa 5 % der Datensätze fehl, und das Integrationsteam vermutet fehlerhafte Produktcodes. Sie müssen bestätigen, wie viele Codes die Formatprüfung nicht bestehen, und den exakten Bereinigungsumfang erhalten.
Konfiguration
Verwenden Sie den Modus Advanced Format Validation auf dem Opportunity Product-Objekt mit dem Zielfeld Product_Code__c. Sie benötigen die vollständige Gültig/Ungültig-Aufschlüsselung, damit das Integrationsteam exakte Datensatzanzahlen für sein Remediationsprojekt hat.
| Einstellung | Wert | Warum |
|---|---|---|
| Analysemodus | Advanced Format Validation | Sie benötigen Invalid Count zur Dimensionierung der Bereinigung, plus Noise Rate zur Prüfung auf Datenmüll |
| Pattern Type | Fixed Length | Produktcodes sind immer exakt 8 Zeichen lang |
| Fixed Length | 8 | Ihre Standardcodelänge |
| Include Blanks | EIN | Ein leerer Produktcode ist ungültig für die ERP-Sync. Als Fehler zählen. |
| Case Sensitive | AUS | Produktcodes sind in Ihrem System nicht fallabhängig |
Das Fixed-Length-Muster erzeugt automatisch den Regex ^.{8}$. Jeder Wert, der nicht exakt 8 Zeichen lang ist, besteht die Validierung nicht.
Beispielergebnisse
Grundmetriken:
| Metrik | Wert |
|---|---|
| Validity Rate | 94,2 % |
| Valid Count | 9.420 |
Erweiterte Metriken:
| Metrik | Wert |
|---|---|
| Invalid Rate | 5,8 % |
| Invalid Count | 580 |
| Noise Rate | 0,4 % |
| Noisy Records Count | 40 |
Gesamtzahl ausgewerteter Datensätze: 10.000.
Ergebnisse interpretieren
5,8 % ungültig bestätigen die Schätzung des Integrationsteams. 580 Produktcodes von 10.000 entsprechen nicht dem 8-Zeichen-Format. Dies sind die Datensätze, die die ERP-Sync stören.
Invalid Count (580) ist der Bereinigungsumfang. Ihr Integrationsteam hat nun eine konkrete Zahl. Anstatt jede Sync-Fehlermeldung einzeln zu untersuchen, können sie die 580 Datensätze ziehen, Formatfehler kategorisieren und in Batches korrigieren. Häufige Probleme in Produktcode-Feldern umfassen abgeschnittene Codes (5–7 Zeichen aus Copy-Paste-Fehlern), Codes mit abschließenden Leerzeichen (9 Zeichen wegen eines unsichtbaren Leerzeichens) und Codes mit von Benutzern hinzugefügten Bindestrichen oder Präfixen („PC-12345678”).
Noise Rate (0,4 %) ist niedrig, aber erwähnenswert. 40 Datensätze enthalten Rauschmuster: wiederholte Zeichen („XXXXXXXX”), Tastatureingaben („asdfghjk”) oder Sonderzeichenfolgen. Diese 40 Datensätze sind keine Formatfehler. Es sind Datenmüll-Einträge, die zufällig genau 8 Zeichen lang sind. Validity Rate hat sie als gültig gezählt, weil sie die Längenprüfung bestehen, aber sie sind Müll, der aus einem anderen Grund bei der ERP-Abfrage fehlschlagen wird. Noise Rate erfasst, was die Formatprüfung übersieht.
Include Blanks EIN ist hier entscheidend. Mit aktiviertem Include Blanks zählt jeder Datensatz, bei dem Product_Code__c leer ist, als ungültig. Hätten Sie diese Einstellung aus gelassen, wären diese leeren Datensätze vollständig von der Auswertung ausgeschlossen worden, und Ihr Invalid Count wäre niedriger als die tatsächliche Anzahl der ERP-Sync-Fehler. Da ein leerer Produktcode die Integration genauso bricht wie ein fehlerhafter, gibt Ihnen das Einbeziehen von Blanks den genauen Fehlerumfang.
Was als Nächstes zu tun ist
Exportieren Sie die 580 ungültigen Datensätze für das Integrationsteam. Kategorisieren Sie Fehler nach Typ: abgeschnittene Codes, zusätzliche Zeichen, abschließende Leerzeichen. Beheben Sie sie in Bulk mit einem Datenaktualisierungs-Job. Untersuchen Sie bei den 40 verrauschten Datensätzen die Quelle. Wenn sie aus einem bestimmten Import oder Benutzer stammen, beheben Sie die Ursache. Fügen Sie nach der Bereinigung eine Salesforce-Validierungsregel hinzu, die die 8-Zeichen-Länge auf Product_Code__c erzwingt, um neue fehlerhafte Einträge zu verhindern. Scannen Sie erneut, um Ihre neue Validity Rate zu überprüfen.
Szenario 3: Web-to-Lead Company Name - Rauscherkennung
Das Problem
Ihr Web-to-Lead-Formular verlangt das Feld Company. Das Lead-Volumen ist stark: 20.000 neue Leads pro Quartal. Aber das SDR-Team meldet, dass viele Leads unbrauchbare Firmennamen haben, Einträge wie „asdf”, „test”, „xxx” oder „na na na”. Diese Leads verschwenden SDR-Zeit und verunreinigen Ihre Segmentierung. Eine einfache Vollständigkeitsprüfung zeigt, dass 98 % der Leads einen Company-Wert haben. Sie vermuten, dass die 98 % irreführend sind, weil Datenmüll-Einträge technisch „befüllt” sind.
Konfiguration
Verwenden Sie den Modus Advanced Format Validation auf dem Lead-Objekt mit dem Zielfeld Company. Sie benötigen Noise Rate, um den Müll zu quantifizieren, der sich hinter einer gesunden Vollständigkeitszahl verbirgt.
Für das Formatmuster gibt es keine strikte Formatregel für Firmennamen. Firmennamen sind Freitext. Verwenden Sie eine minimale Textvalidierung, um zu prüfen, dass der Wert mindestens ein alphanumerisches Zeichen enthält.
| Einstellung | Wert | Warum |
|---|---|---|
| Analysemodus | Advanced Format Validation | Sie benötigen Noise Rate und Noisy Records Count, um Datenmüll zu quantifizieren |
| Pattern Type | Custom | Kein eingebautes Muster passt zu Freitext-Firmennamen |
| Custom Pattern | ^.*[a-zA-Z0-9].*$ | Matcht jeden Wert, der mindestens einen Buchstaben oder eine Ziffer enthält. Erfasst Werte, die nur aus Sonderzeichen bestehen. |
| Include Blanks | EIN | Leere Firmennamen sind ebenfalls ein Problem. In die Fehlerzahl einbeziehen. |
| Case Sensitive | AUS | Für dieses Muster nicht relevant, aber als Standard auf AUS lassen |
Der eigentliche Wert dieses Scans liegt in den Rauschmetriken, nicht in der Formatvalidierung. Das benutzerdefinierte Muster ist absichtlich locker, weil Sie kein bestimmtes Firmennamen-Format erzwingen. Sie führen den Scan im Advanced-Modus aus, um Zugriff auf Noise Rate und Noisy Records Count zu erhalten.
Beispielergebnisse
Grundmetriken:
| Metrik | Wert |
|---|---|
| Validity Rate | 97,5 % |
| Valid Count | 19.500 |
Erweiterte Metriken:
| Metrik | Wert |
|---|---|
| Invalid Rate | 2,5 % |
| Invalid Count | 500 |
| Noise Rate | 12 % |
| Noisy Records Count | 2.400 |
Gesamtzahl ausgewerteter Lead-Datensätze: 20.000.
Ergebnisse interpretieren
97,5 % Validität sind erwartet und nicht der Punkt. Fast jeder Wert besteht die lockere Formatprüfung, weil das Muster nur ein alphanumerisches Zeichen verlangt. Die 500 ungültigen Datensätze sind Einträge mit nur Sonderzeichen oder Whitespace, Werte wie „---”, „…” oder „!!!”. Diese sind einfach zu identifizieren und zu löschen.
Noise Rate (12 %) ist der eigentliche Befund. 2.400 Leads haben Firmennamen, die Rauschmuster enthalten. Dies sind Einträge mit wiederholten Zeichen („aaaa”, „xxxxx”), aufeinanderfolgenden Sonderzeichen („!@#$%”) oder Steuerzeichen. Sie bestehen die Formatprüfung, weil sie alphanumerische Zeichen enthalten, aber die Werte sind Datenmüll.
Das wahre Datenqualitätsbild:
| Kategorie | Datensätze | Was es bedeutet |
|---|---|---|
| Sauber und gültig | 17.100 | Echte Firmennamen, bereit für SDR-Outreach |
| Ungültig (reiner Müll) | 500 | Gar kein alphanumerischer Inhalt. Löschen oder in Quarantäne. |
| Verrauscht (versteckter Müll) | 2.400 | Sieht befüllt aus, enthält aber Datenmüll. Manuelle Prüfung oder automatisches Flag. |
Ihr SDR-Team hat recht: Das Lead-Qualitätsproblem ist real. 2.900 von 20.000 Leads (14,5 %) haben unbrauchbare Firmendaten. Das sind 14,5 % SDR-Zeit, die auf Leads verschwendet wird, die nie richtig geroutet, angereichert oder segmentiert werden können.
Die Lücke zwischen Vollständigkeit und Validität. Vollständigkeit sagt, dass 98 % der Leads einen Company-Wert haben. Validität sagt, dass 97,5 % die Formatprüfung bestehen. Noise Rate sagt, dass 12 % der bestehenden Werte Datenmüll sind. Jede Dimension offenbart eine andere Schicht des Problems. Vollständigkeit allein übersieht den Müll, den Noise Rate erfasst.
Was als Nächstes zu tun ist
Bauen Sie eine Bereinigungs-Queue für die 2.900 kombinierten ungültigen und verrauschten Datensätze. Für die 500 rein ungültigen Datensätze: automatisches Löschen oder Quarantäne. Für die 2.400 verrauschten Datensätze entscheiden: Leads ohne andere nützliche Daten automatisch löschen oder für manuelle Prüfung kennzeichnen, wenn Telefon- oder E-Mail-Daten noch nutzbar sind.
Beheben Sie die Quelle. Der Müll kommt von Ihrem Webformular. Fügen Sie clientseitige Validierung hinzu: eine Mindestzeichenlänge, blockieren Sie Muster mit wiederholten Zeichen und erwägen Sie CAPTCHA zur Bot-Prävention. Führen Sie nach Implementierung der Formularänderungen den Scan nächstes Quartal erneut durch und vergleichen Sie Noise Rate mit dieser Baseline.
Ihre Konfiguration wählen
Nutzen Sie diese Tabelle, um den richtigen Ausgangspunkt für Ihre Validitätsanalyse zu wählen.
| Wenn Sie … müssen | Beginnen Sie mit | Wichtige Einstellungen |
|---|---|---|
| E-Mail-Format auf benutzerdefinierten Textfeldern prüfen | Format Validation | Pattern Type: Email, Include Blanks: AUS |
| Codes mit fester Länge validieren (Produktcodes, SKUs, Postleitzahlen) | Advanced Format Validation | Pattern Type: Fixed Length, Zeichenanzahl festlegen, Include Blanks: EIN |
| URL-Format auf Website-Feldern validieren | Format Validation | Pattern Type: URL, Include Blanks: AUS |
| Ein benutzerdefiniertes Business-Format (Regex) erzwingen | Advanced Format Validation | Pattern Type: Custom, Regex-Muster eingeben |
| Datenmüll und Rauschen in Freitextfeldern erkennen | Advanced Format Validation | Lockeres Formatmuster verwenden, auf Noise Rate und Noisy Records Count fokussieren |
| Ein Datenbereinigungsprojekt für eine Integration dimensionieren | Advanced Format Validation | Include Blanks: EIN, Invalid Count und Noisy Records Count für die Projektdimensionierung nutzen |
Für eine vollständige Referenz aller 6 Validitätsmetriken, Mustertypen und Details zur Rauscherkennung kehren Sie zum Hauptartikel Validität zurück.
Bereit, Ihre eigene Datenqualität zu messen? Nehmen Sie am AI Readiness Assessment teil, um Ihre Validitätswerte und mehr zu sehen.