Vad dessa scenarier täcker
Den här sidan går igenom tre verkliga konfigurationer av DQS giltighetsanalys. Varje scenario täcker ett specifikt affärsproblem, visar exakta inställningar att använda och förklarar hur man läser resultaten.
Dessa genomgångar bygger på koncepten från den huvudsakliga artikeln Giltighet. Läs den först om du är ny för giltighetsmätvärden, det diagnostiska flödet eller mönsterkonfiguration.
Scenario 1: Sekundär e-postvalidering på ett anpassat textfält
Problemet
Din organisation lagrar en sekundär e-postadress i ett anpassat fält Secondary_Email__c av texttyp på Contact-objektet. Till skillnad från Salesforces standardfält för e-post har ett textfält ingen inbyggd formatvalidering. Användare klistrar in, skriver och importerar vad som helst i det. Marknadsföringen vill använda dessa sekundära adresser för en återengagemangskampanj, men ingen vet hur många som är strukturellt giltiga. Du behöver ett konkret tal så att marknadsföringen kan sätta realistiska kampanjprojektioner och ditt operationsteam kan avgränsa rensningen.
Varför inte standardfältet Email? Salesforces inbyggda fälttyp Email validerar format vid inmatning. Värden i ett standarde-postfält klarar redan grundläggande formatkontroller. DQS e-postvalidering är användbar på anpassade Textfält som lagrar e-postadresser utan Salesforces inbyggda tillämpning.
Konfiguration
Använd läget Formatvalidering på Contact-objektet, och rikta dig mot fältet Secondary_Email__c. Du behöver rubrikgiltighetsgraden och ett antal användbara poster. Platshållaridentifiering och brusanalys är inte relevanta här eftersom e-postadresser antingen matchar formatet eller inte.
| Inställning | Värde | Varför |
|---|---|---|
| Analysläge | Formatvalidering | Du behöver träffgraden och det giltiga antalet, inte den fullständiga ogiltiga uppdelningen |
| Mönstertyp | E-post | Inbyggt mönster: ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$ |
| Inkludera tomma | AV | Tomma e-poster är ett fullständighetsproblem, inte ett giltighetsproblem. Håll dem utanför den här analysen. |
| Skiftlägeskänslig | AV | E-postadresser är per definition skiftlägeskänsliga |
E-postmönstret är en inbyggd förinställning. Du behöver inte skriva någon regex. Välj “E-post” från mönsterväljaren och regex tillämpas automatiskt.
Exempelresultat
| Mätvärde | Värde |
|---|---|
| Giltighetsgrad | 71 % |
| Giltigt antal | 35 500 |
Totalt antal Contact-poster utvärderade: 50 000.
Läsa resultaten
Börja med rubriken: 71 % giltighet. Det innebär att 29 % av de sekundära e-postadresserna misslyckas med formatkontollen. Av 50 000 Contacts med ett ifyllt Secondary_Email__c har bara 35 500 en strukturellt giltig adress.
Vad 29 % ogiltigt ser ut som i praktiken: Det här är värden som saknar ”@“-tecknet (john.company.com), saknar ett domäntillägg (john@company), innehåller dubbla punkter (john@company..com) eller inkluderar mellanslag (john @company.com). Eftersom det här är ett textfält godkände Salesforce alla vid inmatning. Varje kampanj som skickas till dessa adresser studsar.
Kampanjmatten förändras. Marknadsföringen har projicerat räckvidden för återengagemang baserat på 50 000 sekundära adresser. Den verkliga adresserbara publiken är 35 500. Öppningsfrekvenser, klickfrekvenser och konverteringsprojektioner behöver alla räknas om mot den giltiga basen, inte den uppblåsta totalen.
Varför Formatvalidering räcker här. Du behöver inte Avancerat läge för det här scenariot. Frågan är enkel: “Hur många sekundära e-poster matchar ett giltigt format?” Giltighetsgrad och Giltigt antal svarar på den frågan. Om du senare behöver avgränsa ett rensningsprojekt med exakta ogiltiga antal, byt till Avancerad formatvalidering för den fullständiga uppdelningen.
Vad du gör härnäst
Använd Giltigt antal (35 500) som den verkliga adresserbara publiken för kampanjplanering. Avgränsa ett rensningsprojekt för de återstående 14 500 posterna: exportera dem, identifiera de vanligaste formaterrorna och åtgärda dem genom databerikning eller manuell korrigering. Överväg att lägga till en Salesforce-valideringsregel på Secondary_Email__c för att tillämpa e-postformat på framtida poster, eller konvertera fältet till typen E-post om dina processer tillåter det.
Scenario 2: Produktkodsvalidering med fast längd
Problemet
Ditt företag använder 8-teckens produktkoder i ett anpassat fält Product_Code__c på Opportunity Product-objektet. Dessa koder driver lagersökningar, prisregler och ERP-integration. ERP-synkroniseringen har misslyckats på ungefär 5 % av posterna varje vecka, och integrationsteamet misstänker felformaterade produktkoder. Du behöver bekräfta hur många koder som misslyckas med formatkontollen och få den exakta rensningsomfattningen.
Konfiguration
Använd läget Avancerad formatvalidering på Opportunity Product-objektet, och rikta dig mot fältet Product_Code__c. Du behöver den fullständiga giltig/ogiltig uppdelningen så att integrationsteamet har exakta postantal för sitt saneringsprojekt.
| Inställning | Värde | Varför |
|---|---|---|
| Analysläge | Avancerad formatvalidering | Du behöver Ogiltigt antal för att avgränsa rensningen, plus Brusgrad för att kontrollera skräpposter |
| Mönstertyp | Fast längd | Produktkoder är alltid exakt 8 tecken |
| Fast längd | 8 | Din standardkodlängd |
| Inkludera tomma | PÅ | En tom produktkod är ogiltig för ERP-synk. Räkna den som ett misslyckande. |
| Skiftlägeskänslig | AV | Produktkoder är inte skiftlägeskänsliga i ditt system |
Mönstret Fast längd genererar automatiskt regex ^.{8}$. Alla värden som inte är exakt 8 tecken misslyckas med validering.
Exempelresultat
Grundläggande mätvärden:
| Mätvärde | Värde |
|---|---|
| Giltighetsgrad | 94,2 % |
| Giltigt antal | 9 420 |
Avancerade mätvärden:
| Mätvärde | Värde |
|---|---|
| Ogiltighetsgrad | 5,8 % |
| Ogiltigt antal | 580 |
| Brusgrad | 0,4 % |
| Antal brusposter | 40 |
Totalt antal poster utvärderade: 10 000.
Läsa resultaten
5,8 % ogiltigt bekräftar integrationsteamets uppskattning. 580 produktkoder av 10 000 matchar inte 8-teckensformatet. Det här är posterna som bryter ERP-synken.
Ogiltigt antal (580) är rensningsomfattningen. Ditt integrationsteam har nu ett konkret tal. Istället för att undersöka varje synkfel individuellt kan de plocka ut de 580 posterna, kategorisera formaterrorna och batch-åtgärda dem. Vanliga problem i produktkodsfält inkluderar trunkerade koder (5-7 tecken från kopiera-klistra-fel), koder med avslutande mellanslag (9 tecken på grund av ett osynligt mellanslag) och koder med bindestreck eller prefix tillagda av användare (“PC-12345678”).
Brusgrad (0,4 %) är låg men värd att notera. 40 poster innehåller brusmönster: upprepade tecken (“XXXXXXXX”), tangentbordsposter (“asdfghjk”) eller specialteckensträngar. Dessa 40 poster är inte formaterror. De är skräpinmatningar som råkar vara exakt 8 tecken långa. Giltighetsgraden räknade dem som giltiga eftersom de klarar längdkontrollen, men de är skräpdata som kommer att misslyckas med ERP-sökning av en annan anledning. Brusgraden fångar det som formatkontollen missar.
Inkludera tomma PÅ är viktigt här. Med Inkludera tomma aktiverat räknas varje post där Product_Code__c är tom som ogiltig. Om du hade lämnat den inställningen av, skulle dessa tomma poster exkluderas från utvärderingen helt och hållet, och ditt Ogiltiga antal skulle vara lägre än det verkliga antalet poster som misslyckas med ERP-synk. Eftersom en tom produktkod bryter integrationen på samma sätt som en felformaterad gör, ger inkludering av tomma dig den korrekta misslyckandesomfattningen.
Vad du gör härnäst
Exportera de 580 ogiltiga posterna för integrationsteamet. Kategorisera fel per typ: trunkerade koder, extra tecken, avslutande mellanslag. Åtgärda dem i bulk med ett datauppdateringsjobb. För de 40 brusposterna, undersök källan. Om de kom från en specifik import eller användare, åtgärda den rotorsaken. Efter rensning, lägg till en Salesforce-valideringsregel som tillämpar 8-teckenslängden på Product_Code__c för att förhindra nya felaktiga poster. Genomsök igen för att verifiera din nya Giltighetsgrad.
Scenario 3: Brusidentifiering i webbformulärets företagsnamn för Lead
Problemet
Ditt webbformulär för Lead kräver fältet Company. Lead-volymen är stark: 20 000 nya Leads per kvartal. Men SDR-teamet rapporterar att många Leads har skräpföretagsnamn, poster som “asdf”, “test”, “xxx” eller “na na na.” Dessa Leads slösar SDR-tid och förorenar din segmentering. En grundläggande fullständighetskontroll visar att 98 % av Leads har ett Company-värde. Du misstänker att 98 % är vilseledande eftersom skräpposter är tekniskt “ifyllda.”
Konfiguration
Använd läget Avancerad formatvalidering på Lead-objektet, och rikta dig mot fältet Company. Du behöver Brusgraden för att kvantifiera skräpet som döljer sig bakom en hälsosam fullständighetspoäng.
För formatmönstret finns ingen strikt formatregel för företagsnamn. Företagsnamn är fritext. Använd en minimal textvalidering för att kontrollera att värdet innehåller minst ett alfanumeriskt tecken.
| Inställning | Värde | Varför |
|---|---|---|
| Analysläge | Avancerad formatvalidering | Du behöver Brusgrad och Antal brusposter för att kvantifiera skräpposter |
| Mönstertyp | Anpassad | Inget inbyggt mönster passar fritextföretagsnamn |
| Anpassat mönster | ^.*[a-zA-Z0-9].*$ | Matchar alla värden som innehåller minst en bokstav eller siffra. Fångar värden som är rent specialtecken. |
| Inkludera tomma | PÅ | Tomma företagsnamn är också ett problem. Inkludera dem i misslyckandesantalet. |
| Skiftlägeskänslig | AV | Inte relevant för det här mönstret, men lämna av som standard |
Det verkliga värdet av den här genomsökningen finns i brusmätvärdena, inte formatvalideringen. Det anpassade mönstret är avsiktligt löst eftersom du inte tillämpar ett specifikt företagsnamsformat. Du kör genomsökningen i Avancerat läge för att få tillgång till Brusgrad och Antal brusposter.
Exempelresultat
Grundläggande mätvärden:
| Mätvärde | Värde |
|---|---|
| Giltighetsgrad | 97,5 % |
| Giltigt antal | 19 500 |
Avancerade mätvärden:
| Mätvärde | Värde |
|---|---|
| Ogiltighetsgrad | 2,5 % |
| Ogiltigt antal | 500 |
| Brusgrad | 12 % |
| Antal brusposter | 2 400 |
Totalt antal Lead-poster utvärderade: 20 000.
Läsa resultaten
97,5 % giltighet är förväntat och inte poängen. Nästan varje värde klarar den lösa formatkontollen eftersom mönstret bara kräver ett alfanumeriskt tecken. De 500 ogiltiga posterna är poster med bara specialtecken eller blanksteg, värden som ”---”, ”…” eller ”!!!”. Dessa är lätta att identifiera och ta bort.
Brusgrad (12 %) är det verkliga fyndet. 2 400 Leads har företagsnamn som innehåller brusmönster. Det här är poster med upprepade tecken (“aaaa”, “xxxxx”), konsekutiva specialtecken (”!@#$%”) eller kontrolltecken. De klarar formatkontollen eftersom de innehåller alfanumeriska tecken, men värdena är skräp.
Den sanna datakvalitetsbilden:
| Kategori | Poster | Vad det innebär |
|---|---|---|
| Rena och giltiga | 17 100 | Riktiga företagsnamn redo för SDR-outreach |
| Ogiltiga (rent skräp) | 500 | Inget alfanumeriskt innehåll alls. Ta bort eller karantänisera. |
| Brusiga (dolt skräp) | 2 400 | Ser ifyllt ut men innehåller skräp. Manuell granskning eller automatisk flaggning. |
Ditt SDR-team har rätt: Lead-kvalitetsproblemet är verkligt. 2 900 av 20 000 Leads (14,5 %) har oanvändbar Company-data. Det är 14,5 % av SDR-tid slösad på Leads som aldrig kan dirigeras, berikas eller segmenteras korrekt.
Gapet fullständighet kontra giltighet. Fullständighet säger att 98 % av Leads har ett Company-värde. Giltighet säger att 97,5 % klarar formatkontollen. Brusgrad säger att 12 % av dessa godkända värden är skräp. Varje dimension avslöjar ett annat lager av problemet. Fullständighet ensam missar skräpet som Brusgraden fångar.
Vad du gör härnäst
Bygg en rensningskö för de 2 900 kombinerade ogiltiga och brusiga posterna. För de 500 rent ogiltiga posterna, ta bort eller karantänisera dem automatiskt. För de 2 400 brusiga posterna, bestäm: ta bort Leads automatiskt utan annan användbar data, eller flagga dem för manuell granskning om telefon- eller e-postdata fortfarande är användbar.
Åtgärda källan. Skräpet kommer från ditt webbformulär. Lägg till klientsidevalidering: en minsta teckenlängd, blockera upprepade-tecken-mönster och överväg CAPTCHA för botskydd. Efter implementering av formulärförändringar, kör genomsökningen igen nästa kvartal och jämför Brusgraden mot den här baslinjen.
Välja din konfiguration
Använd den här tabellen för att välja rätt startpunkt för din giltighetsanalys.
| Om du behöver… | Börja med | Nyckelinställningar |
|---|---|---|
| Kontrollera e-postformat på anpassade textfält | Formatvalidering | Mönstertyp: E-post, Inkludera tomma: AV |
| Validera fast längd-koder (produktkoder, SKU:er, postnummer) | Avancerad formatvalidering | Mönstertyp: Fast längd, ange ditt teckenantal, Inkludera tomma: PÅ |
| Validera URL-format på webbplatsfält | Formatvalidering | Mönstertyp: URL, Inkludera tomma: AV |
| Tillämpa ett anpassat affärsformat (regex) | Avancerad formatvalidering | Mönstertyp: Anpassad, ange ditt regex-mönster |
| Identifiera skräp och brus i fritextfält | Avancerad formatvalidering | Använd ett löst formatmönster, fokusera på Brusgrad och Antal brusposter |
| Avgränsa ett datarensningsprojekt för en integration | Avancerad formatvalidering | Inkludera tomma: PÅ, använd Ogiltigt antal och Antal brusposter för projektberäkning |
För en fullständig referens av alla 6 giltighetsmätvärden, mönstertyper och brusidentifieringsdetaljer, återvänd till den huvudsakliga artikeln Giltighet.
Redo att mäta din egen datakvalitet? Ta AI-beredskapsbedömningen för att se dina giltighetspoäng och mer.