Förstå de fem dimensionerna
Datakvalitet mäts över fem nyckeldimensioner. Varje dimension svarar på en specifik fråga om dina data, och tillsammans avgör de om dina data är lämpliga för sitt syfte.
DQS mäter alla fem dimensioner nativt inom Salesforce.
| Dimension | Nyckelfråga | Exempelproblem |
|---|---|---|
| Fullständighet | Finns data? | Saknade e-postadresser |
| Giltighet | Är formatet korrekt? | Felformaterade telefonnummer |
| Unikhet | Är varje post distinkt? | Dubblerade contacts |
| Aktualitet | Är data aktuella? | Inaktuella opportunity-datum |
| Konsekvens | Är data enhetliga? | ”USA” kontra “United States” |
1. Fullständighet
Fullständighet mäter om obligatoriska datavärden finns och inte saknas.
Vad DQS mäter
- Fyllnadsgrad: Procentandel poster med icke-tomma värden
- Blank-identifiering: Tomma strängar och rena blankstegsvärden
- Platshållaridentifiering: Värden som “N/A”, “TBD” eller “Unknown”
Varför fullständighet är viktigt
Ofullständiga data bryter automatisering. När ett arbetsflöde kräver en e-postadress som inte finns misslyckas arbetsflödet. När en rapport filtrerar på bransch men hälften av posterna saknar branschvärden visar din analys bara en del av bilden.
Vanliga fullständighetsproblem
| Problem | Exempel | Påverkan |
|---|---|---|
| Tomma fält | Tomt Contact-telefonnummer | Kan inte ringa prospects |
| Platshållarvärden | ”TBD” i företagsnamn | Ogiltigt för rapportering |
| Endast blanksteg | ” ” i beskrivning | Verkar ifyllt men är det inte |
Tips: Börja med dina mest kritiska fält. Du behöver inte 100 % fullständighet på varje fält, bara på de som är viktiga för ditt användningsfall.
2. Giltighet
Giltighet mäter om datavärden överensstämmer med förväntade format och mönster.
Vad DQS mäter
- Formatvalidering: Mönster för e-post, telefon, URL
- Mönstermatchning: Anpassade regex-mönster
- Domänvalidering: Listor med tillåtna värden
Giltighet kontra noggrannhet
Giltighet och noggrannhet är olika saker. En e-postadress kan vara giltig (korrekt format) men felaktig (fel person). DQS mäter giltighet eftersom formatvalidering kan automatiseras. Noggrannhet kräver extern verifiering.
| Kontroll | Giltig? | Noggrann? |
|---|---|---|
| john@company.com | Ja | Okänt utan verifiering |
| john@company | Nej | Ej tillämpligt (formatet är fel) |
| john.smith@oldcompany.com | Ja | Nej (personen lämnade företaget) |
Vanliga giltighetsproblem i Salesforce
- E-postadresser saknar ”@” eller domän
- Telefonnummer med fel antal siffror
- Webbadresser utan protokoll (http/https)
- Fritext där picklistvärden förväntas
3. Unikhet
Unikhet mäter om datavärden är distinkta och inte dubblerade.
Vad DQS mäter
- Dubblettidentifiering: Exakta träffar över poster
- Distinkt antal: Totalt antal unika värden per fält
- Entropianalys: Värdediversitet och fördelning
Kostnaden för dubbletter
Dubblerade poster slösar lagringsutrymme, förvirrar användare och ger uppblåsta mätvärden. När Säljavdelningen har två poster för samma företag förlorar de sammanhang och riskerar genanta dubbla utskick.
Forskning visar:
- B2B-databaser innehåller i genomsnitt 10–30 % dubblerade poster
- Varje duplikat kostar organisationer i form av slösade e-postsändningar, förvirrad rapportering och fragmenterad kundhistorik
Förebyggande kontra identifiering av dubbletter
DQS fokuserar på identifiering, vilket hjälper dig att hitta dubbletter som redan finns. Förebyggande (att stoppa dubbletter vid skapandet) kräver valideringsregler och matchningsregler i Salesforce-inställningar.
4. Aktualitet
Aktualitet mäter om data är tillräckligt aktuella för sitt avsedda användande.
Vad DQS mäter
- Aktualitetsgrad: Procentandel poster inom acceptabel ålder
- Inaktuell identifiering: Poster som överskrider ditt tröskelvärde
- Genomsnittsålder: Medelvärde för datumfältsvärden
- Framtida datumidentifiering: Ogiltiga datum i framtiden
Ange aktualitetströsklar
Olika datatyper har olika aktualitetskrav:
| Datatyp | Typiskt tröskelvärde | Varför |
|---|---|---|
| Lead senaste aktivitet | 30 dagar | Kalla leads förlorar värde |
| Kontaktinformation | 90 dagar | Folk byter jobb |
| Opportunity stängningsdatum | Aktuellt kvartal | Prognosnoggrannhet |
| Account-årsomsättning | 1 år | Årliga uppdateringar förväntas |
Varför aktualitet är viktigt för AI
AI- och maskininlärningsmodeller lär sig från dina data. När dina data är inaktuella lär sig AI:n föråldrade mönster. Agentforce använder till exempel dina Salesforce-data för att informera svar. Föråldrad kontaktinformation leder till felaktiga rekommendationer.
5. Konsekvens
Konsekvens mäter om datavärden är enhetliga och standardiserade.
Vad DQS mäter
- Konformansgrad: Procentandel som matchar förväntade mönster
- Variantidentifiering: Olika representationer av samma värde
- Dominerandevärdesanalys: Vanligaste värdet per fält
Typer av inkonsekvent
| Typ | Exempel | Problem |
|---|---|---|
| Formatvariation | ”USA” kontra “United States” kontra “US” | Bryter filtrering och gruppering |
| Stavningsvariation | ”Acme Corp” kontra “ACME Corporation” | Skapar falska dubbletter |
| Skiftlägesvariation | ”new york” kontra “New York” | Ser oprofessionellt ut i rapporter |
Varför konsekvens är viktigt för AI
AI-modeller behandlar “USA” och “United States” som olika värden. Om dina poster använder båda kan AI:n inte gruppera dem korrekt. Inkonsekvent data fragmenterar AI:ns förståelse och producerar otillförlitliga resultat.
Uppnå konsekvens
- Använd picklistor istället för fritext där möjligt
- Standardisera på ett enda format för varje fält
- Importera från picklistvärden när du konfigurerar DQS-konsekvensonskontroller
Balansera dimensionerna
Inte varje dimension är lika viktig för varje användningsfall. Tänk på vad du behöver:
| Användningsfall | Prioriterade dimensioner |
|---|---|
| Marknadsföringskampanjer | Fullständighet, Giltighet (för leveransbarhet) |
| Försäljningsprognoser | Aktualitet, Fullständighet |
| Kundtjänst | Unikhet (en källa till sanning) |
| AI/Agentforce | Alla fem, plus AI-beredskapskontroller |
DQS-dimensionstäckning
DQS mäter alla fem dimensioner med omfattande funktioner:
| Dimension | Vad DQS mäter |
|---|---|
| Fullständighet | Fyllnadsgrad, null-identifiering, blank-identifiering, platshållaridentifiering, kontextuell logik |
| Giltighet | Formatvalidering, anpassade regex-mönster, identifiering av ogiltiga poster |
| Unikhet | Dubblettidentifiering, entropianalys, frekvensfördelning |
| Aktualitet | Aktualitetsgrad, inaktuell identifiering, genomsnittsålder, framtida datumidentifiering |
| Konsekvens | Konformanskontroll, variantidentifiering, dominerandevärdesanalys |
Nästa steg
Nu när du förstår de fem dimensionerna:
- Ta AI-beredskapsbedömningen för att se dina nuvarande poäng
- Läs om Agentforce-förberedelse för ytterligare kontroller bortom grundläggande datakvalitet
- Lär dig hur du använder Definition Builder för att konfigurera din första genomsökning