Wat is volledigheid?
Volledigheid meet of uw data er daadwerkelijk is. Een veld is volledig wanneer het betekenisvolle data bevat. Een veld is onvolledig wanneer het null, leeg of gevuld is met een plaatshouder zoals „N/A” of „TBD”.
Volledigheid is de meest fundamentele datakwaliteitsdimensie. Zonder data heeft u niets om te valideren, te dedupliceren of te analyseren.
Volledigheidspercentage = (Records met data / Totale records) x 100
Als 850 van de 1.000 Contact-records een e-mailwaarde hebben, is uw e-mailvolledigheidspercentage 85%. Deze statistiek (soms vulpercentage genoemd) is het hoofdgetal voor elk veld.
Waarom volledigheid belangrijk is
Rapportage
Onvolledige data vertekent uw analyses. Wanneer 40% van de Account-records geen Industry-waarde heeft, toont elk rapport gegroepeerd op Industry slechts een gedeeltelijke werkelijkheid. Dashboards worden onbetrouwbaar. Leiderschapsbeslissingen rusten op een fractie van het beeld.
Automatisering
Salesforce-automatisering is afhankelijk van veldwaarden. Een workflow die e-mails verzendt, mislukt wanneer Email leeg is. Een proces dat Account Owner bijwerkt, mislukt wanneer de opzoekrelatie null is. Elke ontbrekende waarde is een potentiële automatiseringsmislukking.
AI en Agentforce
AI-modellen leren van uw data. Wanneer velden leeg zijn, heeft het model niets om van te leren. Agentforce gebruikt uw Salesforce-data om reacties te genereren en actie te ondernemen. Ontbrekende data betekent onvolledige context en minder nuttige AI-uitkomsten.
| Systeem | Impact van volledigheid |
|---|---|
| Rapporten | Gedeeltelijke data produceert vertekende statistieken |
| Workflows | Ontbrekende waarden veroorzaken procesfalen |
| Duplicate Rules | Onvolledige records zijn moeilijker te matchen |
| Agentforce | Hiaten in context verminderen AI-nauwkeurigheid |
Hoe DQS volledigheid meet
DQS produceert 10 volledigheidsstatistieken georganiseerd rondom een diagnostische vraag: „Waar ontbreekt de data, waarom, en is de data die er is eigenlijk nuttig?”
Denk aan deze statistieken als een diagnostische trechter. Elke stap bouwt voort op de vorige.
Stap 1: Hoe volledig is het?
Volledigheidspercentage is de hoofdstatistiek. Het berekent het percentage records waarbij het veld een niet-lege, niet-null waarde bevat. Dit is het getal dat u op een dashboard zet.
U voert een scan uit op het Account-object. Het veld Industry toont een volledigheidspercentage van 62%. Dat betekent dat 38% van uw Accounts geen Industry-waarde heeft, wat betekent dat uw segmentatierapporten, territoriaalregels en marketingcampagnes die filteren op Industry allemaal werken met onvolledige data.
Elke andere volledigheidsstatistiek bestaat om te verklaren waarom dit getal niet 100% is.
Stap 2: Wat is de omvang?
Percentages vertellen u de ernst. Aantallen vertellen u de werklast. Gevuld-aantal beantwoordt de omvangvraag: hoeveel records hebben daadwerkelijk een waarde. Gebruik dit voor dekkingsrapportage en om het hiaat af te zetten tegen uw totale recordaantal — het verschil tussen uw totaal en het Gevuld-aantal is de opschoon-achterstand.
Voorbeeld: Uw dataverzorger moet een opschoonactie opzetten. Met 50.000 Contacts en een Gevuld-aantal van 35.800 op Phone weet zij dat 14.200 records verrijking nodig hebben, kan de kosten schatten bij een dataleverancier en een realistische tijdlijn opstellen.
Stap 3: Waarom is het onvolledig?
Drie statistieken breken de oorzaak van onvolledigheid op. Elke statistiek wijst naar een ander onderliggend probleem.
Null-aantal en null-percentage meten records waarbij het veld een echte database-null heeft, wat betekent dat het veld nooit is gevuld. In Salesforce zijn null en lege tekenreeks verschillende toestanden. Een veld dat nooit is aangeraakt is null. Een veld dat opzettelijk is gewist is een lege tekenreeks. Dit onderscheid vertelt u of data nooit is vastgelegd of bewust verwijderd.
Voorbeeld: Na een datamigratie toont het veld Fax op Accounts een Null-percentage van 45%. De faxdata is nooit gemigreerd vanuit het legacy-systeem (null = heeft nooit bestaan) in plaats van te zijn vastgelegd en later gewist. Een hoog Null-percentage wijst u naar het bronsysteem, niet naar gebruikersgedrag.
Plaatshouder-aantal en plaatshouder-percentage meten records die bekende plaatshouderwaarden bevatten zoals „N/A”, „TBD”, „Unknown” of aangepaste waarden die u definieert. Deze waarden zien eruit als data maar dragen geen echte informatie.
Voorbeeld: Uw globale Account-data toont een volledigheidspercentage van 94% op Industry. Op papier ziet het er geweldig uit. Maar Plaatshouder-percentage onthult dat 18% van die „gevulde” waarden eigenlijk „N/A”, „Other” of „Unknown” zijn. De echte volledigheid is dichter bij 76%. Dit is de statistiek die een groen dashboard rood maakt.
Stap 4: Is de „complete” data nuttig?
De eerste drie stappen identificeren wat ontbreekt. Stap 4 stelt een moeilijkere vraag: is de data die er wel is eigenlijk de moeite waard?
Onvolledig-aantal is de breedste maatstaf voor ontbrekende data. Het combineert alle vormen van onvolledigheid: nullen, lege waarden en plaatshouderwaarden. Wanneer plaatshouderdetectie actief is, is Onvolledig-aantal altijd groter dan of gelijk aan het Null-aantal alleen, omdat het ook waarden bestaande uit alleen witruimte en plaatshoudervermeldingen omvat.
Voorbeeld: Het veld Description op Opportunities toont een Null-aantal van 500 maar een Onvolledig-aantal van 1.800. Het verschil? 1.300 records hebben beschrijvingen zoals „TBD”, „N/A” of „---”. Die records zijn technisch gezien gevuld maar praktisch nutteloos. Zonder deze statistiek zou u denken dat u slechts 500 records hoeft te herstellen in plaats van 1.800.
Rijke-tekstratio meet het percentage records in tekstvelden die substantiële inhoud bevatten boven een tekenlimiet. Het scheidt velden met betekenisvolle proza van velden met een paar woorden. Een Description-veld is „gevuld” of het nu „Goede klant” bevat of een drieparagrafen accountplan. Voor AI-gereedheid is de diepte van inhoud net zo belangrijk als de aanwezigheid ervan.
Voorbeeld: Uw bedrijf evalueert een AI-tool die Case-beschrijvingen samenvat. U scant het veld Description op Cases: 88% volledigheidspercentage, maar slechts 31% rijke-tekstratio. Slechts 31% van de casebeschrijvingen heeft voldoende inhoud voor de AI om mee te werken. De rest zijn vermeldingen zoals „bel terug”, „zie e-mail” of „probleem gemeld”. Het AI-project heeft een data-verrijkingsfase nodig voordat het waarde kan leveren.
Tekstveldgebruik meet hoeveel van de beschikbare tekencapaciteit van een tekstveld wordt gebruikt. Een Long Text Area met 32.000 tekencapaciteit waarbij de gemiddelde invoer 45 tekens is, heeft een zeer laag gebruik.
Gemiddeld gebruik geeft u het gemiddelde percentage van veldlengte dat wordt gebruikt over alle records. Samen met Tekstveldgebruik geeft het een volledig beeld van of uw tekstvelden de juiste grootte hebben.
Voorbeeld: Tijdens een org-beoordeling onthult Tekstveldgebruik dat Notes__c (een Long Text Area, 131.072 tekens) gemiddeld 3,2% gebruik heeft, met de meeste vermeldingen onder de 200 tekens. Ondertussen toont Short_Description__c (Text, 255 tekens) 94% gebruik met frequente afkapproblemen. Het schema heeft de juiste grootte nodig: de Long Text Area is overdreven, en het Text-veld is te klein.
Opmerking: Tekstveldgebruik en Gemiddeld gebruik zijn alleen van toepassing op String- en TextArea-velden, omdat dit de veldtypen zijn met een gedefinieerde tekencapaciteit om tegen te meten.
Waarom percentages en aantallen in paren komen
De meeste statistieken komen als een percentage en een aantal (absoluut getal). Dit is opzettelijk:
- Percentages zijn voor dashboards, executieve rapportage en trendregistratie. „Volledigheid verbeterd van 72% naar 89% dit kwartaal.”
- Aantallen zijn voor projectplanning, werklastschatting en opschoontoewijzing. „We hebben 14.200 records te herstellen.”
Gebruik percentages om voortgang te communiceren. Gebruik aantallen om werk te plannen.
Statistiekenreferentie
Basisstatistieken
Deze 5 statistieken vormen de basis van elke volledigheidsanalyse. Ze werken op vrijwel alle veldtypen.
| Statistiek | Type | Van toepassing op |
|---|---|---|
| Volledigheidspercentage | Percentage | Alle veldtypen |
| Gevuld-aantal | Aantal | Alle veldtypen |
| Onvolledig-aantal | Aantal | Alle veldtypen |
| Null-percentage | Percentage | Alle veldtypen |
| Null-aantal | Aantal | Alle veldtypen |
Contextuele statistieken
Deze 5 statistieken gaan verder dan „is het er?” om te vragen „is het betekenisvol?” Ze vereisen de Contextuele Volledigheid-analysemodus.
| Statistiek | Type | Van toepassing op |
|---|---|---|
| Plaatshouder-percentage | Percentage | Alleen tekstvelden |
| Plaatshouder-aantal | Aantal | Alleen tekstvelden |
| Rijke-tekstratio | Percentage | Alleen tekstvelden |
| Tekstveldgebruik | Percentage | Alleen String en TextArea |
| Gemiddeld gebruik | Percentage | Alleen String en TextArea |
Veldtype-dekking
DQS ondersteunt volledigheidscontroles op alle standaard Salesforce-veldtypen:
| Dekkingsgroep | Veldtypen | Beschikbare statistieken |
|---|---|---|
| Alle typen (20) | String, TextArea, LongTextArea, Html, EncryptedText, Picklist, Multipicklist, Email, Phone, URL, Reference (Lookup), Date, DateTime, Double, Integer, Currency, Percent, Boolean, Combobox, Id | Volledigheidspercentage, Gevuld/Onvolledig-aantal, Null-percentage/aantal |
| Tekstvelden (8) | Text, TextArea, LongTextArea, Html, EncryptedText, Email, Phone, URL | Bovenstaande + Plaatshouder-percentage/aantal, Rijke-tekstratio |
| String en TextArea (2) | String, TextArea | Bovenstaande + Tekstveldgebruik, Gemiddeld gebruik |
Twee analysemodi
DQS biedt twee volledigheidsanalysemodi:
Basis Volledigheid beantwoordt de vraag: „Zijn velden gevuld?” Het produceert de 5 basisstatistieken en dekt de essentials die elke organisatie nodig heeft voor een data-hygiënecontrole of snelle audit.
Contextuele Volledigheid gaat dieper. Het produceert alle 10 statistieken, inclusief plaatshouderdetectie, rijke-tekstanalyse en veldgebruik. Gebruik deze modus wanneer u onderscheid wilt maken tussen data die aanwezig is en data die nuttig is.
| Zakelijke behoefte | Aanbevolen modus |
|---|---|
| Snelle hygiënecontrole of basislijnaudit | Basis Volledigheid |
| Datamigratie-beoordeling | Contextueel (plaatshouderdetectie vangt nep-data uit legacy-systemen) |
| AI-gereedheidsevaluatie | Contextueel (Rijke-tekstratio en gebruiksstatistieken beoordelen inhoudsdiepte) |
| Voortdurende data-governance | Begin met Basis, ga naar Contextueel wanneer klaar voor diepere analyse |
Volledigheid configureren
DQS biedt vier configuratie-invoeren voor volledigheid. Elke kan worden ingesteld op globaal niveau (van toepassing op alle velden) en worden overschreven op individueel veldniveau.
| Instelling | Wat het beheert |
|---|---|
| Leeg als onvolledig | Wanneer ingeschakeld, behandelt DQS lege tekenreeksen en waarden bestaande uit alleen witruimte als onvolledig. Standaard: ingeschakeld. |
| Plaatshouders als onvolledig | Wanneer ingeschakeld, behandelt DQS plaatshouderwaarden (zoals „N/A” of „TBD”) als onvolledig. Standaard: uitgeschakeld. |
| Plaatshouderwaarden | De lijst met tekenreeksen die DQS als plaatshouders behandelt. U definieert deze op basis van de gegevensinvoerpatronen van uw organisatie (bijv. N/A, TBD, Unknown, --, 000-000-0000). |
| Hoofdlettergevoelige plaatshouders | Bepaalt of plaatshouderherkenning hoofdlettergevoelig is. Wanneer ingeschakeld, worden „tbd” en „TBD” als verschillende waarden behandeld. Standaard: hoofdlettergevoelig. |
Tip: Begin met de veelgebruikte plaatshouders („N/A”, „TBD”, „Unknown”, „—”) en voeg organisatie-specifieke waarden toe naarmate u ze ontdekt in scanresultaten.
Veelvoorkomende volledigheids-problemen
Optionele velden nooit gevuld
Wanneer velden optioneel zijn, slaan gebruikers ze over. Na verloop van tijd hebben waardevolle velden zoals Bedrijfsbeschrijving of LinkedIn-URL bijna nul volledigheidspercentages.
Oplossing: Maak kritieke velden verplicht of maak prompts tijdens het bewerken van records.
Bulkimport met hiaten
Datamigraties en lijstimports missen vaak waarden voor bepaalde velden. Een gekochte contactlijst heeft geen Account-associatie. Een legacy-systeemexport mist gestandaardiseerde Industry-waarden.
Oplossing: Controleer imports vóór het laden. Gebruik DQS om basislijnen vast te stellen en verbetering te volgen na elke import.
Plaatshoudermisbruik
Gebruikers voeren „N/A” of „TBD” in om validatieregels te omzeilen. Het veld lijkt volledig maar bevat geen bruikbare data. Standaardrapporten tellen deze als gevuld.
Oplossing: Schakel plaatshouderdetectie in en definieer uw lijst met plaatshouderwaarden. Controleer en actualiseer plaatshouderwaarden tijdens regelmatig dataonderhoud.
Witruimte-opvulling
Sommige integraties of handmatige invoer laat velden achter met alleen witruimte. Salesforce telt deze als „gevuld” maar ze bevatten niets nuttigs.
Oplossing: Schakel blanco-detectie in om waarden bestaande uit alleen witruimte op te vangen.
Best practices
Prioriteer op zakelijke impact
Niet elk veld heeft hoge volledigheid nodig. Richt u op velden die automatisering aansturen, in executieve dashboards voorkomen, AI en Agentforce voeden of compliancevereisten ondersteunen.
Volg trends in de loop van de tijd
Een enkele volledigheids-score is een momentopname. Volg scores over meerdere scans heen om degradatie vroeg te detecteren, verbeteringsinitiatieven te meten en problematische databronnen te identificeren.
Los oorzaken op
Lage volledigheid signaleert een processprobleem. Onderzoek of gebruikers velden overslaan, imports data missen of integraties stil mislukken. Los de bron op, niet alleen het symptoom.
Gebruik de diagnostische trechter
Stop niet bij Volledigheidspercentage. Doorloop de trechter: controleer de omvang (Gevuld-aantal), identificeer de oorzaak (Null vs. Plaatshouder), evalueer vervolgens de inhoudskwaliteit (Rijke-tekstratio, Gebruik). Elke stap onthult een ander type probleem met een andere oplossing.
Volgende stappen
U begrijpt nu hoe u volledigheid kunt meten en verbeteren. Ga verder met het leren over de volgende dimensie:
- Volgende: Geldigheid - Zorg dat uw data voldoet aan verwachte indelingen
- Gerelateerd: De vijf dimensies - Overzicht van alle dimensies
- Actie: AI-gereedheidsbeoordeling - Zie uw huidige volledigheids-scores