Completeness | DQS Resources

Completeness क्या है?

Completeness मापती है कि आपका डेटा वास्तव में मौजूद है या नहीं। एक फ़ील्ड तब Complete होती है जब उसमें सार्थक डेटा हो। एक फ़ील्ड Incomplete होती है जब वह null, blank, या “N/A” या “TBD” जैसे placeholder से भरी हो।

Completeness सबसे मौलिक डेटा गुणवत्ता आयाम है। डेटा के बिना, आपके पास validate, deduplicate, या analyze करने के लिए कुछ नहीं है।

Completeness Rate = (डेटा वाले रिकॉर्ड / कुल रिकॉर्ड) x 100

यदि 1,000 Contact रिकॉर्ड में से 850 में Email मान है, तो आपकी Email Completeness rate 85% है। यह मेट्रिक (कभी-कभी fill rate कहा जाता है) किसी भी फ़ील्ड के लिए मुख्य संख्या है।

Completeness क्यों महत्वपूर्ण है

रिपोर्टिंग

अपूर्ण डेटा आपके विश्लेषण को तिरछा करता है। जब 40% Account रिकॉर्ड में Industry मान नहीं है, तो Industry द्वारा समूहीकृत कोई भी रिपोर्ट केवल आंशिक सच दिखाती है। डैशबोर्ड अविश्वसनीय बन जाते हैं। कार्यकारी निर्णय तस्वीर के एक अंश पर आधारित होते हैं।

स्वचालन

Salesforce स्वचालन फ़ील्ड मानों पर निर्भर करता है। एक Workflow जो ईमेल भेजती है, जब Email खाली हो तो विफल होती है। एक प्रक्रिया जो Account Owner अपडेट करती है, जब Lookup null हो तो विफल होती है। प्रत्येक गायब मान एक संभावित स्वचालन विफलता है।

AI और Agentforce

AI मॉडल आपके डेटा से सीखते हैं। जब फ़ील्ड खाली होते हैं, तो मॉडल के पास सीखने के लिए कुछ नहीं होता। Agentforce प्रतिक्रियाएँ उत्पन्न करने और कार्रवाई करने के लिए आपके Salesforce डेटा का उपयोग करता है। गायब डेटा का अर्थ है अपूर्ण संदर्भ और कम उपयोगी AI आउटपुट।

System	Completeness प्रभाव
Reports	आंशिक डेटा तिरछी मेट्रिक्स उत्पन्न करता है
Workflows	गायब मान प्रक्रिया विफलताओं का कारण बनते हैं
Duplicate Rules	अपूर्ण रिकॉर्ड मिलान करना कठिन है
Agentforce	संदर्भ में अंतराल AI सटीकता कम करते हैं

DQS Completeness कैसे मापता है

DQS एक diagnostic प्रश्न के चारों ओर व्यवस्थित 10 Completeness मेट्रिक्स उत्पन्न करता है: “डेटा कहाँ गायब है, क्यों, और जो डेटा मौजूद है वह वास्तव में उपयोगी है?”

इन मेट्रिक्स को एक diagnostic funnel के रूप में सोचें। प्रत्येक कदम पिछले पर बनता है।

चरण 1: यह कितना Complete है?

Completeness Rate मुख्य मेट्रिक है। यह उन रिकॉर्ड का प्रतिशत गणना करता है जहाँ फ़ील्ड में एक गैर-खाली, गैर-null मान हो। यह वह संख्या है जो आप डैशबोर्ड पर रखते हैं।

आप Account ऑब्जेक्ट पर स्कैन चलाते हैं। Industry फ़ील्ड 62% Completeness Rate दिखाती है। इसका मतलब है कि आपके 38% Account में कोई Industry मान नहीं है, जिसका अर्थ है कि आपकी segmentation रिपोर्ट, territory rules, और Industry द्वारा फ़िल्टर करने वाले marketing अभियान सभी अपूर्ण डेटा के साथ काम करते हैं।

हर दूसरा Completeness मेट्रिक यह समझाने के लिए मौजूद है कि यह संख्या 100% क्यों नहीं है।

चरण 2: पैमाना क्या है?

Rate गंभीरता बताती है। Count कार्यभार बताता है। Populated Count पैमाने का प्रश्न उत्तर देता है: कितने रिकॉर्ड में वास्तव में मान है। इसका उपयोग कवरेज रिपोर्टिंग के लिए और आपकी कुल रिकॉर्ड संख्या के सापेक्ष gap का आकार मापने के लिए करें — आपके total और Populated Count के बीच का अंतर ही सफाई का बैकलॉग है।

उदाहरण: आपके डेटा स्टीवर्ड को सफाई अभियान बनाने की जरूरत है। 50,000 Contact और Phone पर 35,800 के Populated Count के साथ, वह जानती है कि 14,200 रिकॉर्ड को enrichment की जरूरत है, डेटा विक्रेता के साथ लागत का अनुमान लगा सकती है, और एक यथार्थवादी समयरेखा निर्धारित कर सकती है।

चरण 3: यह Incomplete क्यों है?

तीन मेट्रिक्स अपूर्णता के कारण को विभाजित करते हैं। प्रत्येक एक अलग मूल समस्या की ओर इशारा करता है।

Null Count और Null Rate उन रिकॉर्ड को मापते हैं जहाँ फ़ील्ड में एक सच्चा database null है, मतलब फ़ील्ड कभी populate नहीं हुई। Salesforce में, null और empty string अलग-अलग अवस्थाएँ हैं। एक फ़ील्ड जिसे कभी touch नहीं किया गया वह null है। एक फ़ील्ड जिसे जानबूझकर साफ किया गया वह एक खाली string है। यह अंतर बताता है कि डेटा कभी capture नहीं हुआ या जानबूझकर हटाया गया।

उदाहरण: डेटा migration के बाद, Account पर Fax फ़ील्ड 45% Null Rate दिखाती है। Fax डेटा legacy system से कभी migrate नहीं हुआ (null = कभी था ही नहीं) बजाय capture होकर बाद में clear किए जाने के। उच्च Null Rate आपको source system की ओर इशारा करती है, उपयोगकर्ता व्यवहार की ओर नहीं।

Placeholder Count और Placeholder Rate “N/A”, “TBD”, “Unknown”, या आपके द्वारा परिभाषित कस्टम मानों जैसे known placeholder मान वाले रिकॉर्ड मापते हैं। ये मान डेटा जैसे दिखते हैं लेकिन कोई वास्तविक जानकारी नहीं रखते।

उदाहरण: आपका global Account डेटा Industry पर 94% Completeness Rate दिखाता है। कागज पर बढ़िया लगता है। लेकिन Placeholder Rate प्रकट करता है कि उन “populated” मानों का 18% वास्तव में “N/A”, “Other”, या “Unknown” है। वास्तविक Completeness 76% के करीब है। यह वह मेट्रिक है जो एक हरे डैशबोर्ड को लाल कर देता है।

चरण 4: क्या “Complete” डेटा उपयोगी है?

पहले तीन चरण पहचानते हैं कि क्या गायब है। चरण 4 एक कठिन सवाल पूछता है: क्या डेटा जो है वह वास्तव में रखने लायक है?

Incompleted Count गायब डेटा का सबसे व्यापक माप है। यह सभी प्रकार की अपूर्णता को जोड़ता है: null, blank, और placeholder मान। जब placeholder detection सक्रिय हो, Incompleted Count हमेशा अकेले Null Count से अधिक या बराबर होता है, क्योंकि यह whitespace-only और placeholder प्रविष्टियों को भी पकड़ता है।

Rich Text Ratio उन text फ़ील्ड रिकॉर्ड का प्रतिशत मापता है जिनमें एक character threshold से ऊपर पर्याप्त सामग्री है। यह अर्थपूर्ण prose वाले फ़ील्ड को कुछ शब्दों वाले फ़ील्ड से अलग करता है। AI तत्परता के लिए, सामग्री की गहराई उसकी उपस्थिति जितनी ही महत्वपूर्ण है।

Text Field Utilization मापता है कि text फ़ील्ड की उपलब्ध character क्षमता का कितना उपयोग किया जाता है। 32,000 character क्षमता वाला Long Text Area जहाँ औसत प्रविष्टि 45 characters है, उसमें बहुत कम utilization है।

Average Utilization सभी रिकॉर्ड में उपयोग किए गए फ़ील्ड की लंबाई का माध्य प्रतिशत देता है। Text Field Utilization के साथ, यह एक पूरी तस्वीर देता है कि क्या आपके text फ़ील्ड सही आकार के हैं।

Rate और Count जोड़े में क्यों आते हैं

अधिकांश मेट्रिक्स rate (प्रतिशत) और count (absolute संख्या) के रूप में आते हैं। यह जानबूझकर है:

Rate डैशबोर्ड, कार्यकारी रिपोर्टिंग, और रुझान ट्रैकिंग के लिए हैं। “इस तिमाही Completeness 72% से 89% तक सुधरी।”
Count परियोजना योजना, कार्यभार अनुमान, और सफाई दायरे के लिए हैं। “हमारे पास ठीक करने के लिए 14,200 रिकॉर्ड हैं।”

प्रगति संप्रेषित करने के लिए Rate का उपयोग करें। काम की योजना बनाने के लिए Count का उपयोग करें।

मेट्रिक संदर्भ

Foundation Metrics

ये 5 मेट्रिक्स प्रत्येक Completeness विश्लेषण का आधार बनाते हैं। वे लगभग सभी फ़ील्ड प्रकारों पर काम करते हैं।

मेट्रिक	प्रकार	किन पर लागू
Completeness Rate	प्रतिशत	सभी फ़ील्ड प्रकार
Populated Count	Count	सभी फ़ील्ड प्रकार
Incompleted Count	Count	सभी फ़ील्ड प्रकार
Null Rate	प्रतिशत	सभी फ़ील्ड प्रकार
Null Count	Count	सभी फ़ील्ड प्रकार

Contextual Metrics

ये 5 मेट्रिक्स “क्या यह वहाँ है?” से परे जाकर पूछते हैं “क्या यह अर्थपूर्ण है?” इन्हें Contextual Completeness analysis mode की आवश्यकता होती है।

मेट्रिक	प्रकार	किन पर लागू
Placeholder Rate	प्रतिशत	केवल Text फ़ील्ड
Placeholder Count	Count	केवल Text फ़ील्ड
Rich Text Ratio	प्रतिशत	केवल Text फ़ील्ड
Text Field Utilization	प्रतिशत	केवल String और TextArea
Average Utilization	प्रतिशत	केवल String और TextArea

Field Type कवरेज

DQS सभी मानक Salesforce फ़ील्ड प्रकारों पर Completeness जाँच का समर्थन करता है।

कवरेज समूह	फ़ील्ड प्रकार	उपलब्ध मेट्रिक्स
सभी प्रकार (20)	String, TextArea, LongTextArea, Html, EncryptedText, Picklist, Multipicklist, Email, Phone, URL, Reference (Lookup), Date, DateTime, Double, Integer, Currency, Percent, Boolean, Combobox, Id	Completeness Rate, Populated/Incompleted Count, Null Rate/Count
Text फ़ील्ड (8)	Text, TextArea, LongTextArea, Html, EncryptedText, Email, Phone, URL	उपरोक्त + Placeholder Rate/Count, Rich Text Ratio
String और TextArea (2)	String, TextArea	उपरोक्त + Text Field Utilization, Average Utilization

दो Analysis Modes

DQS दो Completeness analysis modes प्रदान करता है:

Basic Completeness प्रश्न का उत्तर देता है: “क्या फ़ील्ड भरे हुए हैं?” यह 5 foundation metrics उत्पन्न करता है और उन essentials को कवर करता है जो हर org को data hygiene check या quick audit के लिए चाहिए।

Contextual Completeness गहरा जाता है। यह सभी 10 मेट्रिक्स उत्पन्न करता है, जिसमें placeholder detection, rich text analysis, और field utilization शामिल हैं। इस mode का उपयोग तब करें जब आपको present डेटा और useful डेटा के बीच अंतर करने की आवश्यकता हो।

व्यावसायिक आवश्यकता	अनुशंसित Mode
Quick hygiene check या baseline audit	Basic Completeness
Data migration assessment	Contextual (placeholder detection legacy systems से fake data पकड़ता है)
AI readiness evaluation	Contextual (Rich Text Ratio और utilization metrics content depth का आकलन करते हैं)
Ongoing data governance	Basic से शुरू करें, गहरे विश्लेषण के लिए Contextual में जाएँ

Completeness कॉन्फ़िगर करना

DQS Completeness के लिए चार configuration inputs प्रदान करता है। प्रत्येक को global स्तर पर सेट किया जा सकता है और individual फ़ील्ड स्तर पर override किया जा सकता है।

Setting	यह क्या नियंत्रित करता है
Blank As Incomplete	सक्षम होने पर, DQS खाली string और केवल whitespace मानों को incomplete मानता है। डिफ़ॉल्ट: सक्षम।
Placeholders As Incomplete	सक्षम होने पर, DQS placeholder मानों (जैसे “N/A” या “TBD”) को incomplete मानता है। डिफ़ॉल्ट: अक्षम।
Placeholder Values	वह string सूची जिसे DQS placeholders के रूप में मानता है। आप इन्हें अपने org के डेटा प्रविष्टि पैटर्न के आधार पर परिभाषित करते हैं (जैसे, `N/A, TBD, Unknown, --, 000-000-0000`)।
Case-Sensitive Placeholders	नियंत्रित करता है कि placeholder matching case-sensitive है या नहीं। सक्षम होने पर, “tbd” और “TBD” को अलग-अलग मानों के रूप में माना जाता है। डिफ़ॉल्ट: case-sensitive।

सुझाव: सामान्य placeholders (“N/A”, “TBD”, “Unknown”, ”—”) से शुरू करें और स्कैन परिणामों में खोजने पर org-specific मान जोड़ें।

सामान्य Completeness समस्याएँ

वैकल्पिक फ़ील्ड कभी नहीं भरे

जब फ़ील्ड वैकल्पिक होते हैं, उपयोगकर्ता उन्हें छोड़ देते हैं। समय के साथ, Company Description या LinkedIn URL जैसे मूल्यवान फ़ील्ड में near-zero Completeness rate होती है।

Fix: महत्वपूर्ण फ़ील्ड को required बनाएँ, या record editing के दौरान prompts बनाएँ।

Bulk Imports में अंतराल

डेटा migrations और list imports में अक्सर कुछ फ़ील्ड के मान नहीं होते। एक खरीदी गई contact list में कोई Account association नहीं है। एक legacy system export में मानकीकृत Industry मान नहीं हैं।

Fix: लोड करने से पहले imports का audit करें। आधार रेखाएँ स्थापित करने और प्रत्येक import के बाद सुधार track करने के लिए DQS का उपयोग करें।

Placeholder का दुरुपयोग

उपयोगकर्ता Validation Rule पास करने के लिए “N/A” या “TBD” दर्ज करते हैं। फ़ील्ड complete दिखती है लेकिन कोई usable data नहीं है। मानक रिपोर्ट इन्हें populated गिनती हैं।

Fix: Placeholder detection सक्षम करें और अपनी placeholder values list परिभाषित करें। नियमित डेटा रखरखाव के दौरान placeholder values की समीक्षा और अपडेट करें।

Whitespace Padding

कुछ integrations या manual entry फ़ील्ड में केवल whitespace छोड़ देते हैं। Salesforce इन्हें “भरा हुआ” गिनता है लेकिन इनमें कुछ उपयोगी नहीं है।

Fix: Whitespace-only मान पकड़ने के लिए blank detection सक्षम करें।

Best Practices

व्यावसायिक प्रभाव द्वारा प्राथमिकता दें

हर फ़ील्ड को उच्च Completeness की जरूरत नहीं है। उन फ़ील्ड पर ध्यान केंद्रित करें जो स्वचालन चलाते हैं, कार्यकारी डैशबोर्ड में दिखाई देते हैं, AI और Agentforce को feed करते हैं, या compliance आवश्यकताओं का समर्थन करते हैं।

समय के साथ रुझान Track करें

एक अकेला Completeness score एक snapshot है। कई scans में scores track करें ताकि जल्दी गिरावट detect कर सकें, सुधार पहलों को माप सकें, और समस्या डेटा स्रोतों की पहचान कर सकें।

मूल कारणों को संबोधित करें

कम Completeness एक process समस्या का संकेत है। जाँच करें कि क्या उपयोगकर्ता फ़ील्ड छोड़ रहे हैं, imports में डेटा गायब है, या integrations चुपचाप विफल हो रहे हैं। लक्षण नहीं, स्रोत ठीक करें।

Diagnostic Funnel का उपयोग करें

Completeness Rate पर न रुकें। Funnel से गुजरें: पैमाना जाँचें (Populated Count), कारण पहचानें (Null बनाम Placeholder), फिर content quality evaluate करें (Rich Text Ratio, Utilization)। प्रत्येक चरण एक अलग प्रकार की समस्या प्रकट करता है जिसका अलग fix है।

अगले कदम

अब आप Completeness को मापना और सुधारना समझते हैं। अगले आयाम के बारे में सीखना जारी रखें:

अगला: Validity - सुनिश्चित करें कि आपका डेटा अपेक्षित प्रारूपों के अनुरूप है
संबंधित: पाँच आयाम - सभी आयामों का अवलोकन
कार्रवाई: AI Readiness Assessment - अपने वर्तमान Completeness scores देखें