Skip to main content

Consistency

DQS द्वारा मापे जाने वाले सभी 6 Consistency मेट्रिक्स, value fragmentation खोजने के लिए diagnostic flow, और conformance analysis कैसे कॉन्फ़िगर करें।

Consistency क्या है?

Consistency मापती है कि आपके डेटा मान एक agreed-upon standard के अनुरूप हैं या नहीं। एक field तब consistent होती है जब प्रत्येक record एक ही concept के लिए समान term उपयोग करे। एक field inconsistent होती है जब variations मौजूद हों जिनका अर्थ एक ही है लेकिन अलग तरीके से व्यक्त किए गए हैं।

“USA”, “United States”, और “US” सभी एक ही देश को refer करते हैं। Salesforce के लिए, वे तीन distinct values हैं। Country द्वारा grouped एक report तीन rows produce करती है एक के बजाय। “USA” के लिए filter करने वाला automation “United States” वाले 230 records miss कर देता है।

Conformance Rate = (Conforming Records / कुल Records) x 100

यदि 1,000 Account records में से 850 में एक Country value है जो आपकी allowed values list से match करती है, तो आपकी Country conformance rate 85% है। शेष 15% में variations हैं जिन्हें standardization की जरूरत है।

Consistency क्यों महत्वपूर्ण है

रिपोर्टिंग

Inconsistent डेटा आपकी reports को खंडित करता है। जब आपके Country field में एक ही देश की पाँच अलग spelling हों, तो Country द्वारा grouped एक report पाँच rows दिखाती है एक के बजाय। Total सही है, लेकिन grouping गलत है।

स्वचालन

Salesforce स्वचालन exact value matches पर निर्भर करता है। Country = "USA" filter करने वाला Workflow “United States” और “US” वाले records miss करता है।

AI और Agentforce

AI models प्रत्येक variation को एक अलग concept मानते हैं। “USA” और “United States” model के view में दो अलग countries बन जाते हैं। Agentforce आपके field values का उपयोग करके responses generate करता है। Inconsistent values inconsistent AI outputs produce करती हैं।

SystemConsistency प्रभाव
Reportsखंडित groupings, misleading totals
WorkflowsFilters non-matching variations miss करते हैं
Duplicate RulesVariations correct matching prevent करती हैं
AgentforceInconsistent field values अविश्वसनीय AI responses produce करती हैं

DQS Consistency कैसे मापता है

DQS एक diagnostic प्रश्न के चारों ओर व्यवस्थित 6 Consistency मेट्रिक्स उत्पन्न करता है: “क्या आपके field values एक standard के अनुरूप हैं, और यदि नहीं, तो वे क्या कर रहे हैं?”

चरण 1: यह कितना Consistent है?

Conformance Rate मुख्य मेट्रिक है। यह उन records का प्रतिशत गणना करता है जहाँ field value आपके defined allowed values में से एक से match करती है।

चरण 2: पैमाना क्या है?

मेट्रिकयह क्या बताता है
Conformance Countकितने records आपकी allowed values से match करते हैं।
Non-Conforming Countकितने records आपकी allowed values के बाहर हैं। Cleanup projects के दायरे के लिए इसका उपयोग करें।

चरण 3: डेटा कितना Fragmented है?

Variant Count एक field में सभी records में found distinct values की संख्या मापता है। यह उत्तर देता है: “लोग इस डेटा को कितने अलग-अलग तरीकों से express कर रहे हैं?”

Fieldकुल RecordsVariant CountAssessment
Country1,0005Well-controlled, likely consistent
Country1,00047Highly fragmented, needs standardization
Industry50012Reasonable, probably picklist-constrained
Industry50089Free-text chaos, needs immediate attention

चरण 4: वास्तविक Values क्या हैं?

Dominant Values field में top N most frequent values लौटाता है, प्रत्येक value की frequency count के साथ। यह बताता है कि आपका डेटा वास्तव में कैसा दिखता है, न कि आप उससे क्या expect करते हैं।

RankValueCountप्रतिशत
1United States45045%
2USA23023%
3US18018%
4U.S.A.454.5%
5United States of America151.5%

उदाहरण: आपकी team debate कर रही है कि Country values को ISO codes (“US”) या full names (“United States”) पर standardize करना है। Dominant Values दिखाता है कि 45% records पहले से “United States” use करते हैं। उस value पर standardize करने के लिए 55% records बदलने होंगे। “US” पर standardize करने के लिए 82% बदलने होंगे। डेटा आपको सस्ता path बताता है।

मेट्रिक संदर्भ

Foundation Metrics

मेट्रिकप्रकारयह क्या मापता है
Conformance Rateप्रतिशतआपकी allowed values से match करने वाले records का हिस्सा
Conformance CountCountआपकी allowed values से match करने वाले records की संख्या

Advanced Metrics

मेट्रिकप्रकारयह क्या मापता है
Non-Conforming CountCountआपकी allowed list के बाहर values वाले records
Non-Conformance Rateप्रतिशतआपकी allowed list के बाहर records का हिस्सा
Variant CountCountfield में found कुल distinct values
Dominant ValuesListfrequency counts के साथ top N most frequent values

Field Type कवरेज

Field TypeConsistency Focus
String (Text)Abbreviations, spelling, casing
TextAreaFree-text standardization
PicklistExpected options के विरुद्ध actual values validate करना
EmailDomain standardization, format consistency
PhoneFormat standardization (area codes, separators)
URLProtocol और path consistency

दो Analysis Modes

Conformance Check प्रश्न का उत्तर देता है: “क्या field values मेरी allowed list से match करती हैं?” यह 2 foundation metrics उत्पन्न करता है।

Advanced Conformance Analysis गहरा जाता है। यह सभी 6 metrics उत्पन्न करता है, जिसमें non-conforming counts, variant detection, और dominant value distribution शामिल हैं।

व्यावसायिक आवश्यकताअनुशंसित Mode
Quick conformance audit या baseline checkConformance Check
Data migration cleanupAdvanced (variant count imported chaos प्रकट करता है)
AI readiness evaluationAdvanced (dominant values दिखाता है कि AI क्या सीखेगा)
Ongoing data governanceConformance Check से शुरू करें, गहरे विश्लेषण के लिए Advanced में जाएँ

Consistency कॉन्फ़िगर करना

DQS Consistency के लिए चार configuration inputs प्रदान करता है।

Settingयह क्या नियंत्रित करता है
Expected Valuesवह values list जिसे DQS “conforming” मानता है। Required: स्कैन चलाने से पहले कम से कम एक value define करनी होगी।
Case Sensitiveनियंत्रित करता है कि value matching letter casing consider करती है। अक्षम होने पर (डिफ़ॉल्ट), “Premium”, “PREMIUM”, और “premium” सभी allowed value “Premium” से match करते हैं।
Top NDominant Values output में return करने के लिए कितनी dominant values (1 से 100)। डिफ़ॉल्ट: 5।
Min FrequencyDominant Values output में include होने के लिए minimum बार एक value appear होनी चाहिए (1 से 1,000)। डिफ़ॉल्ट: 1।

सुझाव: आपकी allowed values list define करने से पहले यह देखने के लिए Import from Field का उपयोग करें कि वास्तव में आपके डेटा में क्या values मौजूद हैं।

Import from Field: Discovery-First Configuration

कैसे काम करता है:

  1. Expected Values configuration खोलें।
  2. Import from Field पर click करें। DQS live data query करता है और distinct values को frequency द्वारा sorted करके return करता है।
  3. Checklist review करें। प्रत्येक value दिखाता है कि कितने records में वह है।
  4. उन values को check करें जिन्हें आप correct मानते हैं। Incorrect, malformed, या placeholder values unchecked छोड़ें।
  5. Add Selected click करें। Checked values आपकी allowed values list में populate होती हैं।

उदाहरण: आप Rating__c field के लिए consistency configure करते हैं। Import from Field return करता है:

ValueRecords
Hot284
Warm198
Cold156
Very High23
240 km/h12
N/A8

पहले तीन values आपकी real ratings हैं। आप उन्हें check करते हैं। “Very High” एक data entry error है। “240 km/h” clearly wrong-field data है। “N/A” एक placeholder है। आप उन्हें unchecked छोड़ते हैं। जब scan चलता है, तो वे 43 records non-conforming दिखाई देते हैं।

सामान्य Consistency समस्याएँ

Country और State Variations

Salesforce data में सबसे आम inconsistency। Standardization के बिना, “United States” जैसा एक ही concept 5 या अधिक distinct values के रूप में दिखाई देता है।

Fix: सभी address fields के लिए Salesforce State और Country Picklists enable करें। Existing non-conforming values find और clean up करने के लिए DQS का उपयोग करें।

Governance के बिना Free-Text Fields

Text fields जिनमें picklist constraints नहीं हैं, समय के साथ variations accumulate करती हैं।

Fix: High-value free-text fields को picklists में convert करें।

Integration-Created Variations

External systems और APIs Salesforce UI validation को bypass करके records लिखते हैं।

Fix: अपनी integration layer में value mapping rules apply करें।

Casing Inconsistencies

Users different records में “Active”, “active”, और “ACTIVE” enter करते हैं।

Fix: तय करें कि क्या casing आपके use case के लिए matter करती है। Display-facing fields के लिए, data cleanup के माध्यम से casing standardize करें।

Best Practices

Scanning से पहले Standards Define करें

पहला scan चलाने से पहले प्रत्येक constrained field के लिए expected value document करें।

Discovery Workflow का उपयोग करें Unknown Fields के लिए

उन fields के लिए जहाँ आपके पास predefined standard नहीं है, पहले Import from Field का उपयोग करें।

समय के साथ Conformance Track करें

एक single conformance score एक snapshot है। जल्दी degradation detect करने और cleanup progress measure करने के लिए multiple scans में scores track करें।

Variant Count को Early Warning के रूप में उपयोग करें

Scans में Variant Count monitor करें। एक field जो scans के बीच 12 से 28 distinct values पर jump करती है उसमें variation का एक नया source है।

अगले कदम

  • अगला: Agentforce Preparation - AI-specific data requirements के बारे में जानें
  • पिछला: Timeliness - डेटा freshness और currency मापें
  • अवलोकन: पाँच आयाम - सभी dimensions साथ review करें
  • कार्रवाई: AI Readiness Assessment - अपने consistency scores और अधिक देखें