Consistency क्या है?
Consistency मापती है कि आपके डेटा मान एक agreed-upon standard के अनुरूप हैं या नहीं। एक field तब consistent होती है जब प्रत्येक record एक ही concept के लिए समान term उपयोग करे। एक field inconsistent होती है जब variations मौजूद हों जिनका अर्थ एक ही है लेकिन अलग तरीके से व्यक्त किए गए हैं।
“USA”, “United States”, और “US” सभी एक ही देश को refer करते हैं। Salesforce के लिए, वे तीन distinct values हैं। Country द्वारा grouped एक report तीन rows produce करती है एक के बजाय। “USA” के लिए filter करने वाला automation “United States” वाले 230 records miss कर देता है।
Conformance Rate = (Conforming Records / कुल Records) x 100
यदि 1,000 Account records में से 850 में एक Country value है जो आपकी allowed values list से match करती है, तो आपकी Country conformance rate 85% है। शेष 15% में variations हैं जिन्हें standardization की जरूरत है।
Consistency क्यों महत्वपूर्ण है
रिपोर्टिंग
Inconsistent डेटा आपकी reports को खंडित करता है। जब आपके Country field में एक ही देश की पाँच अलग spelling हों, तो Country द्वारा grouped एक report पाँच rows दिखाती है एक के बजाय। Total सही है, लेकिन grouping गलत है।
स्वचालन
Salesforce स्वचालन exact value matches पर निर्भर करता है। Country = "USA" filter करने वाला Workflow “United States” और “US” वाले records miss करता है।
AI और Agentforce
AI models प्रत्येक variation को एक अलग concept मानते हैं। “USA” और “United States” model के view में दो अलग countries बन जाते हैं। Agentforce आपके field values का उपयोग करके responses generate करता है। Inconsistent values inconsistent AI outputs produce करती हैं।
| System | Consistency प्रभाव |
|---|---|
| Reports | खंडित groupings, misleading totals |
| Workflows | Filters non-matching variations miss करते हैं |
| Duplicate Rules | Variations correct matching prevent करती हैं |
| Agentforce | Inconsistent field values अविश्वसनीय AI responses produce करती हैं |
DQS Consistency कैसे मापता है
DQS एक diagnostic प्रश्न के चारों ओर व्यवस्थित 6 Consistency मेट्रिक्स उत्पन्न करता है: “क्या आपके field values एक standard के अनुरूप हैं, और यदि नहीं, तो वे क्या कर रहे हैं?”
चरण 1: यह कितना Consistent है?
Conformance Rate मुख्य मेट्रिक है। यह उन records का प्रतिशत गणना करता है जहाँ field value आपके defined allowed values में से एक से match करती है।
चरण 2: पैमाना क्या है?
| मेट्रिक | यह क्या बताता है |
|---|---|
| Conformance Count | कितने records आपकी allowed values से match करते हैं। |
| Non-Conforming Count | कितने records आपकी allowed values के बाहर हैं। Cleanup projects के दायरे के लिए इसका उपयोग करें। |
चरण 3: डेटा कितना Fragmented है?
Variant Count एक field में सभी records में found distinct values की संख्या मापता है। यह उत्तर देता है: “लोग इस डेटा को कितने अलग-अलग तरीकों से express कर रहे हैं?”
| Field | कुल Records | Variant Count | Assessment |
|---|---|---|---|
| Country | 1,000 | 5 | Well-controlled, likely consistent |
| Country | 1,000 | 47 | Highly fragmented, needs standardization |
| Industry | 500 | 12 | Reasonable, probably picklist-constrained |
| Industry | 500 | 89 | Free-text chaos, needs immediate attention |
चरण 4: वास्तविक Values क्या हैं?
Dominant Values field में top N most frequent values लौटाता है, प्रत्येक value की frequency count के साथ। यह बताता है कि आपका डेटा वास्तव में कैसा दिखता है, न कि आप उससे क्या expect करते हैं।
| Rank | Value | Count | प्रतिशत |
|---|---|---|---|
| 1 | United States | 450 | 45% |
| 2 | USA | 230 | 23% |
| 3 | US | 180 | 18% |
| 4 | U.S.A. | 45 | 4.5% |
| 5 | United States of America | 15 | 1.5% |
उदाहरण: आपकी team debate कर रही है कि Country values को ISO codes (“US”) या full names (“United States”) पर standardize करना है। Dominant Values दिखाता है कि 45% records पहले से “United States” use करते हैं। उस value पर standardize करने के लिए 55% records बदलने होंगे। “US” पर standardize करने के लिए 82% बदलने होंगे। डेटा आपको सस्ता path बताता है।
मेट्रिक संदर्भ
Foundation Metrics
| मेट्रिक | प्रकार | यह क्या मापता है |
|---|---|---|
| Conformance Rate | प्रतिशत | आपकी allowed values से match करने वाले records का हिस्सा |
| Conformance Count | Count | आपकी allowed values से match करने वाले records की संख्या |
Advanced Metrics
| मेट्रिक | प्रकार | यह क्या मापता है |
|---|---|---|
| Non-Conforming Count | Count | आपकी allowed list के बाहर values वाले records |
| Non-Conformance Rate | प्रतिशत | आपकी allowed list के बाहर records का हिस्सा |
| Variant Count | Count | field में found कुल distinct values |
| Dominant Values | List | frequency counts के साथ top N most frequent values |
Field Type कवरेज
| Field Type | Consistency Focus |
|---|---|
| String (Text) | Abbreviations, spelling, casing |
| TextArea | Free-text standardization |
| Picklist | Expected options के विरुद्ध actual values validate करना |
| Domain standardization, format consistency | |
| Phone | Format standardization (area codes, separators) |
| URL | Protocol और path consistency |
दो Analysis Modes
Conformance Check प्रश्न का उत्तर देता है: “क्या field values मेरी allowed list से match करती हैं?” यह 2 foundation metrics उत्पन्न करता है।
Advanced Conformance Analysis गहरा जाता है। यह सभी 6 metrics उत्पन्न करता है, जिसमें non-conforming counts, variant detection, और dominant value distribution शामिल हैं।
| व्यावसायिक आवश्यकता | अनुशंसित Mode |
|---|---|
| Quick conformance audit या baseline check | Conformance Check |
| Data migration cleanup | Advanced (variant count imported chaos प्रकट करता है) |
| AI readiness evaluation | Advanced (dominant values दिखाता है कि AI क्या सीखेगा) |
| Ongoing data governance | Conformance Check से शुरू करें, गहरे विश्लेषण के लिए Advanced में जाएँ |
Consistency कॉन्फ़िगर करना
DQS Consistency के लिए चार configuration inputs प्रदान करता है।
| Setting | यह क्या नियंत्रित करता है |
|---|---|
| Expected Values | वह values list जिसे DQS “conforming” मानता है। Required: स्कैन चलाने से पहले कम से कम एक value define करनी होगी। |
| Case Sensitive | नियंत्रित करता है कि value matching letter casing consider करती है। अक्षम होने पर (डिफ़ॉल्ट), “Premium”, “PREMIUM”, और “premium” सभी allowed value “Premium” से match करते हैं। |
| Top N | Dominant Values output में return करने के लिए कितनी dominant values (1 से 100)। डिफ़ॉल्ट: 5। |
| Min Frequency | Dominant Values output में include होने के लिए minimum बार एक value appear होनी चाहिए (1 से 1,000)। डिफ़ॉल्ट: 1। |
सुझाव: आपकी allowed values list define करने से पहले यह देखने के लिए Import from Field का उपयोग करें कि वास्तव में आपके डेटा में क्या values मौजूद हैं।
Import from Field: Discovery-First Configuration
कैसे काम करता है:
- Expected Values configuration खोलें।
- Import from Field पर click करें। DQS live data query करता है और distinct values को frequency द्वारा sorted करके return करता है।
- Checklist review करें। प्रत्येक value दिखाता है कि कितने records में वह है।
- उन values को check करें जिन्हें आप correct मानते हैं। Incorrect, malformed, या placeholder values unchecked छोड़ें।
- Add Selected click करें। Checked values आपकी allowed values list में populate होती हैं।
उदाहरण: आप Rating__c field के लिए consistency configure करते हैं। Import from Field return करता है:
| Value | Records |
|---|---|
| Hot | 284 |
| Warm | 198 |
| Cold | 156 |
| Very High | 23 |
| 240 km/h | 12 |
| N/A | 8 |
पहले तीन values आपकी real ratings हैं। आप उन्हें check करते हैं। “Very High” एक data entry error है। “240 km/h” clearly wrong-field data है। “N/A” एक placeholder है। आप उन्हें unchecked छोड़ते हैं। जब scan चलता है, तो वे 43 records non-conforming दिखाई देते हैं।
सामान्य Consistency समस्याएँ
Country और State Variations
Salesforce data में सबसे आम inconsistency। Standardization के बिना, “United States” जैसा एक ही concept 5 या अधिक distinct values के रूप में दिखाई देता है।
Fix: सभी address fields के लिए Salesforce State और Country Picklists enable करें। Existing non-conforming values find और clean up करने के लिए DQS का उपयोग करें।
Governance के बिना Free-Text Fields
Text fields जिनमें picklist constraints नहीं हैं, समय के साथ variations accumulate करती हैं।
Fix: High-value free-text fields को picklists में convert करें।
Integration-Created Variations
External systems और APIs Salesforce UI validation को bypass करके records लिखते हैं।
Fix: अपनी integration layer में value mapping rules apply करें।
Casing Inconsistencies
Users different records में “Active”, “active”, और “ACTIVE” enter करते हैं।
Fix: तय करें कि क्या casing आपके use case के लिए matter करती है। Display-facing fields के लिए, data cleanup के माध्यम से casing standardize करें।
Best Practices
Scanning से पहले Standards Define करें
पहला scan चलाने से पहले प्रत्येक constrained field के लिए expected value document करें।
Discovery Workflow का उपयोग करें Unknown Fields के लिए
उन fields के लिए जहाँ आपके पास predefined standard नहीं है, पहले Import from Field का उपयोग करें।
समय के साथ Conformance Track करें
एक single conformance score एक snapshot है। जल्दी degradation detect करने और cleanup progress measure करने के लिए multiple scans में scores track करें।
Variant Count को Early Warning के रूप में उपयोग करें
Scans में Variant Count monitor करें। एक field जो scans के बीच 12 से 28 distinct values पर jump करती है उसमें variation का एक नया source है।
अगले कदम
- अगला: Agentforce Preparation - AI-specific data requirements के बारे में जानें
- पिछला: Timeliness - डेटा freshness और currency मापें
- अवलोकन: पाँच आयाम - सभी dimensions साथ review करें
- कार्रवाई: AI Readiness Assessment - अपने consistency scores और अधिक देखें