ये Scenarios क्या Cover करते हैं
यह page तीन real-world consistency configurations के माध्यम से walk-through करती है, initial setup से लेकर scan results पढ़ने तक। प्रत्येक scenario एक अलग business context और analysis mode उपयोग करता है।
ये scenarios main Consistency article में cover किए गए concepts और metrics पर build करते हैं। यदि Conformance Rate, Variant Count, और Dominant Values जैसे terms आपके लिए new हैं तो पहले वह पढ़ें।
Scenario 1: Discovery के साथ Country Field Standardization
Business Context
आपके org में 3 merged companies से 15,000 Account records हैं। Country field free text है। Regional dashboards fragmented data दिखाते हैं: “United States” एक row के रूप में दिखाई देता है, “USA” दूसरे के रूप में, “US” तीसरे के रूप में। Territory assignment rules records miss करते हैं क्योंकि वे single spelling के लिए filter करते हैं। आपको standardize करना है, लेकिन आप नहीं जानते कि तीनों legacy systems में कौन सी values exist करती हैं।
Configuration Walkthrough
अपने allowed values define करने से पहले discover करने के लिए पहले Import from Field से शुरू करें।
Countryfield के लिए Expected Values configuration खोलें।- Import from Field पर click करें। DQS live data query करता है और distinct values को frequency द्वारा sorted करके return करता है।
- Checklist review करें। Import full picture reveal करता है:
| Value | Records |
|---|---|
| United States | 4,500 |
| USA | 2,300 |
| US | 1,800 |
| Canada | 1,400 |
| U.S.A. | 450 |
| United States of America | 150 |
| … (41 और variations) | … |
- अपना standard decide करें। ISO country codes (“US”, “CA”, “UK”) compact, industry-standard, और unambiguous हैं। Import list से ISO codes check करें।
- अपनी allowed values populate करने के लिए Add Selected click करें।
Remaining configuration set करें:
| Setting | Value | तर्क |
|---|---|---|
| Analysis Mode | Advanced Conformance Analysis | Cleanup scope के लिए variant counts और dominant values चाहिए |
| Expected Values | US, CA, UK, DE, FR, AU, JP | आपके active markets के लिए ISO codes |
| Case Sensitive | OFF | ”us”, “Us”, और “US” को same value के रूप में catch करें |
| Top N | 10 | Most common variations देखें |
| Min Frequency | 5 | One-off typos filter करें |
Scan क्या Produce करता है
| Metric | Value |
|---|---|
| Conformance Rate | 12% |
| Conformance Count | 1,800 |
| Non-Conforming Count | 13,200 |
| Variant Count | 47 |
| Dominant Values | Top 10 values with counts (import table ऊपर देखें) |
Results पढ़ना
12% conformance expected है। आपने एक new standard (ISO codes) define किया जिस पर data कभी normalized नहीं हुआ। केवल वे 1,800 records जिनमें पहले से “US” है match करते हैं। यह bad score नहीं है। यह आपका starting point है।
47 variants fragmentation का scale reveal करता है। तीन merged systems ने country names express करने के 47 अलग-अलग तरीके produce किए। इस number के बिना, आप cleanup effort को underestimate करेंगे।
Dominant Values दिखाता है कि कहाँ focus करना है। Top 3 variations (“United States”, “USA”, “US”) 8,600 records account करती हैं। उन तीन values को standardize करना अकेले ही आपकी conformance 12% से 69% तक lift करेगा। वहाँ से शुरू करें।
Non-Conforming Count (13,200) आपकी exact cleanup scope है। आपके data steward के पास अब एक concrete project size है, guess नहीं।
अगला Action
Dominant Values output का उपयोग करके एक value mapping table build करें। “United States” को “US” map करें, “USA” को “US” map करें, इत्यादि। Data normalization run करें। अपना नया Conformance Rate verify करने के लिए rescan करें।
Scenario 2: Lead Rating Validation
Business Context
आपका Lead Rating field (Rating__c) एक text field है जो “Hot”, “Warm”, या “Cold” accept करता है। Sales managers अपनी pipeline reports में strange values report करते हैं। Rating = "Hot" के लिए filter expected से कम records return करता है। आपको field में क्या है और कितने records को cleanup की जरूरत है यह find out करने के लिए quick conformance audit चाहिए।
Configuration Walkthrough
Scan configure करने से पहले actual values देखने के लिए पहले Import from Field से शुरू करें।
Rating__cके लिए Expected Values configuration खोलें।- Import from Field click करें। Import return करता है:
| Value | Records |
|---|---|
| Hot | 284 |
| Warm | 198 |
| Cold | 156 |
| Very High | 23 |
| 240 km/h | 12 |
| N/A | 8 |
पहले तीन values आपकी real ratings हैं। “Very High” एक different picklist से आता है (किसी ने wrong field से paste किया)। “240 km/h” clearly wrong field का data है। “N/A” एक placeholder है।
- “Hot”, “Warm”, और “Cold” check करें। बाकी unchecked छोड़ें।
- Add Selected click करें।
Remaining configuration set करें:
| Setting | Value | तर्क |
|---|---|---|
| Analysis Mode | Conformance Check | आपको yes/no answer चाहिए, deep analysis नहीं |
| Expected Values | Hot, Warm, Cold | आपकी तीन valid ratings |
| Case Sensitive | OFF | ”hot”, “HOT”, और “Hot” को matching के रूप में catch करें |
Scan क्या Produce करता है
| Metric | Value |
|---|---|
| Conformance Rate | 93.7% |
| Conformance Count | 638 |
Results पढ़ना
93.7% conform करता है। इसका मतलब है 43 records में garbage data है।
Import from Field step ने पहले से बताया कि garbage कैसा दिखता है। “Very High” (wrong picklist value से 23 records), “240 km/h” (wrong-field data के साथ 12 records), और “N/A” (8 placeholder entries)। यहाँ Dominant Values की जरूरत नहीं क्योंकि import ने scan run होने से पहले ही breakdown दे दी।
43 records manageable cleanup है। यह data migration project नहीं है। यह 30-minute manual fix या single data update job है।
अगला Action
43 non-conforming records fix करें। फिर future issues prevent करने के लिए Rating__c को text field से picklist में convert करें। API-created records picklist validation bypass करते हैं, इसलिए integrations से नई variations catch करने के लिए periodic consistency scans चलाएँ।
Scenario 3: Persona Targeting के लिए Job Title Conformance
Business Context
आपकी marketing team “VP और उससे ऊपर” Contacts को target करने वाले persona-based campaigns चलाती है। Title field हजारों variations के साथ free text है। हर campaign से पहले, कोई title keywords manual search करता है, आधी variations miss करता है, और incomplete audience list build करता है। Team को दो questions का data-driven answer चाहिए: “हमारे पास कितने VP+ contacts हैं?” और “बाकी contacts के titles क्या हैं?”
Configuration Walkthrough
- Contacts पर
Titlefield के लिए Expected Values configuration खोलें। - Import from Field click करें। Import सैकड़ों values return करती है।
- अपने persona mapping के आधार पर अपने allowed values define करें। उन title values check करें या type करें जिन्हें आपकी team “VP और उससे ऊपर” मानती है:
VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President
- Add Selected click करें।
Remaining configuration set करें:
| Setting | Value | तर्क |
|---|---|---|
| Analysis Mode | Advanced Conformance Analysis | Full value distribution देखना है |
| Expected Values | (16 title values ऊपर listed) | आपकी VP+ persona definition |
| Case Sensitive | OFF | ”vp of sales”, “VP of Sales”, “VP OF SALES” catch करें |
| Top N | 20 | Values का broad spread देखें |
| Min Frequency | 5 | ”Chief Happiness Officer” जैसी one-off entries filter करें |
Scan क्या Produce करता है
| Metric | Value |
|---|---|
| Conformance Rate | 34% |
| Conformance Count | 3,400 |
| Non-Conforming Count | 6,600 |
| Variant Count | 312 |
Dominant Values (Top 20):
| Rank | Value | Count |
|---|---|---|
| 1 | Manager | 820 |
| 2 | Sales Representative | 650 |
| 3 | Account Executive | 480 |
| 4 | Director of Marketing | 340 |
| 5 | VP of Sales | 290 |
| 6 | Senior Manager | 275 |
| 7 | Consultant | 240 |
| 8 | Engineer | 210 |
| 9 | CEO | 195 |
| 10 | Head of Operations | 180 |
| … | (10 और) | … |
Results पढ़ना
34% conformance failure नहीं है। यह data quality problem नहीं है। इसका मतलब है 34% Contacts VP+ titles hold करते हैं, और यह आपका campaign target audience है।
312 Variant Count confirm करता है कि free-text Title highly fragmented है। 10,000 Contacts में 312 distinct title values। यह free-text fields के लिए normal है और explain करता है कि manual searches लोगों को क्यों miss करती हैं।
Dominant Values दिखाता है कि आपके contacts के पास actually क्या titles हैं। Top values में से कई VP level से नीचे हैं (Manager, Sales Rep, Account Executive)। वे valid records हैं। वे आपके target persona से बाहर आते हैं।
Non-Conforming Count (6,600) cleanup scope नहीं है। Country scenario के विपरीत, ये dirty records नहीं हैं। ये आपके VP+ filter से बाहर titles वाले contacts हैं। “Manager” एक real title है, data error नहीं। Non-Conforming Count को “इस persona से बाहर contacts” मानें, “fix करने के records” नहीं।
Real insight: आपके पास अब data-driven audience size है। 3,400 VP+ contacts, actual data scan करके verified। अब कोई manual keyword searches नहीं।
अगला Action
अपने VP+ campaign audience size के रूप में Conformance Count (3,400) उपयोग करें। आपके द्वारा missed titles के लिए Dominant Values list review करें। “Senior Manager” (275 records) और “Head of Operations” (180 records) borderline हैं। यदि वे roles आपके campaigns के लिए qualify होती हैं, तो उन्हें allowed values में add करें और rescan करें।
अपना Configuration चुनना
| यदि आपको करना है… | यहाँ से शुरू करें | Key Settings |
|---|---|---|
| एक controlled field (picklist, rating, status) audit करें | Import from Field, फिर Conformance Check | Import से Expected Values, Case Sensitive OFF |
| एक fragmented field (country, industry) standardize करें | Import from Field, फिर Advanced Conformance Analysis | Target standard के रूप में Expected Values, Top N 10+, Min Frequency 5+ |
| Free-text data से audience या segment size करें | Import from Field, फिर Advanced Conformance Analysis | Segment definition के रूप में Expected Values, Top N 20, Min Frequency 5 |
| Cleanup project से पहले quick baseline प्राप्त करें | Import from Field, फिर Conformance Check | आपके data standard से Expected Values |
सभी 6 consistency metrics, analysis modes, और configuration inputs की full explanation के लिए main Consistency article पर return करें।
अपनी खुद की data quality measure करने के लिए तैयार हैं? अपने consistency scores और अधिक देखने के लिए AI Readiness Assessment लें।