ما تغطّيه هذه السيناريوهات
تستعرض هذه الصفحة ثلاثة إعدادات من العالم الحقيقي لتحليل صحة DQS. يغطّي كل سيناريو مشكلة عمل محدّدة، ويُظهر الإعدادات الدقيقة للاستخدام، ويشرح كيفية قراءة النتائج.
تبني هذه الجولات على المفاهيم من مقالة الصحة الرئيسية. اقرأها أولًا إذا كنت جديدًا على مقاييس الصحة أو تدفّق التشخيص أو إعداد الأنماط.
السيناريو 1: التحقّق من بريد إلكتروني ثانوي على حقل نصّي مخصّص
المشكلة
تخزّن مؤسستك عنوان بريد إلكتروني ثانويًا في حقل نصي مخصّص Secondary_Email__c على كائن Contact. على عكس حقل Email القياسي في Salesforce، الحقل النصي لا يحتوي على تحقّق تنسيق مدمج. يُلصق المستخدمون ويكتبون ويستوردون أي شيء فيه. يريد التسويق استخدام هذه العناوين الثانوية لحملة إعادة تفاعل، لكن لا أحد يعرف كم عدد العناوين التي هي صحيحة بنيويًا. تحتاج إلى رقم ملموس حتى يتمكّن التسويق من وضع توقّعات حملة واقعية وفريق العمليات من تحديد نطاق التنظيف.
لماذا لا حقل Email القياسي؟ نوع حقل Email الأصلي في Salesforce يتحقّق من التنسيق عند الإدخال. القيم في حقل Email قياسي تمرّ بالفعل من فحوصات التنسيق الأساسية. التحقّق من البريد الإلكتروني في DQS مفيد على حقول Text المخصّصة التي تخزّن عناوين بريد إلكتروني دون الفرض المدمج في Salesforce.
الإعداد
استخدم وضع Format Validation على كائن Contact، مستهدفًا حقل Secondary_Email__c. تحتاج إلى معدّل الصحة الرئيسي وعدد السجلات القابلة للاستخدام. كشف placeholder وتحليل الضوضاء ليسا ذا صلة هنا لأن عناوين البريد الإلكتروني إما تطابق التنسيق أو لا.
| الإعداد | القيمة | لماذا |
|---|---|---|
| Analysis Mode | Format Validation | تحتاج إلى معدّل المطابقة والعدّ الصحيح، لا التفصيل الكامل للأخطاء |
| Pattern Type | نمط مدمج: ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$ | |
| Include Blanks | OFF | البريد الإلكتروني الفارغ هو مشكلة اكتمال، لا صحة. أبقها خارج هذا التحليل. |
| Case Sensitive | OFF | عناوين البريد الإلكتروني غير حسّاسة لحالة الأحرف بالتعريف |
نمط Email هو preset مدمج. لست بحاجة إلى كتابة أي regex. اختر «Email» من منتقي النمط ويُطبَّق regex تلقائيًا.
نتائج عيّنة
| المقياس | القيمة |
|---|---|
| Validity Rate | 71% |
| Valid Count | 35500 |
إجمالي سجلات Contact المُقيَّمة: 50000.
قراءة النتائج
ابدأ بالعنوان: صحة 71%. هذا يعني أن 29% من عناوين البريد الإلكتروني الثانوية تفشل في فحص التنسيق. من أصل 50000 Contact معبّأ فيه Secondary_Email__c، فقط 35500 لديهم عنوان صحيح بنيويًا.
كيف تبدو الـ 29% غير الصحيحة في الممارسة: هذه قيم ينقصها رمز «@» (john.company.com)، أو نقص امتداد النطاق (john@company)، أو تحتوي على نقاط مزدوجة (john@company..com)، أو تتضمّن مسافات (john @company.com). لأن هذا حقل نصي، قبل Salesforce كل هذه عند الإدخال. كل حملة تُرسل إلى هذه العناوين ترتدّ.
رياضيات الحملة تتغيّر. كان التسويق يتوقّع وصول إعادة التفاعل بناءً على 50000 عنوان ثانوي. الجمهور الحقيقي القابل للوصول هو 35500. يجب إعادة حساب معدلات الفتح ومعدلات النقر وتوقّعات التحويل مقابل القاعدة الصحيحة، لا الإجمالي المضخّم.
لماذا Format Validation كافٍ هنا. لست بحاجة إلى الوضع المتقدّم لهذا السيناريو. السؤال بسيط: «كم عدد عناوين البريد الإلكتروني الثانوية التي تطابق تنسيقًا صحيحًا؟». Validity Rate و Valid Count يجيبان عن هذا السؤال. إذا احتجت لاحقًا إلى تحديد نطاق مشروع تنظيف بأعداد دقيقة غير صحيحة، انتقل إلى Advanced Format Validation للتفصيل الكامل.
ماذا تفعل بعد ذلك
استخدم Valid Count (35500) كالجمهور الحقيقي القابل للوصول لتخطيط الحملة. حدّد نطاق مشروع تنظيف للـ 14500 سجل المتبقية: صدّرها، وحدّد أكثر أخطاء التنسيق شيوعًا، وأصلحها من خلال إثراء البيانات أو التصحيح اليدوي. فكّر في إضافة قاعدة تحقّق في Salesforce على Secondary_Email__c لفرض تنسيق البريد الإلكتروني على الإدخالات المستقبلية، أو حوّل الحقل إلى نوع Email إذا كانت عملياتك تسمح بذلك.
السيناريو 2: التحقّق من رمز المنتج بطول ثابت
المشكلة
تستخدم شركتك رموز منتج من 8 أحرف في حقل مخصّص Product_Code__c على كائن Opportunity Product. هذه الرموز تدفع عمليات البحث عن المخزون وقواعد التسعير وتكامل ERP. كانت مزامنة ERP تفشل على حوالي 5% من السجلات كل أسبوع، ويشتبه فريق التكامل في رموز منتج مشوّهة. تحتاج إلى تأكيد كم عدد الرموز التي تفشل في فحص التنسيق والحصول على نطاق التنظيف الدقيق.
الإعداد
استخدم وضع Advanced Format Validation على كائن Opportunity Product، مستهدفًا حقل Product_Code__c. تحتاج إلى التفصيل الكامل للصحيح/غير الصحيح حتى يكون لفريق التكامل أعداد سجلات دقيقة لمشروع معالجته.
| الإعداد | القيمة | لماذا |
|---|---|---|
| Analysis Mode | Advanced Format Validation | تحتاج إلى Invalid Count لتحديد نطاق التنظيف، بالإضافة إلى Noise Rate للتحقّق من الإدخالات القمامة |
| Pattern Type | Fixed Length | رموز المنتج دائمًا 8 أحرف بالضبط |
| Fixed Length | 8 | طول رمزك القياسي |
| Include Blanks | ON | رمز منتج فارغ غير صحيح لمزامنة ERP. احسبه كفشل. |
| Case Sensitive | OFF | رموز المنتج ليست معتمدة على حالة الأحرف في نظامك |
ينتج نمط Fixed Length regex ^.{8}$ تلقائيًا. أي قيمة ليست 8 أحرف بالضبط تفشل في التحقّق.
نتائج عيّنة
المقاييس الأساسية:
| المقياس | القيمة |
|---|---|
| Validity Rate | 94,2% |
| Valid Count | 9420 |
المقاييس المتقدّمة:
| المقياس | القيمة |
|---|---|
| Invalid Rate | 5,8% |
| Invalid Count | 580 |
| Noise Rate | 0,4% |
| Noisy Records Count | 40 |
إجمالي السجلات المُقيَّمة: 10000.
قراءة النتائج
5,8% غير صحيحة تؤكّد تقدير فريق التكامل. 580 رمز منتج من أصل 10000 لا تطابق تنسيق الـ 8 أحرف. هذه هي السجلات التي تكسر مزامنة ERP.
Invalid Count (580) هو نطاق التنظيف. لدى فريق التكامل الآن رقم ملموس. بدلًا من التحقيق في كل فشل مزامنة على حدة، يمكنهم سحب الـ 580 سجلًا، وتصنيف أخطاء التنسيق، وإصلاحها دفعة واحدة. تشمل المشكلات الشائعة في حقول رمز المنتج رموزًا مقطوعة (5–7 أحرف من أخطاء النسخ واللصق)، ورموزًا بمسافات زائدة (9 أحرف بسبب مسافة غير مرئية)، ورموزًا بشرطات أو بادئات أضافها المستخدمون («PC-12345678»).
Noise Rate (0,4%) منخفض لكن يستحقّ الذكر. 40 سجلًا يحتوي على أنماط ضوضاء: أحرف متكررة («XXXXXXXX»)، إدخالات لوحة مفاتيح («asdfghjk»)، أو سلاسل أحرف خاصة. هذه الـ 40 سجلًا ليست أخطاء تنسيق. هي إدخالات قمامة صادف أن تكون 8 أحرف بالضبط. حسبها Validity Rate كصحيحة لأنها تمرّ من فحص الطول، لكنها بيانات قمامة ستفشل في بحث ERP لسبب مختلف. Noise Rate يلتقط ما يفوّته فحص التنسيق.
Include Blanks ON مهم هنا. مع تفعيل Include Blanks، أي سجل يكون فيه Product_Code__c فارغًا يُحسب كغير صحيح. لو تركت هذا الإعداد متعطّلًا، لكانت هذه السجلات الفارغة مستبعدة من التقييم تمامًا، وكان Invalid Count لديك أقل من العدد الحقيقي للسجلات التي تفشل في مزامنة ERP. بما أن رمز المنتج الفارغ يكسر التكامل بنفس الطريقة التي يكسرها بها رمز مشوّه، فإن إدراج الفراغات يمنحك نطاق الفشل الدقيق.
ماذا تفعل بعد ذلك
صدّر الـ 580 سجلًا غير الصحيحة لفريق التكامل. صنّف الأخطاء حسب النوع: رموز مقطوعة، أحرف زائدة، مسافات زائدة. أصلحها بالجملة باستخدام مهمة تحديث بيانات. للسجلات الـ 40 المشحونة بالضوضاء، حقّق في المصدر. إذا جاءت من استيراد محدّد أو مستخدم، عالج هذا السبب الجذري. بعد التنظيف، أضف قاعدة تحقّق في Salesforce تفرض طول الـ 8 أحرف على Product_Code__c لمنع الإدخالات السيئة الجديدة. أعد الفحص للتحقّق من Validity Rate الجديد.
السيناريو 3: كشف ضوضاء اسم الشركة في Web-to-Lead
المشكلة
يتطلّب نموذج web-to-lead حقل Company. حجم Lead قوي: 20000 Lead جديد كل ربع. لكن فريق SDR يُبلّغ أن كثيرًا من Leads لديها أسماء شركات قمامة، إدخالات مثل «asdf» أو «test» أو «xxx» أو «na na na». تُهدر هذه Leads وقت SDR وتلوّث تقسيمك. فحص اكتمال أساسي يُظهر أن 98% من Leads لديها قيمة Company. تشتبه في أن الـ 98% مُضلّلة لأن الإدخالات القمامة «معبّأة» تقنيًا.
الإعداد
استخدم وضع Advanced Format Validation على كائن Lead، مستهدفًا حقل Company. تحتاج إلى Noise Rate لقياس القمامة التي تختبئ خلف درجة اكتمال صحية.
بالنسبة لنمط التنسيق، لا توجد قاعدة تنسيق صارمة لأسماء الشركات. أسماء الشركات نص حرّ. استخدم تحقّقًا نصيًا دنيًا للتحقّق من أن القيمة تحتوي على حرف أبجدي رقمي واحد على الأقل.
| الإعداد | القيمة | لماذا |
|---|---|---|
| Analysis Mode | Advanced Format Validation | تحتاج إلى Noise Rate و Noisy Records Count لقياس الإدخالات القمامة |
| Pattern Type | Custom | لا يوجد نمط مدمج يناسب أسماء الشركات بالنص الحرّ |
| Custom Pattern | ^.*[a-zA-Z0-9].*$ | يطابق أي قيمة تحتوي على حرف أو رقم واحد على الأقل. يلتقط القيم التي هي أحرف خاصة بحتة. |
| Include Blanks | ON | أسماء الشركات الفارغة مشكلة أيضًا. أدرجها في عدد الفشل. |
| Case Sensitive | OFF | ليس ذا صلة لهذا النمط، لكن اتركه معطّلًا كافتراضي |
القيمة الحقيقية لهذا الفحص في مقاييس الضوضاء، لا في التحقّق من التنسيق. النمط المخصّص فضفاض عمدًا لأنك لا تفرض تنسيق اسم شركة محدّد. تشغّل الفحص في الوضع المتقدّم للوصول إلى Noise Rate و Noisy Records Count.
نتائج عيّنة
المقاييس الأساسية:
| المقياس | القيمة |
|---|---|
| Validity Rate | 97,5% |
| Valid Count | 19500 |
المقاييس المتقدّمة:
| المقياس | القيمة |
|---|---|
| Invalid Rate | 2,5% |
| Invalid Count | 500 |
| Noise Rate | 12% |
| Noisy Records Count | 2400 |
إجمالي سجلات Lead المُقيَّمة: 20000.
قراءة النتائج
97,5% صحة متوقّعة وليست النقطة. تقريبًا كل قيمة تمرّ من فحص التنسيق الفضفاض لأن النمط يتطلّب فقط حرفًا أبجديًا رقميًا واحدًا. الـ 500 سجل غير الصحيح هي إدخالات بأحرف خاصة أو مسافات فقط، قيم مثل «---» أو «…» أو «!!!». من السهل تحديدها وحذفها.
Noise Rate (12%) هي الاكتشاف الحقيقي. 2400 Lead لديها أسماء شركات تحتوي على أنماط ضوضاء. هذه إدخالات بأحرف متكررة («aaaa» و«xxxxx»)، أو أحرف خاصة متتالية («!@#$%»)، أو أحرف تحكم. تمرّ من فحص التنسيق لأنها تحتوي على أحرف أبجدية رقمية، لكن القيم قمامة.
صورة جودة البيانات الحقيقية:
| الفئة | السجلات | ما يعنيه |
|---|---|---|
| نظيفة وصحيحة | 17100 | أسماء شركات حقيقية جاهزة لتواصل SDR |
| غير صحيحة (قمامة بحتة) | 500 | لا محتوى أبجدي رقمي على الإطلاق. احذف أو حجر. |
| مشحونة بالضوضاء (قمامة مخفية) | 2400 | تبدو معبّأة لكنها تحتوي على قمامة. مراجعة يدوية أو تعليم تلقائي. |
فريق SDR لديك على حق: مشكلة جودة Lead حقيقية. 2900 من أصل 20000 Lead (14,5%) لديها بيانات شركة غير قابلة للاستخدام. هذا 14,5% من وقت SDR مُهدَر على Leads لا يمكن توجيهها أو إثراؤها أو تقسيمها بشكل صحيح أبدًا.
فجوة الاكتمال مقابل الصحة. يقول الاكتمال إن 98% من Leads لديها قيمة Company. تقول الصحة إن 97,5% تمرّ من فحص التنسيق. يقول Noise Rate إن 12% من تلك القيم التي تمرّ قمامة. كل بُعد يكشف عن طبقة مختلفة من المشكلة. الاكتمال وحده يفوّت القمامة التي يلتقطها Noise Rate.
ماذا تفعل بعد ذلك
ابنِ قائمة انتظار تنظيف للـ 2900 سجل غير صحيح ومشحون بالضوضاء مجتمعَين. للسجلات الـ 500 غير الصحيحة بحتة، احذف تلقائيًا أو احجر. للسجلات الـ 2400 المشحونة بالضوضاء، قرّر: احذف تلقائيًا Leads التي لا تحتوي على بيانات مفيدة أخرى، أو ضع علامة عليها للمراجعة اليدوية إذا كانت بيانات الهاتف أو البريد الإلكتروني لا تزال قابلة للاستخدام.
أصلح المصدر. القمامة تأتي من نموذج الويب لديك. أضف تحقّقًا من جانب العميل: حدّ أدنى لطول الأحرف، احجب أنماط الأحرف المتكررة، وفكّر في CAPTCHA لمنع الروبوتات. بعد تنفيذ تغييرات النموذج، شغّل الفحص مرة أخرى في الربع التالي وقارن Noise Rate بهذا خطّ الأساس.
اختيار إعدادك
استخدم هذا الجدول لاختيار نقطة البداية الصحيحة لتحليل الصحة لديك.
| إذا كنت بحاجة إلى… | ابدأ بـ | الإعدادات الرئيسية |
|---|---|---|
| فحص تنسيق البريد الإلكتروني على الحقول النصية المخصّصة | Format Validation | Pattern Type: Email, Include Blanks: OFF |
| التحقّق من رموز ذات طول ثابت (رموز المنتج، SKUs، الرموز البريدية) | Advanced Format Validation | Pattern Type: Fixed Length، اضبط عدد الأحرف، Include Blanks: ON |
| التحقّق من تنسيق URL على حقول الموقع الإلكتروني | Format Validation | Pattern Type: URL, Include Blanks: OFF |
| فرض تنسيق أعمال مخصّص (regex) | Advanced Format Validation | Pattern Type: Custom، أدخل نمط regex الخاص بك |
| كشف القمامة والضوضاء في حقول النص الحرّ | Advanced Format Validation | استخدم نمط تنسيق فضفاض، ركّز على Noise Rate و Noisy Records Count |
| تحديد نطاق مشروع تنظيف بيانات لتكامل | Advanced Format Validation | Include Blanks: ON، استخدم Invalid Count و Noisy Records Count لتحديد حجم المشروع |
للحصول على مرجع كامل لمقاييس الصحة الستة وأنواع الأنماط وتفاصيل كشف الضوضاء، عُد إلى مقالة الصحة الرئيسية.
هل أنت مستعد لقياس جودة بياناتك الخاصة؟ أجرِ تقييم الجاهزية للذكاء الاصطناعي لترى درجات صحتك والمزيد.