فهم الأبعاد الخمسة
تُقاس جودة البيانات عبر خمسة أبعاد رئيسية. يجيب كل بُعد عن سؤال محدّد بشأن بياناتك، ومعًا تحدّد ما إذا كانت بياناتك صالحة للغرض.
يقيس DQS جميع الأبعاد الخمسة بشكل أصلي داخل Salesforce.
| البُعد | السؤال الرئيسي | مثال على مشكلة |
|---|---|---|
| الاكتمال | هل البيانات موجودة؟ | عناوين بريد إلكتروني مفقودة |
| الصحة | هل التنسيق صحيح؟ | أرقام هاتف مشوّهة |
| التفرّد | هل كل سجل متميّز؟ | جهات اتصال مكررة |
| الحداثة | هل البيانات حالية؟ | تواريخ فرص قديمة |
| الاتساق | هل البيانات موحّدة؟ | «USA» مقابل «United States» |
1. الاكتمال
يقيس الاكتمال ما إذا كانت قيم البيانات المطلوبة موجودة وغير مفقودة.
ما يقيسه DQS
- معدّل التعبئة: نسبة السجلات ذات القيم غير الفارغة
- اكتشاف الفراغات: السلاسل الفارغة والقيم التي تحتوي على مسافات فقط
- اكتشاف العناصر النائبة: قيم مثل «N/A» أو «TBD» أو «Unknown»
لماذا يهمّ الاكتمال
البيانات غير المكتملة تكسر الأتمتة. عندما يتطلّب سير عمل عنوان بريد إلكتروني غير موجود، يفشل سير العمل. وعندما يعتمد تقرير على حقل Industry بينما نصف سجلاتك تفتقر إلى قيم Industry، فإن تحليلاتك تُظهر جزءًا فقط من الصورة.
مشكلات الاكتمال الشائعة
| المشكلة | مثال | التأثير |
|---|---|---|
| حقول فارغة | Contact Phone فارغ | لا يمكن الاتصال بالعملاء المحتملين |
| قيم نائبة | «TBD» في Company Name | غير صالحة للتقارير |
| مسافات فقط | « » في Description | تبدو معبّأة لكنها ليست كذلك |
نصيحة: ابدأ بحقولك الأكثر حرجًا. لست بحاجة إلى اكتمال 100% في كل حقل، فقط في تلك التي تهمّ حالة الاستخدام لديك.
2. الصحة
تقيس الصحة ما إذا كانت قيم البيانات تتوافق مع التنسيقات والأنماط المتوقّعة.
ما يقيسه DQS
- التحقّق من التنسيق: أنماط البريد الإلكتروني والهاتف وURL
- مطابقة النمط: أنماط regex مخصصة
- التحقّق من النطاق: قوائم القيم المسموح بها
الصحة مقابل الدقة
الصحة والدقة مختلفتان. يمكن أن يكون عنوان البريد الإلكتروني صحيحًا (تنسيق سليم) لكن غير دقيق (الشخص الخطأ). يقيس DQS الصحة لأن التحقّق من التنسيق يمكن أتمتته. أما الدقة فتتطلّب تحقّقًا خارجيًا.
| الفحص | صحيح؟ | دقيق؟ |
|---|---|---|
| john@company.com | نعم | غير معروف دون تحقّق |
| john@company | لا | غير منطبق (التنسيق خاطئ) |
| john.smith@oldcompany.com | نعم | لا (الشخص غادر الشركة) |
مشكلات الصحة الشائعة في Salesforce
- عناوين بريد إلكتروني بدون «@» أو بدون نطاق
- أرقام هاتف بعدد أرقام خاطئ
- URLs بدون بروتوكول (http/https)
- نص حرّ حيث تُتوقّع قيم picklist
3. التفرّد
يقيس التفرّد ما إذا كانت قيم البيانات متميّزة وغير مكررة.
ما يقيسه DQS
- كشف المكررات: التطابقات التامة عبر السجلات
- العدّ المتميّز: إجمالي القيم الفريدة لكل حقل
- تحليل الإنتروبيا: تنوّع القيم وتوزيعها
تكلفة المكررات
تُهدر السجلات المكررة التخزين وتربك المستخدمين وتنتج مقاييس منتفخة. عندما يمتلك فريق المبيعات سجلّين للشركة نفسها، يفقدان السياق ويخاطران بتواصل مكرّر محرج.
تُظهر الأبحاث:
- قواعد بيانات B2B تحتوي في المتوسط على 10–30% سجلات مكررة
- كل سجل مكرر يكلّف المؤسسات في هدر إرسال البريد الإلكتروني وتشويش التقارير وتجزئة تاريخ العملاء
منع المكررات مقابل كشفها
يركّز DQS على الكشف، الذي يساعدك في تحديد المكررات الموجودة بالفعل. أما المنع (إيقاف المكررات عند الإنشاء) فيتطلّب قواعد تحقّق وقواعد مطابقة في إعداد Salesforce.
4. الحداثة
تقيس الحداثة ما إذا كانت البيانات حالية بما يكفي للاستخدام المخصّص لها.
ما يقيسه DQS
- معدّل الحداثة: نسبة السجلات ضمن العمر المقبول
- كشف التقادم: السجلات التي تتجاوز عتبتك
- متوسط العمر: المتوسط لقيم حقول التاريخ
- كشف التواريخ المستقبلية: تواريخ غير صالحة في المستقبل
ضبط عتبات الحداثة
لأنواع البيانات المختلفة متطلبات حداثة مختلفة:
| نوع البيانات | العتبة النموذجية | لماذا |
|---|---|---|
| Lead Last Activity | 30 يومًا | Leads الباردة تفقد قيمتها |
| معلومات Contact | 90 يومًا | الأشخاص يغيّرون وظائفهم |
| Opportunity Close Date | الربع الحالي | دقة التوقّعات |
| Account Annual Revenue | سنة واحدة | تُتوقّع تحديثات سنوية |
لماذا تهمّ الحداثة للذكاء الاصطناعي
تتعلّم نماذج الذكاء الاصطناعي وتعلّم الآلة من بياناتك. عندما تكون بياناتك قديمة، يتعلّم الذكاء الاصطناعي أنماطًا قديمة. يستخدم Agentforce مثلًا بيانات Salesforce لديك لإعلام استجاباته. معلومات الاتصال القديمة تؤدي إلى توصيات غير صحيحة.
5. الاتساق
يقيس الاتساق ما إذا كانت قيم البيانات موحّدة ومقنّنة.
ما يقيسه DQS
- معدّل المطابقة: نسبة ما يطابق الأنماط المتوقّعة
- كشف الاختلافات: تمثيلات مختلفة للقيمة نفسها
- تحليل القيمة السائدة: أكثر القيم شيوعًا لكل حقل
أنواع عدم الاتساق
| النوع | مثال | المشكلة |
|---|---|---|
| اختلاف التنسيق | «USA» مقابل «United States» مقابل «US» | يكسر التصفية والتجميع |
| اختلاف الإملاء | «Acme Corp» مقابل «ACME Corporation» | يخلق مكررات زائفة |
| اختلاف حالة الأحرف | «new york» مقابل «New York» | يبدو غير احترافي في التقارير |
لماذا يهمّ الاتساق للذكاء الاصطناعي
تعامل نماذج الذكاء الاصطناعي «USA» و«United States» كقيمتين مختلفتين. إذا استخدمت سجلاتك الاثنين، فلن يتمكّن الذكاء الاصطناعي من تجميعها بشكل صحيح. البيانات غير المتّسقة تجزّئ فهم الذكاء الاصطناعي وتنتج مخرجات غير موثوقة.
تحقيق الاتساق
- استخدم picklists بدلًا من النص الحرّ حيثما أمكن
- وحّد على تنسيق واحد لكل حقل
- استورد من قيم picklist عند إعداد فحوصات الاتساق في DQS
موازنة الأبعاد
ليس كل بُعد مهمًا بالتساوي لكل حالة استخدام. فكّر فيما تحتاجه:
| حالة الاستخدام | الأبعاد ذات الأولوية |
|---|---|
| حملات التسويق | الاكتمال، الصحة (للتسليم) |
| توقّعات المبيعات | الحداثة، الاكتمال |
| خدمة العملاء | التفرّد (مصدر واحد للحقيقة) |
| AI/Agentforce | جميع الأبعاد الخمسة، بالإضافة إلى فحوصات الجاهزية للذكاء الاصطناعي |
تغطية DQS للأبعاد
يقيس DQS جميع الأبعاد الخمسة بقدرات شاملة:
| البُعد | ما يقيسه DQS |
|---|---|
| الاكتمال | معدّل التعبئة، كشف null، كشف الفراغات، كشف العناصر النائبة، المنطق السياقي |
| الصحة | التحقّق من التنسيق، أنماط regex مخصصة، تحديد السجلات غير الصالحة |
| التفرّد | كشف المكررات، تحليل الإنتروبيا، توزيع التكرار |
| الحداثة | معدّل الحداثة، كشف التقادم، متوسط العمر، كشف التواريخ المستقبلية |
| الاتساق | فحص المطابقة، اكتشاف الاختلافات، تحليل القيمة السائدة |
الخطوات التالية
بعد أن فهمت الأبعاد الخمسة:
- أجرِ تقييم الجاهزية للذكاء الاصطناعي لترى درجاتك الحالية
- اقرأ عن التحضير لـ Agentforce للحصول على فحوصات إضافية تتجاوز جودة البيانات الأساسية
- تعلّم كيفية استخدام Definition Builder لإعداد أول فحص لك