Skip to main content

أبعاد جودة البيانات الخمسة

تعرّف على الأبعاد الخمسة التي يقيسها DQS: الاكتمال والصحة والتفرّد والحداثة والاتساق.

فهم الأبعاد الخمسة

تُقاس جودة البيانات عبر خمسة أبعاد رئيسية. يجيب كل بُعد عن سؤال محدّد بشأن بياناتك، ومعًا تحدّد ما إذا كانت بياناتك صالحة للغرض.

يقيس DQS جميع الأبعاد الخمسة بشكل أصلي داخل Salesforce.

البُعدالسؤال الرئيسيمثال على مشكلة
الاكتمالهل البيانات موجودة؟عناوين بريد إلكتروني مفقودة
الصحةهل التنسيق صحيح؟أرقام هاتف مشوّهة
التفرّدهل كل سجل متميّز؟جهات اتصال مكررة
الحداثةهل البيانات حالية؟تواريخ فرص قديمة
الاتساقهل البيانات موحّدة؟«USA» مقابل «United States»

1. الاكتمال

يقيس الاكتمال ما إذا كانت قيم البيانات المطلوبة موجودة وغير مفقودة.

ما يقيسه DQS

  • معدّل التعبئة: نسبة السجلات ذات القيم غير الفارغة
  • اكتشاف الفراغات: السلاسل الفارغة والقيم التي تحتوي على مسافات فقط
  • اكتشاف العناصر النائبة: قيم مثل «N/A» أو «TBD» أو «Unknown»

لماذا يهمّ الاكتمال

البيانات غير المكتملة تكسر الأتمتة. عندما يتطلّب سير عمل عنوان بريد إلكتروني غير موجود، يفشل سير العمل. وعندما يعتمد تقرير على حقل Industry بينما نصف سجلاتك تفتقر إلى قيم Industry، فإن تحليلاتك تُظهر جزءًا فقط من الصورة.

مشكلات الاكتمال الشائعة

المشكلةمثالالتأثير
حقول فارغةContact Phone فارغلا يمكن الاتصال بالعملاء المحتملين
قيم نائبة«TBD» في Company Nameغير صالحة للتقارير
مسافات فقط« » في Descriptionتبدو معبّأة لكنها ليست كذلك

نصيحة: ابدأ بحقولك الأكثر حرجًا. لست بحاجة إلى اكتمال 100% في كل حقل، فقط في تلك التي تهمّ حالة الاستخدام لديك.

2. الصحة

تقيس الصحة ما إذا كانت قيم البيانات تتوافق مع التنسيقات والأنماط المتوقّعة.

ما يقيسه DQS

  • التحقّق من التنسيق: أنماط البريد الإلكتروني والهاتف وURL
  • مطابقة النمط: أنماط regex مخصصة
  • التحقّق من النطاق: قوائم القيم المسموح بها

الصحة مقابل الدقة

الصحة والدقة مختلفتان. يمكن أن يكون عنوان البريد الإلكتروني صحيحًا (تنسيق سليم) لكن غير دقيق (الشخص الخطأ). يقيس DQS الصحة لأن التحقّق من التنسيق يمكن أتمتته. أما الدقة فتتطلّب تحقّقًا خارجيًا.

الفحصصحيح؟دقيق؟
john@company.comنعمغير معروف دون تحقّق
john@companyلاغير منطبق (التنسيق خاطئ)
john.smith@oldcompany.comنعملا (الشخص غادر الشركة)

مشكلات الصحة الشائعة في Salesforce

  • عناوين بريد إلكتروني بدون «@» أو بدون نطاق
  • أرقام هاتف بعدد أرقام خاطئ
  • URLs بدون بروتوكول (http/https)
  • نص حرّ حيث تُتوقّع قيم picklist

3. التفرّد

يقيس التفرّد ما إذا كانت قيم البيانات متميّزة وغير مكررة.

ما يقيسه DQS

  • كشف المكررات: التطابقات التامة عبر السجلات
  • العدّ المتميّز: إجمالي القيم الفريدة لكل حقل
  • تحليل الإنتروبيا: تنوّع القيم وتوزيعها

تكلفة المكررات

تُهدر السجلات المكررة التخزين وتربك المستخدمين وتنتج مقاييس منتفخة. عندما يمتلك فريق المبيعات سجلّين للشركة نفسها، يفقدان السياق ويخاطران بتواصل مكرّر محرج.

تُظهر الأبحاث:

  • قواعد بيانات B2B تحتوي في المتوسط على 10–30% سجلات مكررة
  • كل سجل مكرر يكلّف المؤسسات في هدر إرسال البريد الإلكتروني وتشويش التقارير وتجزئة تاريخ العملاء

منع المكررات مقابل كشفها

يركّز DQS على الكشف، الذي يساعدك في تحديد المكررات الموجودة بالفعل. أما المنع (إيقاف المكررات عند الإنشاء) فيتطلّب قواعد تحقّق وقواعد مطابقة في إعداد Salesforce.

4. الحداثة

تقيس الحداثة ما إذا كانت البيانات حالية بما يكفي للاستخدام المخصّص لها.

ما يقيسه DQS

  • معدّل الحداثة: نسبة السجلات ضمن العمر المقبول
  • كشف التقادم: السجلات التي تتجاوز عتبتك
  • متوسط العمر: المتوسط لقيم حقول التاريخ
  • كشف التواريخ المستقبلية: تواريخ غير صالحة في المستقبل

ضبط عتبات الحداثة

لأنواع البيانات المختلفة متطلبات حداثة مختلفة:

نوع البياناتالعتبة النموذجيةلماذا
Lead Last Activity30 يومًاLeads الباردة تفقد قيمتها
معلومات Contact90 يومًاالأشخاص يغيّرون وظائفهم
Opportunity Close Dateالربع الحاليدقة التوقّعات
Account Annual Revenueسنة واحدةتُتوقّع تحديثات سنوية

لماذا تهمّ الحداثة للذكاء الاصطناعي

تتعلّم نماذج الذكاء الاصطناعي وتعلّم الآلة من بياناتك. عندما تكون بياناتك قديمة، يتعلّم الذكاء الاصطناعي أنماطًا قديمة. يستخدم Agentforce مثلًا بيانات Salesforce لديك لإعلام استجاباته. معلومات الاتصال القديمة تؤدي إلى توصيات غير صحيحة.

5. الاتساق

يقيس الاتساق ما إذا كانت قيم البيانات موحّدة ومقنّنة.

ما يقيسه DQS

  • معدّل المطابقة: نسبة ما يطابق الأنماط المتوقّعة
  • كشف الاختلافات: تمثيلات مختلفة للقيمة نفسها
  • تحليل القيمة السائدة: أكثر القيم شيوعًا لكل حقل

أنواع عدم الاتساق

النوعمثالالمشكلة
اختلاف التنسيق«USA» مقابل «United States» مقابل «US»يكسر التصفية والتجميع
اختلاف الإملاء«Acme Corp» مقابل «ACME Corporation»يخلق مكررات زائفة
اختلاف حالة الأحرف«new york» مقابل «New York»يبدو غير احترافي في التقارير

لماذا يهمّ الاتساق للذكاء الاصطناعي

تعامل نماذج الذكاء الاصطناعي «USA» و«United States» كقيمتين مختلفتين. إذا استخدمت سجلاتك الاثنين، فلن يتمكّن الذكاء الاصطناعي من تجميعها بشكل صحيح. البيانات غير المتّسقة تجزّئ فهم الذكاء الاصطناعي وتنتج مخرجات غير موثوقة.

تحقيق الاتساق

  • استخدم picklists بدلًا من النص الحرّ حيثما أمكن
  • وحّد على تنسيق واحد لكل حقل
  • استورد من قيم picklist عند إعداد فحوصات الاتساق في DQS

موازنة الأبعاد

ليس كل بُعد مهمًا بالتساوي لكل حالة استخدام. فكّر فيما تحتاجه:

حالة الاستخدامالأبعاد ذات الأولوية
حملات التسويقالاكتمال، الصحة (للتسليم)
توقّعات المبيعاتالحداثة، الاكتمال
خدمة العملاءالتفرّد (مصدر واحد للحقيقة)
AI/Agentforceجميع الأبعاد الخمسة، بالإضافة إلى فحوصات الجاهزية للذكاء الاصطناعي

تغطية DQS للأبعاد

يقيس DQS جميع الأبعاد الخمسة بقدرات شاملة:

البُعدما يقيسه DQS
الاكتمالمعدّل التعبئة، كشف null، كشف الفراغات، كشف العناصر النائبة، المنطق السياقي
الصحةالتحقّق من التنسيق، أنماط regex مخصصة، تحديد السجلات غير الصالحة
التفرّدكشف المكررات، تحليل الإنتروبيا، توزيع التكرار
الحداثةمعدّل الحداثة، كشف التقادم، متوسط العمر، كشف التواريخ المستقبلية
الاتساقفحص المطابقة، اكتشاف الاختلافات، تحليل القيمة السائدة

الخطوات التالية

بعد أن فهمت الأبعاد الخمسة:

  1. أجرِ تقييم الجاهزية للذكاء الاصطناعي لترى درجاتك الحالية
  2. اقرأ عن التحضير لـ Agentforce للحصول على فحوصات إضافية تتجاوز جودة البيانات الأساسية
  3. تعلّم كيفية استخدام Definition Builder لإعداد أول فحص لك