Skip to main content

Cohérence

Les 6 métriques de cohérence mesurées par DQS, le flux de diagnostic pour repérer la fragmentation des valeurs, et comment configurer l'analyse de conformité.

Qu’est-ce que la cohérence ?

La cohérence mesure si vos valeurs respectent un standard convenu. Un champ est cohérent quand chaque enregistrement utilise le même terme pour le même concept. Un champ est incohérent quand existent des variantes qui signifient la même chose mais sont exprimées différemment.

« USA », « United States » et « US » font tous référence au même pays. Pour Salesforce, ce sont trois valeurs distinctes. Un rapport groupé par Country produit trois lignes au lieu d’une. Une automatisation filtrée sur « USA » manque 230 enregistrements contenant « United States ».

Taux de conformité = (Enregistrements conformes / Total) x 100

Si 850 des 1 000 enregistrements Account ont une valeur Country qui correspond à votre liste de valeurs autorisées, votre taux de conformité Country est de 85 %. Les 15 % restants contiennent des variantes qui nécessitent standardisation.

Pourquoi la cohérence compte

Reporting

Des données incohérentes fragmentent vos rapports. Quand votre champ Country contient cinq orthographes différentes du même pays, un rapport groupé par Country affiche cinq lignes au lieu d’une. Le total est correct, mais le regroupement est faux.

Automatisation

L’automatisation Salesforce dépend de correspondances exactes. Un Workflow filtrant sur Country = "USA" manque les enregistrements contenant « United States » et « US ». L’automatisation s’exécute correctement sur les enregistrements correspondants mais saute silencieusement tout le reste.

IA et Agentforce

Les modèles d’IA traitent chaque variante comme un concept séparé. « USA » et « United States » deviennent deux pays différents du point de vue du modèle. Agentforce génère des réponses à partir de vos valeurs de champs. Des valeurs incohérentes produisent des sorties IA incohérentes.

SystèmeImpact de la cohérence
RapportsRegroupements fragmentés, totaux trompeurs
WorkflowsLes filtres manquent les variantes
Duplicate RulesLes variantes empêchent le bon rapprochement
AgentforceDes valeurs incohérentes produisent des réponses IA peu fiables

Comment DQS mesure la cohérence

DQS produit 6 métriques de cohérence organisées autour d’une question de diagnostic : « Vos valeurs respectent-elles un standard, et sinon, que font-elles à la place ? »

Étape 1 : quelle est la cohérence ?

Conformance Rate est la métrique principale. Il calcule le pourcentage d’enregistrements où la valeur correspond à l’une de vos valeurs autorisées.

Vous scannez l’objet Account. Le champ Country affiche un taux de conformité de 72 %. Cela signifie que 28 % de vos Accounts contiennent des valeurs de pays en dehors de votre liste autorisée. Vos Sharing Rules de territoire, vos dashboards régionaux et votre logique de localisation travaillent tous sur des données incomplètes.

Étape 2 : quelle est l’ampleur ?

Les taux indiquent la gravité. Les comptages indiquent la charge.

MétriqueCe qu’elle vous dit
Conformance CountCombien d’enregistrements correspondent aux valeurs autorisées. Pour le reporting de couverture.
Non-Conforming CountCombien d’enregistrements tombent en dehors. Pour cadrer les projets de nettoyage.

Exemple : votre data steward doit nettoyer le champ Industry. Non-Conforming Count est de 3 400. Elle connaît maintenant le périmètre du projet et peut fixer un calendrier réaliste.

Étape 3 : à quel point les données sont-elles fragmentées ?

Variant Count mesure le nombre de valeurs distinctes trouvées dans un champ. Il répond : « De combien de façons différentes les gens expriment-ils cette donnée ? »

ChampTotalVariant CountÉvaluation
Country1 0005Bien maîtrisé, probablement cohérent
Country1 00047Très fragmenté, standardisation nécessaire
Industry50012Raisonnable, probablement picklist
Industry50089Chaos de texte libre, attention immédiate

Exemple : lors d’un audit de l’org, vous scannez Lead_Source__c sur Leads. Variant Count renvoie 34. Votre équipe marketing a défini 8 sources. Les 26 variantes restantes sont des fautes d’orthographe, des abréviations et des entrées ad hoc depuis les intégrations.

Étape 4 : quelles sont les valeurs réelles ?

Dominant Values renvoie les N valeurs les plus fréquentes avec leur comptage. Cela vous dit à quoi ressemblent réellement vos données, pas ce à quoi vous vous attendez.

RangValeurNombrePourcentage
1United States45045 %
2USA23023 %
3US18018 %
4U.S.A.454,5 %
5United States of America151,5 %

Exemple : votre équipe débat de la standardisation Country vers des codes ISO (« US ») ou des noms complets (« United States »). Dominant Values montre que 45 % des enregistrements utilisent déjà « United States ». Standardiser vers cette valeur exige de changer 55 % des enregistrements. Standardiser vers « US » exige d’en changer 82 %.

Référence des métriques

Métriques fondamentales

MétriqueTypeCe qu’elle mesure
Conformance RatePourcentagePart des enregistrements correspondant aux valeurs autorisées
Conformance CountComptageNombre d’enregistrements correspondants

Métriques avancées

MétriqueTypeCe qu’elle mesure
Non-Conforming CountComptageEnregistrements en dehors de la liste autorisée
Non-Conformance RatePourcentagePart des enregistrements en dehors
Variant CountComptageTotal de valeurs distinctes trouvées
Dominant ValuesListeTop N des valeurs les plus fréquentes

Couverture des types de champs

Type de champFocus cohérence
String (Text)Abréviations, orthographe, casse
TextAreaStandardisation de texte libre
PicklistValidation des valeurs réelles par rapport aux options attendues
EmailStandardisation des domaines, cohérence de format
PhoneStandardisation des formats (indicatifs, séparateurs)
URLCohérence de protocole et de chemin

Deux modes d’analyse

Conformance Check répond à : « Les valeurs correspondent-elles à ma liste autorisée ? » Il produit les 2 métriques fondamentales.

Advanced Conformance Analysis produit les 6 métriques, y compris les comptages non conformes, la détection de variantes et la distribution des valeurs dominantes.

Besoin métierMode recommandé
Audit rapide de conformitéConformance Check
Nettoyage post-migrationAdvanced (Variant Count révèle le chaos importé)
Évaluation de préparation IAAdvanced (Dominant Values montre ce dont l’IA apprendra)
Gouvernance continueCommencer par Conformance Check, passer à Advanced

Configurer la cohérence

DQS propose quatre paramètres de configuration pour la cohérence.

ParamètreCe qu’il contrôle
Expected ValuesLa liste des valeurs que DQS traite comme « conformes ». Obligatoire.
Case SensitiveContrôle si la correspondance tient compte de la casse. Désactivé par défaut.
Top NCombien de valeurs dominantes retourner (1 à 100). Par défaut : 5.
Min FrequencyLe nombre minimal d’occurrences pour figurer dans Dominant Values. Par défaut : 1.

Astuce : commencez par utiliser Import from Field pour voir quelles valeurs existent vraiment dans vos données avant de définir votre liste autorisée.

Import from Field : configuration par découverte

Un défi courant avec la cohérence est de savoir quelles valeurs attendre. Vous ne pouvez pas définir des valeurs autorisées si vous ne savez pas ce que contiennent vos données.

Import from Field résout cela. Il interroge les données réelles du champ, groupe les valeurs par fréquence et affiche les résultats sous forme de checklist.

Comment ça marche :

  1. Ouvrez la configuration Expected Values.
  2. Cliquez sur Import from Field. DQS interroge les données en direct et renvoie les valeurs distinctes triées par fréquence.
  3. Passez la checklist en revue. Chaque valeur indique combien d’enregistrements la contiennent.
  4. Cochez les valeurs que vous considérez correctes. Laissez décochées les valeurs incorrectes, mal formées ou placeholder.
  5. Cliquez sur Add Selected. Les valeurs cochées alimentent votre liste autorisée.

Exemple : vous configurez la cohérence pour un champ Rating__c. Import from Field renvoie :

ValeurEnregistrements
Hot284
Warm198
Cold156
Very High23
240 km/h12
N/A8

Les trois premières valeurs sont vos vraies évaluations. Vous les cochez. « Very High » est une erreur de saisie. « 240 km/h » est clairement une donnée dans le mauvais champ. « N/A » est un placeholder. Vous les laissez décochées.

Problèmes de cohérence courants

Variantes de pays et de région

L’incohérence la plus courante dans Salesforce. Sans standardisation, un concept unique comme « United States » apparaît sous 5 valeurs distinctes ou plus.

Correctif : activez les State and Country Picklists Salesforce pour tous les champs d’adresse. Utilisez DQS pour trouver et nettoyer les valeurs non conformes existantes.

Champs texte libre sans gouvernance

Les champs texte sans contrainte de picklist accumulent des variantes avec le temps. Industry, Job Title, Lead Source et Department sont des coupables fréquents.

Correctif : convertissez en picklists les champs texte libre à forte valeur. Utilisez Import from Field pour voir votre distribution actuelle avant de définir les options.

Variantes créées par intégration

Les systèmes externes et les API écrivent des enregistrements qui contournent la validation de l’UI Salesforce. Une plateforme de marketing automation écrit « Info Technology » alors que votre standard est « Information Technology ».

Correctif : appliquez des règles de mapping dans votre couche d’intégration. Lancez des scans de cohérence périodiques.

Incohérences de casse

Les utilisateurs saisissent « Active », « active » et « ACTIVE » sur différents enregistrements. Avec la correspondance insensible à la casse, DQS les compte tous comme conformes. Mais le champ contient toujours trois orthographes.

Correctif : décidez si la casse compte pour votre cas d’usage.

Bonnes pratiques

Définissez vos standards avant de scanner

Documentez la valeur attendue pour chaque champ contraint avant de lancer votre premier scan.

ChampStandardJustification
CountryCodes ISO 3166-1 alpha-2 (US, CA, DE)Norme du secteur, compacte
IndustryTaxonomie personnalisée à 15 valeursCorrespond aux catégories de reporting
Lead Source8 sources définies par le marketingAligné avec le suivi de campagnes

Utilisez la découverte pour les champs inconnus

Pour les champs sans standard prédéfini, utilisez Import from Field d’abord. Laissez les données vous dire quel est le standard de facto.

Suivez la conformité dans le temps

Un score de conformité unique est un instantané. Suivez les scores sur plusieurs scans.

Utilisez Variant Count comme alerte précoce

Un champ qui passe de 12 à 28 valeurs distinctes entre deux scans a une nouvelle source de variation.

Priorisez par impact métier

Tous les champs n’ont pas besoin de 100 % de conformité. Concentrez-vous sur les champs qui alimentent le reporting, l’automatisation ou l’IA.

Étapes suivantes

Vous avez maintenant parcouru les cinq dimensions de la qualité des données. Poursuivez votre apprentissage :