La qualité des données dans Salesforce

La qualité des données dans Salesforce, c’est la capacité de vos enregistrements à répondre aux besoins concrets de votre activité : reporting, automatisation, prévisions et, de plus en plus, intelligence artificielle. Un org Salesforce peut contenir des millions d’Accounts, de Contacts, de Leads et d’Opportunities — mais le volume n’est pas la valeur. Des données incomplètes, obsolètes, incohérentes ou dupliquées contaminent tous les processus qui s’appuient sur elles.

Ce guide explique ce que recouvre concrètement la qualité des données dans Salesforce, pourquoi les données CRM se dégradent, les six dimensions qui déterminent si vos données sont exploitables, et comment les mesurer et les améliorer sans exporter un seul enregistrement hors de votre org.

Pourquoi les données Salesforce se dégradent

Les données Salesforce ne restent pas propres d’elles-mêmes. Elles se dégradent en continu, pour des raisons structurelles plutôt qu’accidentelles :

La saisie manuelle. Les commerciaux créent des accounts sous des noms légèrement différents, laissent des champs non obligatoires vides et collent des notes au mauvais endroit. Chaque frappe est une occasion d’introduire une erreur.
Les intégrations. Les outils de marketing automation, d’ERP, de facturation et d’enrichissement de données écrivent dans Salesforce selon leurs propres calendriers et leurs propres conventions. Deux systèmes qui alimentent le même champ finissent rarement par être d’accord sur la durée.
Le temps. Un numéro de téléphone qui était juste il y a deux ans est aujourd’hui incorrect. Une Close Date dépassée induit en erreur. La fraîcheur s’érode même sans que personne ne touche à l’enregistrement.
Les doublons. Le même client entre via un formulaire web, un import de liste et une saisie manuelle par un commercial — trois enregistrements, une seule entité. Sans surveillance active, les doublons se multiplient.
Les agents IA. Agentforce et les autres agents lisent et écrivent des enregistrements ; les problèmes de qualité non détectés se propagent alors bien plus vite et à plus grande échelle que ne l’aurait jamais permis la saisie humaine.

Parce que les causes sont structurelles, la réponse n’est pas un nettoyage ponctuel. C’est une mesure en continu.

Ce que coûte une mauvaise qualité des données

Dans un contexte Salesforce, la mauvaise qualité des données n’est pas une préoccupation abstraite. Elle se manifeste dans trois domaines qui ont une incidence directe sur l’activité :

Reporting et prévisions. Les tableaux de bord ne valent que ce que valent les champs qu’ils agrègent. Des montants manquants, des étapes périmées et des Opportunities en double faussent discrètement les chiffres de pipeline et de revenus. Les dirigeants finissent par ne plus faire confiance aux rapports, et les décisions repartent vers les tableurs.

Automatisation. Les Flows, les Validation Rules, les règles d’attribution et les processus d’approbation présupposent que les données qu’ils lisent sont correctes. Un champ Region vide réachemine un Lead vers le mauvais commercial ; une adresse e-mail invalide rompt silencieusement une séquence de nurturing. De mauvaises données transforment l’automatisation d’un multiplicateur en un passif.

Préparation à l’IA. C’est le coût le plus récent et le plus rapide à croître. Avant de connecter Agentforce ou tout autre système d’IA à vos données Salesforce, vous devez savoir quels champs sont complets, lesquels contiennent des données personnelles (PII) et lesquels sont suffisamment récents pour étayer une réponse. Des PII non détectées dans un index de récupération ou un jeu d’entraînement créent une exposition qu’aucun filtre en aval ne peut entièrement corriger ; des données incomplètes ou obsolètes produisent des réponses IA affirmées mais fausses.

Les six dimensions de la qualité des données dans Salesforce

La qualité des données n’est pas un chiffre unique que l’on possède ou non. Elle se mesure selon des dimensions distinctes, chacune répondant à une question différente sur vos enregistrements. Les transposer dans Salesforce permet de passer du cadre théorique au concret :

Dimension	La question à laquelle elle répond	Dans Salesforce
Complétude	Les champs qui devraient être remplis le sont-ils ?	Champs métier obligatoires laissés vides : Account Industry, Contact Email, Opportunity Amount
Validité	La valeur respecte-t-elle le format ou l’ensemble de valeurs attendu ?	Adresses e-mail sans `@`, numéros de téléphone avec des lettres, valeurs de picklist hors de l’ensemble autorisé
Unicité	Chaque entité réelle est-elle représentée une seule fois ?	Accounts et Contacts en double créés via des formulaires, des imports et une saisie manuelle
Cohérence	Les valeurs respectent-elles les règles et sont-elles cohérentes entre elles ?	Pays orthographié de trois manières différentes, Billing State contredisant Billing Country
Actualité	Les données sont-elles à jour et les dates sont-elles plausibles ?	Last Activity datant de plusieurs mois, Close Dates dans le passé, enregistrements futurs qui ne devraient pas exister
Détection de PII	Où se trouvent les données personnelles sensibles ?	Numéros de sécurité sociale, numéros de carte bancaire et adresses e-mail dans des champs texte libre comme Description ou les commentaires

Ces six dimensions se répartissent en deux groupes. Les cinq premières — complétude, validité, unicité, cohérence et actualité — décrivent l’hygiène opérationnelle : si vos données fonctionnent pour l’usage CRM quotidien. La détection de PII appartient à un second groupe centré sur la préparation à l’IA : si vos données sont sûres et prêtes pour Agentforce et autres initiatives d’IA.

Comment mesurer la qualité des données dans Salesforce

On n’améliore pas ce qu’on ne mesure pas — et on ne peut pas mesurer ce que l’on vérifie seulement à la main. Mesurer la qualité des données dans Salesforce, c’est transformer ces six dimensions en analyses quantifiées et reproductibles.

Le résultat central est un score de qualité des données (parfois appelé score de fiabilité des données) : un chiffre unique pondéré qui consolide les dimensions importantes en un indicateur que l’on peut suivre dans le temps. Un score de 100 signifie que chaque enregistrement a passé tous les contrôles en périmètre ; un score plus bas indique à la fois l’ampleur du travail restant et l’endroit où il se concentre.

Une approche de mesure pertinente dans Salesforce repose sur trois propriétés :

Au niveau du champ, pas seulement de l’enregistrement. Savoir que 18 % des Accounts présentent un problème est un point de départ. Savoir que ce problème est un champ Industry vide sur les Accounts créés par une intégration spécifique, c’est actionnable.
Pondérée selon vos priorités. Un Opportunity Amount manquant a plus de poids qu’un numéro de téléphone secondaire absent. La pondération permet au score de refléter l’impact métier, et non de simples comptages bruts.
Reproductible selon un calendrier. La qualité est une cible mouvante. Un audit ponctuel est obsolète le lendemain de son exécution. Des analyses planifiées transforment un instantané en courbe de tendance.

C’est l’approche que suit Data Quality Sense (DQS). Vous définissez ce que signifie « bon » pour chaque objet et chaque champ, lancez l’analyse et obtenez un score de qualité des données pondéré, ventilé par dimension et par champ — puis vous planifiez sa répétition pour suivre l’évolution.

Pourquoi le natif est essentiel

La décision architecturale la plus importante dans la mesure de la qualité des données dans Salesforce est l’endroit où la mesure s’effectue. De nombreux outils imposent d’exporter les enregistrements vers un service externe, de les analyser hors plateforme, puis de renvoyer les résultats. Cela introduit trois problèmes : une copie de vos données (y compris les éventuelles PII) vit désormais en dehors de Salesforce, les résultats sont décalés par rapport à la réalité, et vous dépendez d’une intégration qui peut se rompre.

Une approche 100 % native à Salesforce évite tout cela. L’analyse s’exécute à l’intérieur de votre org en utilisant le traitement batch de la plateforme. Aucun enregistrement ne quitte Salesforce, les résultats reflètent les données en direct, et il n’y a pas de pipeline externe à maintenir. Pour les données contenant des PII — précisément celles que vous devez le plus impérativement analyser avant un projet IA — les garder sur la plateforme n’est pas un confort, c’est une exigence de conformité.

DQS fonctionne entièrement dans Salesforce pour cette raison. La détection est déterministe et transparente : vous voyez chaque règle appliquée, et aucune donnée n’est jamais exportée.

Pour commencer

Améliorer la qualité des données dans Salesforce suit une boucle simple, que vous le fassiez manuellement ou avec un outil :

Définir ce que signifie la qualité pour vos objets et champs les plus importants.
Analyser pour obtenir un score de qualité des données de référence et une ventilation par champ.
Prioriser les problèmes ayant le plus fort impact métier et le moindre effort de correction.
Corriger via du nettoyage, des Validation Rules et de meilleures procédures de saisie.
Surveiller grâce à des analyses planifiées pour que les nouveaux problèmes remontent avant de se propager.

Dans DQS, vous construisez cette boucle avec le Definition Builder — un assistant guidé où vous sélectionnez les capabilities (les six dimensions), choisissez les objets et champs en périmètre, configurez les seuils et passez en revue. Vous lancez ensuite l’analyse à la demande ou selon un calendrier, et vous explorez les résultats dans Insight Studio avec les tendances, l’état de santé des champs et les ventilations par dimension. Tout se passe à l’intérieur de votre org Salesforce.

Étapes suivantes

Comment mesurer la qualité des données dans Salesforce : le score de qualité des données en détail
Les cinq dimensions de la qualité des données : le cadre derrière les dimensions
Détection de PII : identifier les données sensibles avant un projet IA
Préparation à Agentforce : préparer les données Salesforce pour l’IA
Qu’est-ce que la qualité des données ? : les fondamentaux, depuis le début