Skip to main content

Qu'est-ce que la qualité des données ?

Découvrez ce que signifie la qualité des données, comment la mesurer et pourquoi elle détermine le succès de votre reporting, de votre automatisation et de vos initiatives d'IA.

Définir la qualité des données

La qualité des données mesure à quel point vos données remplissent leur rôle. Il ne s’agit pas de savoir si les données sont « correctes » dans l’absolu. Il s’agit de savoir si vos données sont exploitables pour la prise de décision, les opérations et l’analytique.

Une adresse client est de qualité si elle atteint le client. Un code produit est de qualité si vos systèmes le reconnaissent. La qualité dépend du contexte.

Le principe du « fit for purpose »

La qualité des données est contextuelle. Une adresse d’expédition nécessite une précision au niveau de la rue. Une région marketing ne nécessite que le pays ou l’état. Les deux peuvent être « de haute qualité » à des niveaux de précision différents.

Pour évaluer la qualité des données, posez-vous la question : à quoi ces données doivent-elles servir ? Puis mesurez si elles peuvent le faire.

Le cadre des cinq dimensions

La qualité des données se mesure selon cinq dimensions clés. Ce cadre a été adopté dans tous les secteurs et sert de base aux normes ISO 8000 et DAMA.

DimensionCe qu’elle mesureExemple
ComplétudeLes données requises sont présentesTous les champs obligatoires sont remplis
ValiditéLes données respectent les formatsLes adresses e-mail ont un format valide
UnicitéAucun enregistrement en doubleUn enregistrement par client
ActualitéLes données sont à jourLes informations de contact mises à jour dans les 90 jours
CohérenceLes données sont uniformes« USA » utilisé de manière cohérente, pas « US » ni « United States »

Chaque dimension répond à une question précise sur vos données. Ensemble, elles fournissent une image complète de la santé des données.

Pour des conseils détaillés sur chaque dimension, voir :

Normes et cadres sectoriels

ISO 8000

La norme ISO 8000 définit les exigences de qualité des données pour l’échange de master data. Elle établit les principes d’exactitude, de complétude et de cohérence des données entre organisations.

DAMA-DMBOK

Le Body of Knowledge de la Data Management Association (DAMA-DMBOK) définit la qualité des données comme l’un des onze domaines de connaissance du data management. Il fournit des conseils sur la mesure, la surveillance et les processus d’amélioration.

La règle 1-10-100

Ce principe illustre le coût croissant d’une mauvaise qualité des données :

ÉtapeCoûtExemple
Prévention1 $Validation à la saisie
Correction10 $Nettoyage des données après saisie
Défaillance100 $Impact métier de mauvaises données

Investir dans la qualité des données à la source fait économiser des coûts significatifs en aval.

Qualité des données et concepts voisins

Qualité des données vs data management

Le data management est la pratique plus large de collecte, de stockage et de maintenance des données. La qualité des données est l’une de ses composantes, centrée spécifiquement sur l’adéquation à l’usage.

ConceptPérimètreAxe
Data managementToutes les pratiques de donnéesStockage, accès, sécurité, cycle de vie
Qualité des donnéesAdéquation à l’usageComplétude, validité, unicité, actualité, cohérence
Gouvernance des donnéesPolitiques et responsabilitéQui possède les données, qui peut les modifier, quelles règles s’appliquent

Qualité des données vs exactitude des données

L’exactitude demande : cette valeur reflète-t-elle la réalité ? La qualité demande : ces données fonctionnent-elles pour leur usage ?

Une adresse e-mail peut être valide (format correct) mais inexacte (la personne ne l’utilise plus). DQS mesure la qualité parce que le format et la complétude peuvent être automatisés. L’exactitude nécessite généralement une vérification externe.

Comment la qualité des données se mesure

Métriques quantitatives

La qualité des données s’exprime par des indicateurs mesurables :

Type de métriqueExempleCalcul
PourcentageTaux de remplissage(Enregistrements renseignés / Total) x 100
ComptageNombre de doublonsNombre d’enregistrements avec valeurs identiques
ScoreScore de validitéMoyenne pondérée sur les règles de validation
RatioTaux de conformitéValeurs conformes / Total des valeurs

Seuils et objectifs

Les organisations définissent des seuils en fonction des exigences métier :

NiveauSeuilCas d’usage
Critique99 %+Champs de reporting réglementaire
Élevé95 %+Données en contact avec le client
Standard85 %+Données opérationnelles
Faible70 %+Données historiques ou d’archive

Mesure continue vs ponctuelle

Une mesure ponctuelle fournit un instantané. Une mesure continue suit les tendances et détecte la dégradation tôt.

DQS prend en charge les deux approches :

  • Lancez des scans ad hoc pour une évaluation immédiate
  • Planifiez des scans récurrents pour une surveillance continue

Pourquoi les organisations peinent

1. Silos de données

Quand les données vivent dans des systèmes déconnectés, les incohérences apparaissent naturellement. Sales dispose d’une version d’un enregistrement client. Support en a une autre. Aucune équipe ne sait laquelle est correcte.

2. Erreurs de saisie manuelle

La saisie humaine est sujette aux fautes de frappe, aux formats incohérents et aux informations manquantes. Sans Validation Rules, ces erreurs s’accumulent avec le temps.

3. Pas de responsabilité claire

Quand personne n’est responsable de la qualité des données, elle devient le problème de tout le monde et la priorité de personne. Le data stewardship exige une attribution explicite.

4. Absence de mesure

Vous ne pouvez pas améliorer ce que vous ne mesurez pas. Beaucoup d’organisations supposent que leurs données sont « assez bonnes » sans établir de référence ni suivre de métriques.

5. Projets de nettoyage ponctuels

Traiter la qualité des données comme un projet plutôt que comme un processus mène à des améliorations temporaires qui se dégradent avec le temps.

L’impact métier

Une mauvaise qualité des données affecte toutes les fonctions :

FonctionImpact
MarketingCampagnes envoyées à de mauvaises adresses, budget gaspillé
CommercialTemps perdu sur des leads en double, contexte perdu
FinanceRapports inexacts, risques de conformité
OpérationsDécisions basées sur des données erronées
IA / MLModèles entraînés sur de mauvaises données produisant de mauvais résultats

Quantifier le coût

Les recherches du MIT Sloan et d’études sectorielles montrent que :

  • Les organisations perdent 15 à 25 % de leur chiffre d’affaires chaque année à cause d’une mauvaise qualité des données
  • Plus de 25 % des organisations perdent plus de 5 millions de dollars par an sur des problèmes de données (IBM 2025)
  • Les employés passent jusqu’à 27 % de leur temps à corriger de mauvaises données

Le lien avec la préparation à l’IA

La qualité des données traditionnelle (les cinq dimensions) prépare vos données pour le reporting et l’automatisation. Les applications d’IA comme Agentforce reposent sur les mêmes fondations : enregistrements complets, formats valides, valeurs cohérentes, données à jour et absence de doublons.

Au-delà de ces cinq dimensions, le déploiement de l’IA introduit une préoccupation additionnelle : l’exposition de données sensibles. Avant de connecter des agents IA à vos données Salesforce, vous devez savoir où se trouvent les PII afin de pouvoir les masquer ou les exclure.

DQS mesure à la fois la qualité des données traditionnelle et la préparation à l’IA sur une seule plateforme :

  • Cinq dimensions de qualité des données : complétude, validité, unicité, actualité, cohérence
  • PII Detection : analyse les champs texte à la recherche de données sensibles (SSN, cartes de crédit, informations personnelles) avant toute exposition à l’IA

Construire une pratique de qualité des données

Une pratique efficace de qualité des données repose sur trois éléments :

1. Mesure

Établissez des références avant toute amélioration. Sachez où vous en êtes pour chaque dimension et chaque champ.

2. Processus

Définissez des workflows pour la maintenance continue des données :

  • Validation Rules à la saisie
  • Cycles de nettoyage réguliers
  • Procédures d’escalade des incidents
  • Protocoles de gestion du changement

3. Culture

Construisez un engagement à l’échelle de l’organisation :

  • Attribuez des data stewards pour chaque domaine
  • Incluez la qualité des données dans les indicateurs de performance
  • Célébrez les améliorations et partagez les réussites
  • Rendez la qualité visible grâce à des tableaux de bord

Démarrer avec DQS

DQS fournit le socle de mesure de votre pratique qualité des données :

  1. Sélectionnez les capabilities : choisissez les dimensions à mesurer
  2. Définissez le périmètre : choisissez les objets et champs à analyser
  3. Configurez les seuils : définissez vos standards de qualité
  4. Lancez les scans : exécutez l’analyse sur vos données
  5. Passez les résultats en revue : identifiez les problèmes et priorisez les corrections

La première étape consiste à comprendre votre état actuel. Passez l’évaluation de préparation à l’IA pour évaluer votre maturité qualité des données en 3 minutes.

Étapes suivantes