Skip to main content

Validité : scénarios de configuration

Trois cas pratiques détaillés montrant comment configurer l'analyse de validité de DQS pour différents besoins métier.

Ce que couvrent ces scénarios

Cette page déroule trois configurations réelles de l’analyse de validité DQS. Chaque scénario couvre un problème métier précis.

Ces pas à pas s’appuient sur les concepts de l’article principal Validité.

Scénario 1 : validation d’e-mails secondaires sur un champ texte personnalisé

Le problème

Votre organisation stocke une adresse e-mail secondaire dans un champ texte personnalisé Secondary_Email__c sur l’objet Contact. Contrairement au champ standard Email de Salesforce, un champ texte n’a aucune validation intégrée. Les utilisateurs collent, saisissent et importent n’importe quoi. Le marketing veut utiliser ces adresses pour une campagne de réengagement, mais personne ne sait combien sont structurellement valides.

Pourquoi pas le champ Email standard ? Le champ Email natif valide le format à la saisie. La validation DQS est utile sur des champs texte personnalisés qui stockent des e-mails sans l’application native.

Configuration

Utilisez le mode Format Validation sur Contact, en ciblant Secondary_Email__c.

ParamètreValeurPourquoi
Mode d’analyseFormat ValidationVous voulez le taux de match et le Valid Count
Pattern TypeEmailMotif intégré : ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$
Include BlanksOFFLes e-mails vides relèvent de la complétude
Case SensitiveOFFLes adresses e-mail sont insensibles à la casse

Exemple de résultats

MétriqueValeur
Validity Rate71 %
Valid Count35 500

Total Contacts : 50 000.

Lire les résultats

Commencez par la tête d’affiche : 71 % de validité. 29 % des adresses e-mail secondaires échouent au contrôle de format. Sur 50 000 Contacts renseignés, seules 35 500 ont une adresse structurellement valide.

À quoi ressemblent 29 % d’invalides : il manque un « @ » (john.company.com), un domaine (john@company), des doubles points (john@company..com) ou présence d’espaces. Comme c’est un champ texte, Salesforce les a tous acceptés.

Le calcul des campagnes change. Le marketing projette sur 50 000 adresses. L’audience réelle est de 35 500.

Que faire ensuite

Utilisez Valid Count (35 500) comme audience réelle. Cadrez un projet de nettoyage sur les 14 500 restants. Envisagez une Validation Rule Salesforce ou une conversion vers le type Email.


Scénario 2 : validation de codes produits à longueur fixe

Le problème

Votre entreprise utilise des codes produits de 8 caractères dans un champ Product_Code__c sur Opportunity Product. Ces codes pilotent les recherches d’inventaire, les règles de pricing et l’intégration ERP. La synchro ERP échoue sur environ 5 % des enregistrements chaque semaine.

Configuration

Utilisez le mode Advanced Format Validation sur Opportunity Product, en ciblant Product_Code__c.

ParamètreValeurPourquoi
Mode d’analyseAdvanced Format ValidationVous voulez Invalid Count et Noise Rate
Pattern TypeFixed LengthLes codes produits font toujours 8 caractères
Fixed Length8Votre longueur standard
Include BlanksONUn code vide est invalide pour l’ERP
Case SensitiveOFFPas dépendant de la casse

Exemple de résultats

Métriques fondamentales :

MétriqueValeur
Validity Rate94,2 %
Valid Count9 420

Métriques avancées :

MétriqueValeur
Invalid Rate5,8 %
Invalid Count580
Noise Rate0,4 %
Noisy Records Count40

Total : 10 000.

Lire les résultats

5,8 % d’invalides confirme l’estimation de l’équipe d’intégration. 580 codes ne respectent pas le format 8 caractères.

Invalid Count (580) est le périmètre de nettoyage. Les problèmes courants : codes tronqués (5 à 7 caractères), codes avec espaces finaux (9 caractères à cause d’un espace invisible), codes avec tirets ou préfixes ajoutés (« PC-12345678 »).

Noise Rate (0,4 %) est faible mais à noter. 40 enregistrements contiennent des motifs de bruit (« XXXXXXXX », « asdfghjk »). Ce ne sont pas des erreurs de format, mais du déchet de 8 caractères qui passe le contrôle de longueur.

Include Blanks ON compte ici. Un code vide casse l’intégration comme un code malformé.

Que faire ensuite

Exportez les 580 enregistrements invalides. Catégorisez par type d’erreur. Corrigez en masse. Ajoutez une Validation Rule imposant 8 caractères. Rescannez.


Scénario 3 : détection de bruit sur le nom d’entreprise web-to-lead

Le problème

Votre formulaire web-to-lead exige le champ Company. 20 000 nouveaux leads par trimestre. Mais l’équipe SDR signale que de nombreux leads ont des noms d’entreprise poubelle : « asdf », « test », « xxx » ou « na na na ». Un contrôle de complétude basique montre 98 % de Company renseignés.

Configuration

Utilisez le mode Advanced Format Validation sur Lead, en ciblant Company. Vous avez besoin de Noise Rate pour quantifier le déchet qui se cache derrière un score de complétude sain.

ParamètreValeurPourquoi
Mode d’analyseAdvanced Format ValidationVous voulez Noise Rate et Noisy Records Count
Pattern TypeCustomAucun motif intégré pour les noms libres
Custom Pattern^.*[a-zA-Z0-9].*$Correspond à toute valeur contenant au moins un caractère alphanumérique
Include BlanksONLes noms vides sont aussi un problème
Case SensitiveOFFPas pertinent

La vraie valeur de ce scan est dans les métriques de bruit, pas dans la validation de format. Le motif est volontairement large.

Exemple de résultats

Métriques fondamentales :

MétriqueValeur
Validity Rate97,5 %
Valid Count19 500

Métriques avancées :

MétriqueValeur
Invalid Rate2,5 %
Invalid Count500
Noise Rate12 %
Noisy Records Count2 400

Total : 20 000.

Lire les résultats

97,5 % de validité est attendu et hors sujet. Presque chaque valeur passe le motif large. Les 500 invalides sont des entrées purement spéciales (« --- », « … »).

Noise Rate (12 %) est la vraie trouvaille. 2 400 leads ont des noms avec des motifs de bruit : caractères répétés, caractères spéciaux consécutifs.

L’image réelle :

CatégorieEnregistrementsCe que cela signifie
Propres et valides17 100Vrais noms d’entreprise
Invalides (déchet pur)500Aucun contenu alphanumérique
Bruyants (déchet caché)2 400Renseignés mais poubelle

Votre équipe SDR a raison. 2 900 leads sur 20 000 (14,5 %) ont des données entreprise inutilisables.

L’écart complétude vs validité. Complétude dit 98 %. Validité dit 97,5 %. Noise Rate dit 12 % de déchet. Chaque dimension révèle une couche différente.

Que faire ensuite

Construisez une file de nettoyage pour les 2 900 enregistrements combinés. Pour les 500 purement invalides, auto-supprimez ou mettez en quarantaine. Pour les 2 400 bruyants, décidez : auto-supprimer ou flaguer pour revue manuelle.

Corrigez la source. Le déchet vient de votre formulaire web. Ajoutez une validation côté client : longueur minimale, blocage des motifs à caractères répétés, envisagez un CAPTCHA.


Choisir votre configuration

Si vous devez…Commencez parParamètres clés
Vérifier le format e-mail sur des champs texte personnalisésFormat ValidationPattern Type : Email, Include Blanks : OFF
Valider des codes à longueur fixeAdvanced Format ValidationPattern Type : Fixed Length, Include Blanks : ON
Valider un format URLFormat ValidationPattern Type : URL, Include Blanks : OFF
Appliquer un format métier personnaliséAdvanced Format ValidationPattern Type : Custom, entrer votre regex
Détecter déchet et bruit dans du texte libreAdvanced Format ValidationMotif large, se concentrer sur Noise Rate
Cadrer un nettoyage pour une intégrationAdvanced Format ValidationInclude Blanks : ON, utiliser Invalid Count et Noisy Records Count

Pour la référence complète, revenez à l’article principal Validité.

Passez l’évaluation de préparation à l’IA pour voir vos scores de validité.