Validité : scénarios de configuration

Ce que couvrent ces scénarios

Cette page déroule trois configurations réelles de l’analyse de validité DQS. Chaque scénario couvre un problème métier précis.

Ces pas à pas s’appuient sur les concepts de l’article principal Validité.

Scénario 1 : validation d’e-mails secondaires sur un champ texte personnalisé

Le problème

Votre organisation stocke une adresse e-mail secondaire dans un champ texte personnalisé Secondary_Email__c sur l’objet Contact. Contrairement au champ standard Email de Salesforce, un champ texte n’a aucune validation intégrée. Les utilisateurs collent, saisissent et importent n’importe quoi. Le marketing veut utiliser ces adresses pour une campagne de réengagement, mais personne ne sait combien sont structurellement valides.

Pourquoi pas le champ Email standard ? Le champ Email natif valide le format à la saisie. La validation DQS est utile sur des champs texte personnalisés qui stockent des e-mails sans l’application native.

Configuration

Utilisez le mode Format Validation sur Contact, en ciblant Secondary_Email__c.

Paramètre	Valeur	Pourquoi
Mode d’analyse	Format Validation	Vous voulez le taux de match et le Valid Count
Pattern Type	Email	Motif intégré : `^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$`
Include Blanks	OFF	Les e-mails vides relèvent de la complétude
Case Sensitive	OFF	Les adresses e-mail sont insensibles à la casse

Exemple de résultats

Métrique	Valeur
Validity Rate	71 %
Valid Count	35 500

Total Contacts : 50 000.

Lire les résultats

Commencez par la tête d’affiche : 71 % de validité. 29 % des adresses e-mail secondaires échouent au contrôle de format. Sur 50 000 Contacts renseignés, seules 35 500 ont une adresse structurellement valide.

À quoi ressemblent 29 % d’invalides : il manque un « @ » (john.company.com), un domaine (john@company), des doubles points (john@company..com) ou présence d’espaces. Comme c’est un champ texte, Salesforce les a tous acceptés.

Le calcul des campagnes change. Le marketing projette sur 50 000 adresses. L’audience réelle est de 35 500.

Que faire ensuite

Utilisez Valid Count (35 500) comme audience réelle. Cadrez un projet de nettoyage sur les 14 500 restants. Envisagez une Validation Rule Salesforce ou une conversion vers le type Email.

Scénario 2 : validation de codes produits à longueur fixe

Le problème

Votre entreprise utilise des codes produits de 8 caractères dans un champ Product_Code__c sur Opportunity Product. Ces codes pilotent les recherches d’inventaire, les règles de pricing et l’intégration ERP. La synchro ERP échoue sur environ 5 % des enregistrements chaque semaine.

Configuration

Utilisez le mode Advanced Format Validation sur Opportunity Product, en ciblant Product_Code__c.

Paramètre	Valeur	Pourquoi
Mode d’analyse	Advanced Format Validation	Vous voulez Invalid Count et Noise Rate
Pattern Type	Fixed Length	Les codes produits font toujours 8 caractères
Fixed Length	8	Votre longueur standard
Include Blanks	ON	Un code vide est invalide pour l’ERP
Case Sensitive	OFF	Pas dépendant de la casse

Exemple de résultats

Métriques fondamentales :

Métrique	Valeur
Validity Rate	94,2 %
Valid Count	9 420

Métriques avancées :

Métrique	Valeur
Invalid Rate	5,8 %
Invalid Count	580
Noise Rate	0,4 %
Noisy Records Count	40

Total : 10 000.

Lire les résultats

5,8 % d’invalides confirme l’estimation de l’équipe d’intégration. 580 codes ne respectent pas le format 8 caractères.

Invalid Count (580) est le périmètre de nettoyage. Les problèmes courants : codes tronqués (5 à 7 caractères), codes avec espaces finaux (9 caractères à cause d’un espace invisible), codes avec tirets ou préfixes ajoutés (« PC-12345678 »).

Noise Rate (0,4 %) est faible mais à noter. 40 enregistrements contiennent des motifs de bruit (« XXXXXXXX », « asdfghjk »). Ce ne sont pas des erreurs de format, mais du déchet de 8 caractères qui passe le contrôle de longueur.

Include Blanks ON compte ici. Un code vide casse l’intégration comme un code malformé.

Que faire ensuite

Exportez les 580 enregistrements invalides. Catégorisez par type d’erreur. Corrigez en masse. Ajoutez une Validation Rule imposant 8 caractères. Rescannez.

Scénario 3 : détection de bruit sur le nom d’entreprise web-to-lead

Le problème

Votre formulaire web-to-lead exige le champ Company. 20 000 nouveaux leads par trimestre. Mais l’équipe SDR signale que de nombreux leads ont des noms d’entreprise poubelle : « asdf », « test », « xxx » ou « na na na ». Un contrôle de complétude basique montre 98 % de Company renseignés.

Configuration

Utilisez le mode Advanced Format Validation sur Lead, en ciblant Company. Vous avez besoin de Noise Rate pour quantifier le déchet qui se cache derrière un score de complétude sain.

Paramètre	Valeur	Pourquoi
Mode d’analyse	Advanced Format Validation	Vous voulez Noise Rate et Noisy Records Count
Pattern Type	Custom	Aucun motif intégré pour les noms libres
Custom Pattern	`^.[a-zA-Z0-9].$`	Correspond à toute valeur contenant au moins un caractère alphanumérique
Include Blanks	ON	Les noms vides sont aussi un problème
Case Sensitive	OFF	Pas pertinent

La vraie valeur de ce scan est dans les métriques de bruit, pas dans la validation de format. Le motif est volontairement large.

Exemple de résultats

Métriques fondamentales :

Métrique	Valeur
Validity Rate	97,5 %
Valid Count	19 500

Métriques avancées :

Métrique	Valeur
Invalid Rate	2,5 %
Invalid Count	500
Noise Rate	12 %
Noisy Records Count	2 400

Total : 20 000.

Lire les résultats

97,5 % de validité est attendu et hors sujet. Presque chaque valeur passe le motif large. Les 500 invalides sont des entrées purement spéciales (« --- », « … »).

Noise Rate (12 %) est la vraie trouvaille. 2 400 leads ont des noms avec des motifs de bruit : caractères répétés, caractères spéciaux consécutifs.

L’image réelle :

Catégorie	Enregistrements	Ce que cela signifie
Propres et valides	17 100	Vrais noms d’entreprise
Invalides (déchet pur)	500	Aucun contenu alphanumérique
Bruyants (déchet caché)	2 400	Renseignés mais poubelle

Votre équipe SDR a raison. 2 900 leads sur 20 000 (14,5 %) ont des données entreprise inutilisables.

L’écart complétude vs validité. Complétude dit 98 %. Validité dit 97,5 %. Noise Rate dit 12 % de déchet. Chaque dimension révèle une couche différente.

Que faire ensuite

Construisez une file de nettoyage pour les 2 900 enregistrements combinés. Pour les 500 purement invalides, auto-supprimez ou mettez en quarantaine. Pour les 2 400 bruyants, décidez : auto-supprimer ou flaguer pour revue manuelle.

Corrigez la source. Le déchet vient de votre formulaire web. Ajoutez une validation côté client : longueur minimale, blocage des motifs à caractères répétés, envisagez un CAPTCHA.

Choisir votre configuration

Si vous devez…	Commencez par	Paramètres clés
Vérifier le format e-mail sur des champs texte personnalisés	Format Validation	Pattern Type : Email, Include Blanks : OFF
Valider des codes à longueur fixe	Advanced Format Validation	Pattern Type : Fixed Length, Include Blanks : ON
Valider un format URL	Format Validation	Pattern Type : URL, Include Blanks : OFF
Appliquer un format métier personnalisé	Advanced Format Validation	Pattern Type : Custom, entrer votre regex
Détecter déchet et bruit dans du texte libre	Advanced Format Validation	Motif large, se concentrer sur Noise Rate
Cadrer un nettoyage pour une intégration	Advanced Format Validation	Include Blanks : ON, utiliser Invalid Count et Noisy Records Count

Pour la référence complète, revenez à l’article principal Validité.

Passez l’évaluation de préparation à l’IA pour voir vos scores de validité.