Coerenza: scenari di configurazione

Cosa coprono questi scenari

Questa pagina illustra tre configurazioni reali di coerenza, dalla configurazione iniziale alla lettura dei risultati della scansione. Ogni scenario utilizza un contesto aziendale e una modalita di analisi diversi.

Questi scenari si basano sui concetti e sulle metriche trattati nell’articolo principale sulla Coerenza. Si consiglia di leggerlo prima se termini come Conformance Rate, Variant Count e Dominant Values sono nuovi.

Scenario 1: standardizzazione del campo Country con Discovery

Il contesto aziendale

L’organizzazione dispone di 15.000 record Account provenienti da 3 aziende fuse. Il campo Country e testo libero. Le dashboard regionali mostrano dati frammentati: «United States» appare come una riga, «USA» come un’altra, «US» come una terza. Le regole di assegnazione del territorio perdono record perche filtrano per una singola grafia. E necessario standardizzare, ma non si sa quali valori esistano nei tre sistemi legacy.

Guida alla configurazione

Iniziare con Import from Field per scoprire cosa contengono effettivamente i dati prima di definire i valori consentiti.

Aprire la configurazione Expected Values per il campo Country.
Fare clic su Import from Field. DQS interroga i dati live e restituisce i valori distinti ordinati per frequenza.
Esaminare la checklist. L’importazione rivela il quadro completo:

Valore	Record
United States	4.500
USA	2.300
US	1.800
Canada	1.400
U.S.A.	450
United States of America	150
… (altre 41 variazioni)	…

Decidere lo standard. I codici paese ISO («US», «CA», «UK») sono compatti, standard di settore e non ambigui. Selezionare i codici ISO dall’elenco di importazione.
Fare clic su Add Selected per popolare i valori consentiti.

Impostare la configurazione rimanente:

Impostazione	Valore	Motivazione
Analysis Mode	Advanced Conformance Analysis	Servono i conteggi delle varianti e i valori dominanti per dimensionare il cleanup
Expected Values	US, CA, UK, DE, FR, AU, JP	Codici ISO per i mercati attivi
Case Sensitive	OFF	Intercetta «us», «Us» e «US» come lo stesso valore
Top N	10	Visualizza le variazioni piu comuni
Min Frequency	5	Filtra i refusi occasionali

Cosa produce la scansione

Metrica	Valore
Conformance Rate	12%
Conformance Count	1.800
Non-Conforming Count	13.200
Variant Count	47
Dominant Values	I primi 10 valori con conteggi (vedere la tabella di importazione sopra)

Lettura dei risultati

Il 12% di conformita e atteso. E stato definito un nuovo standard (codici ISO) a cui i dati non sono mai stati normalizzati. Solo i 1.800 record che contengono gia «US» corrispondono. Non si tratta di un punteggio negativo. E il punto di partenza.

47 varianti rivelano l’entita della frammentazione. Tre sistemi fusi hanno prodotto 47 modi diversi di esprimere i nomi dei paesi. Senza questo numero, si sottostimerebbe l’impegno di cleanup.

Dominant Values mostra dove concentrarsi. Le prime 3 variazioni («United States», «USA», «US») rappresentano 8.600 record. Standardizzare solo questi tre valori porta la conformita dal 12% al 69%. Partire da li.

Non-Conforming Count (13.200) e l’ambito esatto del cleanup. Il data steward dispone ora di una dimensione concreta del progetto, non di una stima.

Azione successiva

Costruire una tabella di mappatura dei valori utilizzando l’output dei Dominant Values. Mappare «United States» a «US», «USA» a «US» e cosi via. Eseguire la normalizzazione dei dati. Eseguire una nuova scansione per verificare il nuovo Conformance Rate.

Scenario 2: validazione del Lead Rating

Il contesto aziendale

Il campo Lead Rating (Rating__c) e un campo di testo che accetta «Hot», «Warm» o «Cold». I sales manager segnalano valori anomali nei report della pipeline. Un filtro per Rating = "Hot" restituisce meno record del previsto. Serve un audit rapido di conformita per scoprire cosa contiene il campo e quanti record necessitano di cleanup.

Guida alla configurazione

Iniziare con Import from Field per visualizzare i valori effettivi prima di configurare la scansione.

Aprire la configurazione Expected Values per Rating__c.
Fare clic su Import from Field. L’importazione restituisce:

Valore	Record
Hot	284
Warm	198
Cold	156
Very High	23
240 km/h	12
N/A	8

I primi tre valori sono le valutazioni reali. «Very High» proviene da una picklist diversa (qualcuno ha incollato dal campo sbagliato). «240 km/h» e chiaramente un dato dal campo completamente sbagliato. «N/A» e un segnaposto.

Selezionare «Hot», «Warm» e «Cold». Lasciare il resto deselezionato.
Fare clic su Add Selected.

Impostare la configurazione rimanente:

Impostazione	Valore	Motivazione
Analysis Mode	Conformance Check	Serve una risposta si/no, non un’analisi approfondita
Expected Values	Hot, Warm, Cold	Le tre valutazioni valide
Case Sensitive	OFF	Intercetta «hot», «HOT» e «Hot» come corrispondenti

Cosa produce la scansione

Metrica	Valore
Conformance Rate	93,7%
Conformance Count	638

Lettura dei risultati

Il 93,7% e conforme. Cio significa che 43 record contengono dati errati. Per un audit rapido, la modalita Conformance Check fornisce la risposta velocemente senza calcolare metriche avanzate.

Il passaggio Import from Field ha gia mostrato l’aspetto dei dati errati. «Very High» (23 record da un valore di picklist sbagliato), «240 km/h» (12 record con dati dal campo sbagliato) e «N/A» (8 voci segnaposto). Non servono i Dominant Values perche l’importazione ha fornito la suddivisione prima ancora dell’esecuzione della scansione.

43 record sono un cleanup gestibile. Non si tratta di un progetto di migrazione dati. E una correzione manuale di 30 minuti o un singolo job di aggiornamento dati.

Azione successiva

Correggere i 43 record non conformi. Quindi convertire Rating__c da campo di testo a picklist per prevenire problemi futuri. I record creati via API bypassano la validazione delle picklist, quindi eseguire scansioni periodiche di coerenza per intercettare nuove variazioni dalle integrazioni.

Scenario 3: conformita del Job Title per il targeting delle Persona

Il contesto aziendale

Il team marketing esegue campagne basate sulle Persona, rivolgendosi ai Contact con titolo «VP e superiori». Il campo Title e testo libero con migliaia di variazioni. Prima di ogni campagna, qualcuno cerca manualmente le parole chiave dei titoli, ne perde la meta e costruisce un elenco di audience incompleto. Il team necessita di una risposta basata sui dati a due domande: «Quanti contatti VP+ abbiamo?» e «Quali titoli hanno gli altri nostri contatti?»

Guida alla configurazione

Aprire la configurazione Expected Values per il campo Title sui Contact.
Fare clic su Import from Field. L’importazione restituisce centinaia di valori. Troppi per controllarli singolarmente, ma i conteggi di frequenza sono utili per il contesto.
Definire i valori consentiti in base alla mappatura delle Persona. Selezionare o digitare i valori dei titoli che il team considera «VP e superiori»:

VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President

Fare clic su Add Selected.

Impostare la configurazione rimanente:

Impostazione	Valore	Motivazione
Analysis Mode	Advanced Conformance Analysis	Serve la distribuzione completa dei valori per vedere quali titoli esistono
Expected Values	(16 valori di titolo elencati sopra)	La definizione della Persona VP+
Case Sensitive	OFF	Intercetta «vp of sales», «VP of Sales», «VP OF SALES»
Top N	20	Visualizza un’ampia distribuzione di cio che esiste
Min Frequency	5	Filtra le voci occasionali come «Chief Happiness Officer»

Cosa produce la scansione

Metrica	Valore
Conformance Rate	34%
Conformance Count	3.400
Non-Conforming Count	6.600
Variant Count	312

Dominant Values (Top 20):

Posizione	Valore	Conteggio
1	Manager	820
2	Sales Representative	650
3	Account Executive	480
4	Director of Marketing	340
5	VP of Sales	290
6	Senior Manager	275
7	Consultant	240
8	Engineer	210
9	CEO	195
10	Head of Operations	180
…	(altri 10)	…

Lettura dei risultati

Il 34% di conformita non e un insuccesso. Non si tratta di un problema di qualita dei dati. Significa che il 34% dei Contact ha titoli VP+, e quello e il pubblico target della campagna. Il numero risponde alla domanda che il team marketing stava stimando a occhio.

312 Variant Count conferma che il Title in testo libero e altamente frammentato. 312 valori distinti di titolo su 10.000 Contact. Questo e normale per i campi a testo libero e spiega perche le ricerche manuali perdono persone.

Dominant Values mostra quali titoli hanno effettivamente i Contact. Molti dei valori in cima sono sotto il livello VP (Manager, Sales Rep, Account Executive). Questo e atteso. Questi contatti sono record validi con titoli validi. Rientrano al di fuori della Persona target.

Non-Conforming Count (6.600) NON e un ambito di cleanup. A differenza dello scenario Country, questi non sono record sporchi. Sono contatti con titoli al di fuori del filtro VP+. «Manager» e un titolo reale, non un errore nei dati. Trattare il Non-Conforming Count come «contatti al di fuori di questa Persona», non «record da correggere».

Il vero insight: ora si dispone di una dimensione dell’audience basata sui dati. 3.400 contatti VP+, verificati tramite la scansione dei dati reali. Niente piu ricerche manuali per parola chiave.

Azione successiva

Utilizzare il Conformance Count (3.400) come dimensione dell’audience per le campagne VP+. Esaminare l’elenco dei Dominant Values per i titoli eventualmente mancanti. «Senior Manager» (275 record) e «Head of Operations» (180 record) sono al limite. Se questi ruoli sono idonei per le campagne, aggiungerli ai valori consentiti e ripetere la scansione.

Scelta della configurazione

Se e necessario…	Partire da	Impostazioni chiave
Verificare un campo controllato (picklist, rating, stato)	Import from Field, poi Conformance Check	Expected Values dall’importazione, Case Sensitive OFF
Standardizzare un campo frammentato (paese, settore)	Import from Field, poi Advanced Conformance Analysis	Expected Values come standard obiettivo, Top N 10+, Min Frequency 5+
Dimensionare un’audience o un segmento da dati a testo libero	Import from Field, poi Advanced Conformance Analysis	Expected Values come definizione del segmento, Top N 20, Min Frequency 5
Ottenere una baseline rapida prima di un progetto di cleanup	Import from Field, poi Conformance Check	Expected Values dal proprio standard dati

Per una spiegazione completa di tutte le 6 metriche di coerenza, le modalita di analisi e gli input di configurazione, tornare all’articolo principale sulla Coerenza.

Pronti a misurare la qualita dei propri dati? Effettuare la Valutazione di preparazione all’IA per vedere i punteggi di coerenza e altro ancora.