Skip to main content

Coerenza: scenari di configurazione

Tre guide pratiche passo-passo che mostrano come configurare l'analisi di coerenza di DQS per diverse esigenze aziendali.

Cosa coprono questi scenari

Questa pagina illustra tre configurazioni reali di coerenza, dalla configurazione iniziale alla lettura dei risultati della scansione. Ogni scenario utilizza un contesto aziendale e una modalita di analisi diversi.

Questi scenari si basano sui concetti e sulle metriche trattati nell’articolo principale sulla Coerenza. Si consiglia di leggerlo prima se termini come Conformance Rate, Variant Count e Dominant Values sono nuovi.

Scenario 1: standardizzazione del campo Country con Discovery

Il contesto aziendale

L’organizzazione dispone di 15.000 record Account provenienti da 3 aziende fuse. Il campo Country e testo libero. Le dashboard regionali mostrano dati frammentati: «United States» appare come una riga, «USA» come un’altra, «US» come una terza. Le regole di assegnazione del territorio perdono record perche filtrano per una singola grafia. E necessario standardizzare, ma non si sa quali valori esistano nei tre sistemi legacy.

Guida alla configurazione

Iniziare con Import from Field per scoprire cosa contengono effettivamente i dati prima di definire i valori consentiti.

  1. Aprire la configurazione Expected Values per il campo Country.
  2. Fare clic su Import from Field. DQS interroga i dati live e restituisce i valori distinti ordinati per frequenza.
  3. Esaminare la checklist. L’importazione rivela il quadro completo:
ValoreRecord
United States4.500
USA2.300
US1.800
Canada1.400
U.S.A.450
United States of America150
… (altre 41 variazioni)
  1. Decidere lo standard. I codici paese ISO («US», «CA», «UK») sono compatti, standard di settore e non ambigui. Selezionare i codici ISO dall’elenco di importazione.
  2. Fare clic su Add Selected per popolare i valori consentiti.

Impostare la configurazione rimanente:

ImpostazioneValoreMotivazione
Analysis ModeAdvanced Conformance AnalysisServono i conteggi delle varianti e i valori dominanti per dimensionare il cleanup
Expected ValuesUS, CA, UK, DE, FR, AU, JPCodici ISO per i mercati attivi
Case SensitiveOFFIntercetta «us», «Us» e «US» come lo stesso valore
Top N10Visualizza le variazioni piu comuni
Min Frequency5Filtra i refusi occasionali

Cosa produce la scansione

MetricaValore
Conformance Rate12%
Conformance Count1.800
Non-Conforming Count13.200
Variant Count47
Dominant ValuesI primi 10 valori con conteggi (vedere la tabella di importazione sopra)

Lettura dei risultati

Il 12% di conformita e atteso. E stato definito un nuovo standard (codici ISO) a cui i dati non sono mai stati normalizzati. Solo i 1.800 record che contengono gia «US» corrispondono. Non si tratta di un punteggio negativo. E il punto di partenza.

47 varianti rivelano l’entita della frammentazione. Tre sistemi fusi hanno prodotto 47 modi diversi di esprimere i nomi dei paesi. Senza questo numero, si sottostimerebbe l’impegno di cleanup.

Dominant Values mostra dove concentrarsi. Le prime 3 variazioni («United States», «USA», «US») rappresentano 8.600 record. Standardizzare solo questi tre valori porta la conformita dal 12% al 69%. Partire da li.

Non-Conforming Count (13.200) e l’ambito esatto del cleanup. Il data steward dispone ora di una dimensione concreta del progetto, non di una stima.

Azione successiva

Costruire una tabella di mappatura dei valori utilizzando l’output dei Dominant Values. Mappare «United States» a «US», «USA» a «US» e cosi via. Eseguire la normalizzazione dei dati. Eseguire una nuova scansione per verificare il nuovo Conformance Rate.

Scenario 2: validazione del Lead Rating

Il contesto aziendale

Il campo Lead Rating (Rating__c) e un campo di testo che accetta «Hot», «Warm» o «Cold». I sales manager segnalano valori anomali nei report della pipeline. Un filtro per Rating = "Hot" restituisce meno record del previsto. Serve un audit rapido di conformita per scoprire cosa contiene il campo e quanti record necessitano di cleanup.

Guida alla configurazione

Iniziare con Import from Field per visualizzare i valori effettivi prima di configurare la scansione.

  1. Aprire la configurazione Expected Values per Rating__c.
  2. Fare clic su Import from Field. L’importazione restituisce:
ValoreRecord
Hot284
Warm198
Cold156
Very High23
240 km/h12
N/A8

I primi tre valori sono le valutazioni reali. «Very High» proviene da una picklist diversa (qualcuno ha incollato dal campo sbagliato). «240 km/h» e chiaramente un dato dal campo completamente sbagliato. «N/A» e un segnaposto.

  1. Selezionare «Hot», «Warm» e «Cold». Lasciare il resto deselezionato.
  2. Fare clic su Add Selected.

Impostare la configurazione rimanente:

ImpostazioneValoreMotivazione
Analysis ModeConformance CheckServe una risposta si/no, non un’analisi approfondita
Expected ValuesHot, Warm, ColdLe tre valutazioni valide
Case SensitiveOFFIntercetta «hot», «HOT» e «Hot» come corrispondenti

Cosa produce la scansione

MetricaValore
Conformance Rate93,7%
Conformance Count638

Lettura dei risultati

Il 93,7% e conforme. Cio significa che 43 record contengono dati errati. Per un audit rapido, la modalita Conformance Check fornisce la risposta velocemente senza calcolare metriche avanzate.

Il passaggio Import from Field ha gia mostrato l’aspetto dei dati errati. «Very High» (23 record da un valore di picklist sbagliato), «240 km/h» (12 record con dati dal campo sbagliato) e «N/A» (8 voci segnaposto). Non servono i Dominant Values perche l’importazione ha fornito la suddivisione prima ancora dell’esecuzione della scansione.

43 record sono un cleanup gestibile. Non si tratta di un progetto di migrazione dati. E una correzione manuale di 30 minuti o un singolo job di aggiornamento dati.

Azione successiva

Correggere i 43 record non conformi. Quindi convertire Rating__c da campo di testo a picklist per prevenire problemi futuri. I record creati via API bypassano la validazione delle picklist, quindi eseguire scansioni periodiche di coerenza per intercettare nuove variazioni dalle integrazioni.

Scenario 3: conformita del Job Title per il targeting delle Persona

Il contesto aziendale

Il team marketing esegue campagne basate sulle Persona, rivolgendosi ai Contact con titolo «VP e superiori». Il campo Title e testo libero con migliaia di variazioni. Prima di ogni campagna, qualcuno cerca manualmente le parole chiave dei titoli, ne perde la meta e costruisce un elenco di audience incompleto. Il team necessita di una risposta basata sui dati a due domande: «Quanti contatti VP+ abbiamo?» e «Quali titoli hanno gli altri nostri contatti?»

Guida alla configurazione

  1. Aprire la configurazione Expected Values per il campo Title sui Contact.
  2. Fare clic su Import from Field. L’importazione restituisce centinaia di valori. Troppi per controllarli singolarmente, ma i conteggi di frequenza sono utili per il contesto.
  3. Definire i valori consentiti in base alla mappatura delle Persona. Selezionare o digitare i valori dei titoli che il team considera «VP e superiori»:
VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President
  1. Fare clic su Add Selected.

Impostare la configurazione rimanente:

ImpostazioneValoreMotivazione
Analysis ModeAdvanced Conformance AnalysisServe la distribuzione completa dei valori per vedere quali titoli esistono
Expected Values(16 valori di titolo elencati sopra)La definizione della Persona VP+
Case SensitiveOFFIntercetta «vp of sales», «VP of Sales», «VP OF SALES»
Top N20Visualizza un’ampia distribuzione di cio che esiste
Min Frequency5Filtra le voci occasionali come «Chief Happiness Officer»

Cosa produce la scansione

MetricaValore
Conformance Rate34%
Conformance Count3.400
Non-Conforming Count6.600
Variant Count312

Dominant Values (Top 20):

PosizioneValoreConteggio
1Manager820
2Sales Representative650
3Account Executive480
4Director of Marketing340
5VP of Sales290
6Senior Manager275
7Consultant240
8Engineer210
9CEO195
10Head of Operations180
(altri 10)

Lettura dei risultati

Il 34% di conformita non e un insuccesso. Non si tratta di un problema di qualita dei dati. Significa che il 34% dei Contact ha titoli VP+, e quello e il pubblico target della campagna. Il numero risponde alla domanda che il team marketing stava stimando a occhio.

312 Variant Count conferma che il Title in testo libero e altamente frammentato. 312 valori distinti di titolo su 10.000 Contact. Questo e normale per i campi a testo libero e spiega perche le ricerche manuali perdono persone.

Dominant Values mostra quali titoli hanno effettivamente i Contact. Molti dei valori in cima sono sotto il livello VP (Manager, Sales Rep, Account Executive). Questo e atteso. Questi contatti sono record validi con titoli validi. Rientrano al di fuori della Persona target.

Non-Conforming Count (6.600) NON e un ambito di cleanup. A differenza dello scenario Country, questi non sono record sporchi. Sono contatti con titoli al di fuori del filtro VP+. «Manager» e un titolo reale, non un errore nei dati. Trattare il Non-Conforming Count come «contatti al di fuori di questa Persona», non «record da correggere».

Il vero insight: ora si dispone di una dimensione dell’audience basata sui dati. 3.400 contatti VP+, verificati tramite la scansione dei dati reali. Niente piu ricerche manuali per parola chiave.

Azione successiva

Utilizzare il Conformance Count (3.400) come dimensione dell’audience per le campagne VP+. Esaminare l’elenco dei Dominant Values per i titoli eventualmente mancanti. «Senior Manager» (275 record) e «Head of Operations» (180 record) sono al limite. Se questi ruoli sono idonei per le campagne, aggiungerli ai valori consentiti e ripetere la scansione.

Scelta della configurazione

Se e necessario…Partire daImpostazioni chiave
Verificare un campo controllato (picklist, rating, stato)Import from Field, poi Conformance CheckExpected Values dall’importazione, Case Sensitive OFF
Standardizzare un campo frammentato (paese, settore)Import from Field, poi Advanced Conformance AnalysisExpected Values come standard obiettivo, Top N 10+, Min Frequency 5+
Dimensionare un’audience o un segmento da dati a testo liberoImport from Field, poi Advanced Conformance AnalysisExpected Values come definizione del segmento, Top N 20, Min Frequency 5
Ottenere una baseline rapida prima di un progetto di cleanupImport from Field, poi Conformance CheckExpected Values dal proprio standard dati

Per una spiegazione completa di tutte le 6 metriche di coerenza, le modalita di analisi e gli input di configurazione, tornare all’articolo principale sulla Coerenza.

Pronti a misurare la qualita dei propri dati? Effettuare la Valutazione di preparazione all’IA per vedere i punteggi di coerenza e altro ancora.