Skip to main content

Completezza

Tutte le 10 metriche di completezza misurate da DQS, il flusso diagnostico per individuare i dati mancanti e come configurare l'analisi della completezza.

Che cos’è la completezza?

La completezza misura se i dati sono effettivamente presenti. Un campo è completo quando contiene dati significativi. Un campo è incompleto quando è nullo, vuoto o contiene un valore segnaposto come «N/A» o «TBD».

La completezza è la dimensione più fondamentale della qualità dei dati. Senza dati, non c’è nulla da validare, deduplicare o analizzare.

Tasso di completezza = (Record con dati / Record totali) x 100

Se 850 dei 1.000 record Contact contengono un valore Email, il tasso di completezza dell’Email è dell’85%. Questa metrica (a volte chiamata tasso di riempimento) è il dato principale per qualsiasi campo.

Perché la completezza è importante

Reportistica

I dati incompleti distorcono l’analisi. Quando il 40% dei record Account non ha un valore per il campo Industry, qualsiasi report raggruppato per Industry mostra solo una verità parziale. Le dashboard diventano inaffidabili. Le decisioni dei dirigenti si basano su una frazione del quadro complessivo.

Automazione

L’automazione di Salesforce dipende dai valori dei campi. Un workflow che invia e-mail fallisce quando il campo Email è vuoto. Un processo che aggiorna l’Account Owner fallisce quando il campo di lookup è nullo. Ogni valore mancante rappresenta un potenziale errore di automazione.

AI e Agentforce

I modelli di AI apprendono dai dati. Quando i campi sono vuoti, il modello non ha nulla da cui apprendere. Agentforce utilizza i dati di Salesforce per generare risposte e compiere azioni. I dati mancanti comportano un contesto incompleto e risultati AI meno utili.

SistemaImpatto della completezza
ReportI dati parziali producono metriche distorte
WorkflowI valori mancanti causano fallimenti dei processi
Regole di deduplicazioneI record incompleti sono più difficili da confrontare
AgentforceLe lacune nel contesto riducono la precisione dell’AI

Come DQS misura la completezza

DQS produce 10 metriche di completezza organizzate attorno a una domanda diagnostica: «Dove mancano i dati, perché mancano e i dati presenti sono effettivamente utili?»

Si pensi a queste metriche come a un flusso diagnostico. Ogni passaggio si basa sul precedente.

Passaggio 1: Quanto è completo?

Il Tasso di completezza è la metrica principale. Calcola la percentuale di record in cui il campo contiene un valore non vuoto e non nullo. È il numero da inserire in una dashboard.

Si esegue una scansione sull’oggetto Account. Il campo Industry mostra un tasso di completezza del 62%. Ciò significa che il 38% degli Account non ha alcun valore per il settore, il che implica che i report di segmentazione, le regole di assegnazione territoriale e le campagne di marketing filtrate per settore operano tutti con dati incompleti.

Ogni altra metrica di completezza esiste per spiegare perché questo numero non è al 100%.

Passaggio 2: Qual è la dimensione del problema?

I tassi indicano la gravità. I conteggi indicano il carico di lavoro. Il Conteggio popolati risponde alla domanda sulla dimensione: quanti record hanno effettivamente un valore. Da utilizzare per la reportistica sulla copertura e per dimensionare la lacuna rispetto al numero totale di record: la differenza tra il totale e il Conteggio popolati è l’arretrato di pulizia.

Esempio: Il responsabile della qualità dei dati deve creare una campagna di pulizia. Con 50.000 Contact e un Conteggio popolati di 35.800 sul campo Phone, sa che 14.200 record necessitano di arricchimento, può stimare i costi con un fornitore di dati e può stabilire una tempistica realistica.

Passaggio 3: Perché è incompleto?

Tre metriche analizzano la causa dell’incompletezza. Ciascuna indica un diverso problema di origine.

Conteggio nulli e Tasso di nulli misurano i record in cui il campo ha un vero valore nullo nel database, il che significa che il campo non è mai stato compilato. In Salesforce, nullo e stringa vuota sono due stati diversi. Un campo mai modificato è nullo. Un campo svuotato esplicitamente è una stringa vuota. Questa distinzione indica se i dati non sono mai stati acquisiti oppure sono stati rimossi deliberatamente.

Esempio: Dopo una migrazione dati, il campo Fax sugli Account mostra un Tasso di nulli del 45%. I dati del fax non sono mai stati migrati dal sistema legacy (nullo = mai esistito) anziché essere stati acquisiti e successivamente cancellati. Un Tasso di nulli elevato indirizza l’attenzione verso il sistema di origine, non verso il comportamento degli utenti.

Conteggio segnaposto e Tasso di segnaposto misurano i record contenenti valori segnaposto noti come «N/A», «TBD», «Unknown» o qualsiasi valore personalizzato definito dall’utente. Questi valori sembrano dati ma non trasportano alcuna informazione reale.

Esempio: I dati globali degli Account mostrano un Tasso di completezza del 94% sul campo Industry. Sulla carta sembra ottimo. Ma il Tasso di segnaposto rivela che il 18% di quei valori «popolati» sono in realtà «N/A», «Other» o «Unknown». La completezza reale è più vicina al 76%. Questa è la metrica che trasforma una dashboard verde in rossa.

Passaggio 4: I dati «completi» sono utili?

I primi tre passaggi identificano ciò che manca. Il passaggio 4 pone una domanda più difficile: i dati che sono presenti valgono davvero qualcosa?

Il Conteggio incompleti è la misura più ampia dei dati mancanti. Combina tutte le forme di incompletezza: nulli, vuoti e valori segnaposto. Quando il rilevamento dei segnaposto è attivo, il Conteggio incompleti è sempre maggiore o uguale al solo Conteggio nulli, perché cattura anche le voci composte da soli spazi e i segnaposto.

Esempio: Il campo Description sulle Opportunity mostra un Conteggio nulli di 500 ma un Conteggio incompleti di 1.800. La differenza? 1.300 record hanno descrizioni come «TBD», «N/A» o «---». Quei record sono tecnicamente compilati ma praticamente inutili. Senza questa metrica, si penserebbe di avere solo 500 record da correggere invece di 1.800.

Il Rapporto testo ricco misura la percentuale di record di campi testo che contengono contenuti sostanziali al di sopra di una soglia di caratteri. Separa i campi con prosa significativa da quelli con poche parole. Un campo Description è «popolato» sia che contenga «Buon cliente» sia che contenga un piano di gestione Account di tre paragrafi. Per la prontezza AI, la profondità del contenuto conta tanto quanto la sua presenza.

Esempio: La Sua azienda sta valutando uno strumento AI che riassume le descrizioni dei Case. Si esegue la scansione del campo Description sui Case: 88% di Tasso di completezza, ma solo 31% di Rapporto testo ricco. Solo il 31% delle descrizioni dei Case ha contenuto sufficiente per il funzionamento dell’AI. Il resto sono voci come «richiamare», «vedi e-mail» o «problema segnalato». Il progetto AI necessita di una fase di arricchimento dati prima di poter generare valore.

L’Utilizzo del campo testo misura quanta parte della capacità di caratteri disponibile di un campo testo viene effettivamente utilizzata. Un campo Long Text Area con una capacità di 32.000 caratteri in cui la voce media è di 45 caratteri ha un utilizzo molto basso.

L’Utilizzo medio fornisce la percentuale media della lunghezza del campo utilizzata su tutti i record. Insieme all’Utilizzo del campo testo, delinea un quadro completo sull’adeguatezza delle dimensioni dei campi testo.

Esempio: Durante una valutazione dell’organizzazione, l’Utilizzo del campo testo rivela che Notes__c (un Long Text Area, 131.072 caratteri) ha un utilizzo medio del 3,2%, con la maggior parte delle voci sotto i 200 caratteri. Nel frattempo, Short_Description__c (Text, 255 caratteri) mostra un utilizzo del 94% con frequenti problemi di troncamento. Lo schema necessita di un ridimensionamento: il Long Text Area è sovradimensionato e il campo Text è troppo piccolo.

Nota: L’Utilizzo del campo testo e l’Utilizzo medio si applicano solo ai campi String e TextArea, poiché sono i tipi di campo con una capacità di caratteri definita rispetto alla quale effettuare la misurazione.

Perché tassi e conteggi sono in coppia

La maggior parte delle metriche è disponibile come tasso (percentuale) e conteggio (numero assoluto). Questo è intenzionale:

  • I tassi servono per dashboard, reportistica dirigenziale e monitoraggio delle tendenze. «La completezza è migliorata dal 72% all’89% in questo trimestre.»
  • I conteggi servono per la pianificazione dei progetti, la stima del carico di lavoro e il dimensionamento delle operazioni di pulizia. «Abbiamo 14.200 record da correggere.»

Si utilizzino i tassi per comunicare i progressi. Si utilizzino i conteggi per pianificare il lavoro.

Riferimento metriche

Metriche fondamentali

Queste 5 metriche costituiscono la base di ogni analisi di completezza. Funzionano praticamente su tutti i tipi di campo.

MetricaTipoSi applica a
Tasso di completezzaPercentualeTutti i tipi di campo
Conteggio popolatiConteggioTutti i tipi di campo
Conteggio incompletiConteggioTutti i tipi di campo
Tasso di nulliPercentualeTutti i tipi di campo
Conteggio nulliConteggioTutti i tipi di campo

Metriche contestuali

Queste 5 metriche vanno oltre il «c’è?» per chiedersi «è significativo?» Richiedono la modalità di analisi Completezza contestuale.

MetricaTipoSi applica a
Tasso di segnapostoPercentualeSolo campi testo
Conteggio segnapostoConteggioSolo campi testo
Rapporto testo riccoPercentualeSolo campi testo
Utilizzo del campo testoPercentualeSolo String e TextArea
Utilizzo medioPercentualeSolo String e TextArea

Copertura per tipo di campo

DQS supporta controlli di completezza su tutti i tipi di campo standard di Salesforce:

Gruppo di coperturaTipi di campoMetriche disponibili
Tutti i tipi (20)String, TextArea, LongTextArea, Html, EncryptedText, Picklist, Multipicklist, Email, Phone, URL, Reference (Lookup), Date, DateTime, Double, Integer, Currency, Percent, Boolean, Combobox, IdTasso di completezza, Conteggio popolati/incompleti, Tasso/Conteggio nulli
Campi testo (8)Text, TextArea, LongTextArea, Html, EncryptedText, Email, Phone, URLQuanto sopra + Tasso/Conteggio segnaposto, Rapporto testo ricco
String e TextArea (2)String, TextAreaQuanto sopra + Utilizzo del campo testo, Utilizzo medio

Due modalità di analisi

DQS offre due modalità di analisi della completezza:

Completezza di base risponde alla domanda: «I campi sono compilati?» Produce le 5 metriche fondamentali e copre gli elementi essenziali di cui ogni organizzazione ha bisogno per un controllo dell’igiene dei dati o un audit rapido.

Completezza contestuale va più in profondità. Produce tutte e 10 le metriche, incluso il rilevamento dei segnaposto, l’analisi del testo ricco e l’utilizzo dei campi. Si utilizzi questa modalità quando è necessario distinguere tra dati presenti e dati utili.

Esigenza aziendaleModalità consigliata
Controllo rapido dell’igiene o audit di baseCompletezza di base
Valutazione della migrazione datiContestuale (il rilevamento dei segnaposto intercetta dati fittizi provenienti dai sistemi legacy)
Valutazione della prontezza AIContestuale (il Rapporto testo ricco e le metriche di utilizzo valutano la profondità dei contenuti)
Governance dei dati continuativaIniziare con la Completezza di base, passare alla Contestuale quando si è pronti per un’analisi più approfondita

Configurazione della completezza

DQS fornisce quattro parametri di configurazione per la completezza. Ciascuno può essere impostato a livello globale (si applica a tutti i campi) e sovrascritto a livello di singolo campo.

ImpostazioneCosa controlla
Vuoti come incompletiQuando abilitato, DQS tratta le stringhe vuote e i valori composti solo da spazi come incompleti. Predefinito: abilitato.
Segnaposto come incompletiQuando abilitato, DQS tratta i valori segnaposto (come «N/A» o «TBD») come incompleti. Predefinito: disabilitato.
Valori segnapostoL’elenco di stringhe che DQS tratta come segnaposto. Si definiscono in base ai modelli di inserimento dati della propria organizzazione (ad es. N/A, TBD, Unknown, --, 000-000-0000).
Segnaposto con distinzione maiuscole/minuscoleControlla se il confronto dei segnaposto distingue tra maiuscole e minuscole. Quando abilitato, «tbd» e «TBD» vengono trattati come valori diversi. Predefinito: con distinzione maiuscole/minuscole.

Suggerimento: Si inizi con i segnaposto comuni («N/A», «TBD», «Unknown», «—») e si aggiungano valori specifici dell’organizzazione man mano che li si scopre nei risultati delle scansioni.

Problemi comuni di completezza

Campi opzionali mai compilati

Quando i campi sono opzionali, gli utenti li saltano. Nel tempo, campi preziosi come Descrizione azienda o URL LinkedIn presentano tassi di completezza prossimi allo zero.

Soluzione: Rendere obbligatori i campi critici oppure creare suggerimenti durante la modifica dei record.

Importazioni di massa con lacune

Le migrazioni dati e le importazioni di liste spesso mancano di valori per determinati campi. Una lista di contatti acquistata non ha un’associazione Account. Un’esportazione da un sistema legacy manca di valori Industry standardizzati.

Soluzione: Verificare le importazioni prima del caricamento. Utilizzare DQS per stabilire valori di riferimento e monitorare i miglioramenti dopo ogni importazione.

Abuso di segnaposto

Gli utenti inseriscono «N/A» o «TBD» per superare le Validation Rule. Il campo appare completo ma non contiene dati utilizzabili. I report standard contano questi valori come popolati.

Soluzione: Abilitare il rilevamento dei segnaposto e definire il proprio elenco di valori segnaposto. Rivedere e aggiornare i valori segnaposto durante la manutenzione periodica dei dati.

Riempimento con spazi

Alcune integrazioni o l’inserimento manuale lasciano campi con soli spazi. Salesforce li conta come «compilati» ma non contengono nulla di utile.

Soluzione: Abilitare il rilevamento dei vuoti per intercettare i valori composti solo da spazi.

Buone pratiche

Dare priorità in base all’impatto aziendale

Non tutti i campi necessitano di un’elevata completezza. Concentrarsi sui campi che guidano l’automazione, compaiono nelle dashboard dirigenziali, alimentano l’AI e Agentforce o supportano i requisiti di conformità.

Monitorare le tendenze nel tempo

Un singolo punteggio di completezza è un’istantanea. Monitorare i punteggi su più scansioni per rilevare precocemente il degrado, misurare le iniziative di miglioramento e identificare le fonti di dati problematiche.

Affrontare le cause profonde

Una bassa completezza segnala un problema di processo. Indagare se gli utenti saltano i campi, se le importazioni mancano di dati o se le integrazioni falliscono silenziosamente. Correggere la fonte, non solo il sintomo.

Utilizzare il flusso diagnostico

Non fermarsi al Tasso di completezza. Percorrere il flusso: verificare la dimensione del problema (Conteggio popolati), identificare la causa (Nulli vs Segnaposto), poi valutare la qualità del contenuto (Rapporto testo ricco, Utilizzo). Ogni passaggio rivela un diverso tipo di problema con una diversa soluzione.

Passaggi successivi

Ora si comprendono le modalità di misurazione e miglioramento della completezza. Si prosegua con la dimensione successiva: