Skip to main content

Che cos'è la qualità dei dati?

Che cosa significa qualità dei dati, come misurarla e perché determina il successo delle iniziative di reportistica, automazione e AI.

Definire la qualità dei dati

La qualità dei dati misura quanto bene i dati servono lo scopo previsto. Non si tratta di stabilire se i dati siano «corretti» in termini assoluti. Si tratta di stabilire se i dati sono idonei all’uso nel processo decisionale, nelle operazioni e nell’analisi.

Un indirizzo del cliente è di alta qualità se raggiunge il cliente. Un codice prodotto è di alta qualità se i sistemi lo riconoscono. La qualità dipende dal contesto.

Il principio dell’«idoneità allo scopo»

La qualità dei dati è contestuale. Un indirizzo di spedizione necessita di precisione a livello stradale. Una regione di marketing necessita solo del Paese o della regione. Entrambi possono essere «di alta qualità» a diversi livelli di precisione.

Quando si valuta la qualità dei dati, ci si chieda: cosa devono fare questi dati? Poi si misuri se possono farlo.

Il framework delle cinque dimensioni

La qualità dei dati viene misurata attraverso cinque dimensioni chiave. Questo framework è stato adottato in tutti i settori e costituisce la base degli standard ISO 8000 e DAMA.

DimensioneCosa misuraEsempio
CompletezzaI dati richiesti sono presentiTutti i campi obbligatori sono compilati
ValiditàI dati sono conformi ai formatiGli indirizzi e-mail hanno un formato valido
UnicitàNon ci sono record duplicatiUn record per cliente
TempestivitàI dati sono aggiornatiInformazioni di contatto aggiornate entro 90 giorni
CoerenzaI dati sono uniformi«USA» utilizzato in modo coerente, non «US» o «United States»

Ogni dimensione risponde a una domanda specifica sui dati. Insieme forniscono un quadro completo della salute dei dati.

Per una guida dettagliata su ogni dimensione, consultare:

Standard e framework di settore

ISO 8000

Lo standard ISO 8000 definisce i requisiti di qualità dei dati per lo scambio di dati master. Stabilisce i principi per l’accuratezza, la completezza e la coerenza dei dati tra le organizzazioni.

DAMA-DMBOK

Il Body of Knowledge della Data Management Association (DAMA-DMBOK) definisce la qualità dei dati come una delle undici aree di conoscenza nella gestione dei dati. Fornisce indicazioni sui processi di misurazione, monitoraggio e miglioramento.

La regola 1-10-100

Questo principio illustra il costo crescente della scarsa qualità dei dati:

FaseCostoEsempio
Prevenzione1 $Validazione all’inserimento dei dati
Correzione10 $Pulizia dei dati dopo l’inserimento
Fallimento100 $Impatto aziendale dei dati errati

Investire nella qualità dei dati alla fonte consente risparmi significativi a valle.

Qualità dei dati vs concetti correlati

Qualità dei dati vs gestione dei dati

La gestione dei dati è la pratica più ampia di raccolta, archiviazione e manutenzione dei dati. La qualità dei dati è una componente della gestione dei dati, focalizzata specificamente sull’idoneità all’uso.

ConcettoAmbitoFocus
Gestione dei datiTutte le pratiche sui datiArchiviazione, accesso, sicurezza, ciclo di vita
Qualità dei datiIdoneità allo scopoCompletezza, validità, unicità, tempestività, coerenza
Governance dei datiPolitiche e responsabilitàChi possiede i dati, chi può modificarli, quali regole si applicano

Qualità dei dati vs accuratezza dei dati

L’accuratezza chiede: questo valore riflette la realtà? La qualità chiede: questi dati funzionano per il loro scopo?

Un indirizzo e-mail può essere valido (formato corretto) ma inaccurato (la persona non lo utilizza più). DQS misura la qualità perché il formato e la completezza possono essere automatizzati. L’accuratezza richiede tipicamente una verifica esterna.

Come si misura la qualità dei dati

Metriche quantitative

La qualità dei dati si esprime attraverso indicatori misurabili:

Tipo di metricaEsempioCalcolo
PercentualeTasso di riempimento(Record popolati / Record totali) x 100
ConteggioConteggio duplicatiNumero di record con valori corrispondenti
PunteggioPunteggio di validitàMedia ponderata delle regole di validazione
RapportoTasso di conformitàValori conformi / Valori totali

Soglie e obiettivi

Le organizzazioni stabiliscono soglie in base ai requisiti aziendali:

LivelloSogliaCaso d’uso
Critico99%+Campi di reportistica regolamentare
Alto95%+Dati rivolti al cliente
Standard85%+Dati operativi
Basso70%+Dati storici o di archivio

Misurazione continua vs puntuale

La misurazione puntuale fornisce un’istantanea. La misurazione continua monitora le tendenze e rileva il degrado precocemente.

DQS supporta entrambi gli approcci:

  • Eseguire scansioni ad hoc per una valutazione immediata
  • Pianificare scansioni ricorrenti per un monitoraggio continuativo

Perché le organizzazioni hanno difficoltà

1. Silos di dati

Quando i dati risiedono in sistemi disconnessi, le incoerenze si verificano naturalmente. Il reparto vendite ha una versione del record cliente. L’assistenza ne ha un’altra. Nessuno dei due sa quale sia corretta.

2. Errori di inserimento manuale

L’inserimento manuale dei dati è soggetto a errori di battitura, formattazione incoerente e informazioni mancanti. Senza Validation Rule, questi errori si accumulano nel tempo.

3. Nessun responsabile chiaro

Quando nessuno è responsabile della qualità dei dati, diventa un problema di tutti e una priorità di nessuno. La gestione dei dati richiede un’assegnazione esplicita.

4. Mancanza di misurazione

Non si può migliorare ciò che non si misura. Molte organizzazioni presumono che i loro dati siano sufficientemente buoni senza stabilire riferimenti di base o monitorare le metriche.

5. Progetti di pulizia una tantum

Trattare la qualità dei dati come un progetto anziché come un processo porta a miglioramenti temporanei che si degradano nel tempo.

L’impatto aziendale

La scarsa qualità dei dati colpisce ogni funzione:

FunzioneImpatto
MarketingCampagne inviate a indirizzi errati, spesa sprecata
VenditeTempo sprecato su Lead duplicati, contesto perso
FinanzaReport inaccurati, rischi di conformità
OperazioniDecisioni basate su dati errati
AI/MLModelli addestrati su dati errati producono output errati

Quantificare il costo

Le ricerche del MIT Sloan e gli studi di settore mostrano che:

  • Le organizzazioni perdono dal 15% al 25% del fatturato annuo a causa della scarsa qualità dei dati
  • Oltre il 25% delle organizzazioni perde più di 5 milioni di dollari all’anno per problemi di dati (IBM 2025)
  • I dipendenti dedicano fino al 27% del loro tempo a correggere dati errati

Connessione con la prontezza AI

La qualità dei dati tradizionale (le cinque dimensioni) prepara i dati per la reportistica e l’automazione. Le applicazioni AI come Agentforce dipendono dalle stesse fondamenta: record completi, formati validi, valori coerenti, dati aggiornati e nessun duplicato.

Oltre alle cinque dimensioni, il deployment dell’AI introduce un’ulteriore preoccupazione: l’esposizione di dati sensibili. Prima di collegare agenti AI ai dati di Salesforce, è necessario sapere dove risiedono i dati PII per poterli mascherare o escludere.

DQS misura sia la qualità dei dati tradizionale che la prontezza AI in un’unica piattaforma:

  • Cinque dimensioni della qualità dei dati: completezza, validità, unicità, tempestività, coerenza
  • Rilevamento PII: scansione dei campi di testo alla ricerca di dati sensibili (codici fiscali, carte di credito, informazioni personali) prima dell’esposizione all’AI

Costruire una pratica di qualità dei dati

Una qualità dei dati efficace richiede tre elementi:

1. Misurazione

Stabilire riferimenti di base prima del miglioramento. Conoscere la propria posizione in ogni dimensione e campo.

2. Processo

Definire flussi di lavoro per la manutenzione continuativa dei dati:

  • Validation Rule per l’inserimento dati
  • Pianificazioni regolari di pulizia
  • Procedure di escalation dei problemi
  • Protocolli di gestione del cambiamento

3. Cultura

Costruire un impegno a livello organizzativo:

  • Assegnare responsabili dei dati per ogni dominio
  • Includere la qualità dei dati nelle metriche di performance
  • Celebrare i miglioramenti e condividere i successi
  • Rendere la qualità visibile attraverso le dashboard

Iniziare con DQS

DQS fornisce le fondamenta di misurazione per la pratica di qualità dei dati:

  1. Selezionare le capacità: scegliere quali dimensioni misurare
  2. Definire l’ambito: selezionare gli oggetti e i campi da analizzare
  3. Configurare le soglie: impostare gli standard di qualità
  4. Eseguire le scansioni: avviare l’analisi sui dati
  5. Esaminare i risultati: identificare i problemi e assegnare le priorità

Il primo passo è comprendere lo stato attuale. Effettuare la Valutazione della prontezza AI per valutare la maturità della qualità dei dati in 3 minuti.

Passaggi successivi