Skip to main content

Las cinco dimensiones de la calidad de datos

Conozca las cinco dimensiones que mide DQS: completitud, validez, unicidad, actualidad y consistencia.

Comprender las cinco dimensiones

La calidad de los datos se mide en cinco dimensiones clave. Cada dimensión responde a una pregunta concreta sobre sus datos y, en conjunto, determinan si sus datos son aptos para su propósito.

DQS mide las cinco dimensiones de forma nativa dentro de Salesforce.

DimensiónPregunta claveEjemplo de incidencia
Completitud¿Están presentes los datos?Direcciones de correo faltantes
Validez¿Es correcto el formato?Números de teléfono con formato incorrecto
Unicidad¿Es cada registro distinto?Contactos duplicados
Actualidad¿Están vigentes los datos?Fechas de oportunidad obsoletas
Consistencia¿Son uniformes los datos?«USA» frente a «United States»

1. Completitud

La completitud mide si los valores de datos requeridos están presentes y no faltan.

Qué mide DQS

  • Fill Rate: porcentaje de registros con valores no vacíos
  • Detección de blancos: cadenas vacías y valores con solo espacios en blanco
  • Detección de placeholders: valores como «N/A», «TBD» o «Unknown»

Por qué importa la completitud

Los datos incompletos rompen la automatización. Cuando un flujo requiere una dirección de correo que no existe, el flujo falla. Cuando un informe filtra por Industry y la mitad de los registros carece de valor en Industry, su analítica muestra solo parte de la imagen.

Incidencias habituales de completitud

IncidenciaEjemploImpacto
Campos en blancoContact Phone vacíoNo se puede llamar a los prospectos
Valores placeholder«TBD» en Company NameNo válido para informes
Solo espacios en blanco« » en DescriptionParece cumplimentado, pero no lo está

Consejo: empiece por sus campos más críticos. No necesita completitud del 100 % en todos los campos, solo en los que importan para su caso de uso.

2. Validez

La validez mide si los valores de datos se ajustan a los formatos y patrones esperados.

Qué mide DQS

  • Validación de formato: patrones de correo, teléfono, URL
  • Coincidencia de patrones: patrones regex personalizados
  • Validación de dominio: listas de valores permitidos

Validez frente a precisión

La validez y la precisión son cosas distintas. Una dirección de correo puede ser válida (formato correcto) pero imprecisa (persona equivocada). DQS mide la validez porque la validación de formato puede automatizarse. La precisión requiere verificación externa.

Comprobación¿Válido?¿Preciso?
john@company.comDesconocido sin verificación
john@companyNoN/A (el formato es incorrecto)
john.smith@oldcompany.comNo (la persona dejó la empresa)

Incidencias habituales de validez en Salesforce

  • Direcciones de correo sin «@» o sin dominio
  • Números de teléfono con un número de dígitos incorrecto
  • URL sin protocolo (http/https)
  • Texto libre donde se esperan valores de lista desplegable

3. Unicidad

La unicidad mide si los valores de datos son distintos y no están duplicados.

Qué mide DQS

  • Detección de duplicados: coincidencias exactas entre registros
  • Recuento distintivo: total de valores únicos por campo
  • Análisis de entropía: diversidad y distribución de valores

El coste de los duplicados

Los registros duplicados desperdician almacenamiento, confunden a los usuarios y producen métricas infladas. Cuando Ventas tiene dos registros para la misma empresa, pierde contexto y corre el riesgo de comunicaciones duplicadas incómodas.

La investigación muestra:

  • Las bases de datos B2B contienen entre un 10 % y un 30 % de registros duplicados de media
  • Cada duplicado cuesta a las organizaciones en envíos de correo desperdiciados, informes confusos e historial de cliente fragmentado

Prevención frente a detección de duplicados

DQS se centra en la detección, que le ayuda a identificar los duplicados ya existentes. La prevención (detener los duplicados en el momento de la creación) requiere reglas de validación y reglas de coincidencia en la configuración de Salesforce.

4. Actualidad

La actualidad mide si los datos son lo suficientemente recientes para su uso previsto.

Qué mide DQS

  • Freshness Rate: porcentaje de registros dentro de la antigüedad aceptable
  • Detección de obsolescencia: registros que superan su umbral
  • Antigüedad media: media de los valores de los campos de fecha
  • Detección de fechas futuras: fechas no válidas en el futuro

Establecer umbrales de frescura

Los distintos tipos de datos tienen distintos requisitos de frescura:

Tipo de datoUmbral habitualMotivo
Lead Last Activity30 díasLos leads fríos pierden valor
Información de contacto90 díasLas personas cambian de empleo
Opportunity Close DateTrimestre en cursoPrecisión de la previsión
Account Annual Revenue1 añoSe esperan actualizaciones anuales

Por qué la actualidad importa para la IA

La IA y los modelos de aprendizaje automático aprenden de sus datos. Cuando sus datos están obsoletos, la IA aprende patrones desfasados. Agentforce, por ejemplo, utiliza sus datos de Salesforce para fundamentar las respuestas. La información de contacto obsoleta conduce a recomendaciones incorrectas.

5. Consistencia

La consistencia mide si los valores de datos son uniformes y están estandarizados.

Qué mide DQS

  • Conformance Rate: porcentaje que coincide con los patrones esperados
  • Detección de variantes: distintas representaciones del mismo valor
  • Análisis de valor dominante: valor más habitual por campo

Tipos de inconsistencia

TipoEjemploProblema
Variación de formato«USA» frente a «United States» frente a «US»Rompe el filtrado y la agrupación
Variación ortográfica«Acme Corp» frente a «ACME Corporation»Genera falsos duplicados
Variación de mayúsculas«new york» frente a «New York»Da una imagen poco profesional en los informes

Por qué la consistencia importa para la IA

Los modelos de IA tratan «USA» y «United States» como valores distintos. Si sus registros utilizan ambos, la IA no podrá agruparlos correctamente. Los datos inconsistentes fragmentan la comprensión de la IA y producen resultados poco fiables.

Lograr la consistencia

  • Utilice listas desplegables en lugar de texto libre cuando sea posible
  • Estandarice en un único formato cada campo
  • Importe desde los valores de lista desplegable al configurar las comprobaciones de consistencia de DQS

Equilibrar las dimensiones

No todas las dimensiones son igualmente importantes para todos los casos de uso. Tenga en cuenta lo que necesita:

Caso de usoDimensiones prioritarias
Campañas de marketingCompletitud, validez (para la entregabilidad)
Previsión de ventasActualidad, completitud
Atención al clienteUnicidad (una única fuente de verdad)
IA/AgentforceLas cinco, más las comprobaciones de preparación para la IA

Cobertura de dimensiones en DQS

DQS mide las cinco dimensiones con capacidades integrales:

DimensiónQué mide DQS
CompletitudFill rate, detección de null, detección de blancos, detección de placeholders, lógica contextual
ValidezValidación de formato, patrones regex personalizados, identificación de registros no válidos
UnicidadDetección de duplicados, análisis de entropía, distribución de frecuencia
ActualidadFreshness rate, detección de obsolescencia, antigüedad media, detección de fechas futuras
ConsistenciaComprobación de conformance, descubrimiento de variantes, análisis de valor dominante

Próximos pasos

Ahora que ya comprende las cinco dimensiones:

  1. Realice la Evaluación de preparación para la IA para ver sus puntuaciones actuales
  2. Lea sobre la Preparación para Agentforce para conocer las comprobaciones adicionales más allá de la calidad de datos básica
  3. Aprenda a utilizar el Definition Builder para configurar su primer análisis