Definir la calidad de datos
La calidad de datos mide en qué medida sus datos sirven a su propósito previsto. No se trata de si los datos son «correctos» en términos absolutos, sino de si son aptos para su uso en la toma de decisiones, las operaciones y la analítica.
La dirección de un cliente es de alta calidad si llega al cliente. Un código de producto es de alta calidad si sus sistemas lo reconocen. La calidad depende del contexto.
El principio de «apto para el propósito»
La calidad de datos es contextual. Una dirección de envío requiere precisión a nivel de calle. Una región de marketing solo requiere país o estado. Ambas pueden ser «de alta calidad» con niveles de precisión distintos.
Al evaluar la calidad de los datos, pregúntese: ¿qué tienen que hacer estos datos? Después mida si pueden hacerlo.
El marco de las cinco dimensiones
La calidad de datos se mide en cinco dimensiones clave. Este marco se ha adoptado en diversos sectores y constituye la base de los estándares ISO 8000 y DAMA.
| Dimensión | Qué mide | Ejemplo |
|---|---|---|
| Completitud | Los datos requeridos están presentes | Todos los campos obligatorios están cumplimentados |
| Validez | Los datos se ajustan a los formatos | Las direcciones de correo tienen un formato válido |
| Unicidad | No hay registros duplicados | Un registro por cliente |
| Actualidad | Los datos están vigentes | Información de contacto actualizada en los últimos 90 días |
| Consistencia | Los datos son uniformes | Se usa «USA» de forma consistente, no «US» ni «United States» |
Cada dimensión responde a una pregunta concreta sobre sus datos. En conjunto ofrecen una imagen completa del estado de los datos.
Para orientación detallada sobre cada dimensión, consulte:
Estándares y marcos del sector
ISO 8000
El estándar ISO 8000 define los requisitos de calidad de datos para el intercambio de datos maestros. Establece principios de precisión, completitud y consistencia entre organizaciones.
DAMA-DMBOK
El Body of Knowledge de la Data Management Association (DAMA-DMBOK) define la calidad de datos como una de las once áreas de conocimiento de la gestión de datos. Ofrece orientación sobre los procesos de medición, monitorización y mejora.
La regla del 1-10-100
Este principio ilustra el coste creciente de la mala calidad de datos:
| Fase | Coste | Ejemplo |
|---|---|---|
| Prevención | 1 $ | Validación en la entrada de datos |
| Corrección | 10 $ | Limpieza de datos tras la entrada |
| Fallo | 100 $ | Impacto en el negocio de los datos deficientes |
Invertir en calidad de datos en el origen ahorra costes significativos más adelante.
La calidad de datos frente a conceptos relacionados
Calidad de datos frente a gestión de datos
La gestión de datos es la práctica más amplia de recopilar, almacenar y mantener datos. La calidad de datos es un componente de la gestión de datos, centrado específicamente en la aptitud para el uso.
| Concepto | Alcance | Foco |
|---|---|---|
| Gestión de datos | Todas las prácticas de datos | Almacenamiento, acceso, seguridad, ciclo de vida |
| Calidad de datos | Aptitud para el propósito | Completitud, validez, unicidad, actualidad, consistencia |
| Gobernanza de datos | Políticas y propiedad | Quién posee los datos, quién puede modificarlos, qué reglas se aplican |
Calidad de datos frente a precisión de datos
La precisión pregunta: ¿refleja este valor la realidad? La calidad pregunta: ¿estos datos funcionan para su propósito?
Una dirección de correo puede ser válida (formato correcto) pero imprecisa (la persona ya no la utiliza). DQS mide la calidad porque el formato y la completitud pueden automatizarse. La precisión normalmente requiere verificación externa.
Cómo se mide la calidad de datos
Métricas cuantitativas
La calidad de datos se expresa mediante indicadores medibles:
| Tipo de métrica | Ejemplo | Cálculo |
|---|---|---|
| Porcentaje | Fill Rate | (Registros cumplimentados / Registros totales) x 100 |
| Recuento | Recuento de duplicados | Número de registros con valores coincidentes |
| Puntuación | Puntuación de validez | Media ponderada entre las reglas de validación |
| Ratio | Conformance Rate | Valores conformes / Valores totales |
Umbrales y objetivos
Las organizaciones establecen umbrales según los requisitos del negocio:
| Nivel | Umbral | Caso de uso |
|---|---|---|
| Crítico | 99 %+ | Campos de informes regulatorios |
| Alto | 95 %+ | Datos de cara al cliente |
| Estándar | 85 %+ | Datos operativos |
| Bajo | 70 %+ | Datos históricos o de archivo |
Medición continua frente a puntual
La medición puntual ofrece una instantánea. La medición continua sigue las tendencias y detecta la degradación pronto.
DQS admite ambos enfoques:
- Ejecute análisis ad hoc para una evaluación inmediata
- Programe análisis recurrentes para una monitorización continua
Por qué las organizaciones tienen dificultades
1. Silos de datos
Cuando los datos residen en sistemas desconectados, las inconsistencias se producen de forma natural. Ventas tiene una versión del registro de un cliente. Soporte tiene otra. Ninguno sabe cuál es la correcta.
2. Errores de entrada manual
La entrada manual de datos es propensa a erratas, formatos inconsistentes e información faltante. Sin reglas de validación, estos errores se acumulan con el tiempo.
3. Falta de propiedad clara
Cuando nadie es responsable de la calidad de datos, se convierte en problema de todos y prioridad de nadie. El data stewardship requiere una asignación explícita.
4. Falta de medición
No se puede mejorar lo que no se mide. Muchas organizaciones asumen que sus datos son lo bastante buenos sin establecer líneas base ni hacer seguimiento de métricas.
5. Proyectos de limpieza puntuales
Tratar la calidad de datos como un proyecto en lugar de como un proceso conduce a mejoras temporales que se degradan con el tiempo.
El impacto en el negocio
La mala calidad de datos afecta a todas las funciones:
| Función | Impacto |
|---|---|
| Marketing | Campañas enviadas a direcciones erróneas, gasto desperdiciado |
| Ventas | Tiempo perdido en leads duplicados, pérdida de contexto |
| Finanzas | Informes imprecisos, riesgos de cumplimiento |
| Operaciones | Decisiones basadas en datos defectuosos |
| IA/ML | Los modelos entrenados con datos deficientes producen resultados deficientes |
Cuantificar el coste
La investigación de MIT Sloan y los estudios del sector muestran que:
- Las organizaciones pierden entre el 15 % y el 25 % de los ingresos anuales debido a la mala calidad de los datos
- Más del 25 % de las organizaciones pierden más de 5 millones de dólares al año por incidencias de datos (IBM 2025)
- Los empleados dedican hasta el 27 % de su tiempo a corregir datos deficientes
Conexión con la preparación para la IA
La calidad de datos tradicional (las cinco dimensiones) prepara sus datos para los informes y la automatización. Las aplicaciones de IA como Agentforce dependen de los mismos fundamentos: registros completos, formatos válidos, valores consistentes, datos vigentes y ausencia de duplicados.
Además de esas cinco dimensiones, el despliegue de IA introduce una preocupación adicional: la exposición de datos sensibles. Antes de conectar agentes de IA a sus datos de Salesforce, debe saber dónde reside el PII para poder enmascararlo o excluirlo.
DQS mide tanto la calidad de datos tradicional como la preparación para la IA en una sola plataforma:
- Las cinco dimensiones de calidad de datos: completitud, validez, unicidad, actualidad, consistencia
- Detección de PII: analiza los campos de texto en busca de datos sensibles (SSN, tarjetas de crédito, información personal) antes de exponerlos a la IA
Construir una práctica de calidad de datos
Una práctica de calidad de datos eficaz requiere tres elementos:
1. Medición
Establezca líneas base antes de mejorar. Sepa en qué punto se encuentra en cada dimensión y campo.
2. Proceso
Defina flujos de trabajo para el mantenimiento continuo de los datos:
- Reglas de validación en la entrada de datos
- Calendarios regulares de depuración
- Procedimientos de escalado de incidencias
- Protocolos de gestión del cambio
3. Cultura
Cree un compromiso en toda la organización:
- Asigne data stewards para cada dominio
- Incluya la calidad de datos en las métricas de rendimiento
- Celebre las mejoras y comparta los éxitos
- Haga visible la calidad mediante paneles
Empezar con DQS
DQS proporciona la base de medición para su práctica de calidad de datos:
- Seleccionar capacidades: elija qué dimensiones medir
- Definir alcance: elija los objetos y campos que analizar
- Configurar umbrales: establezca sus estándares de calidad
- Ejecutar análisis: lleve a cabo el análisis sobre sus datos
- Revisar resultados: identifique las incidencias y priorice las correcciones
El primer paso es comprender su situación actual. Realice la Evaluación de preparación para la IA para valorar la madurez de su calidad de datos en 3 minutos.
Próximos pasos
- Profundice en Completitud, la primera dimensión
- Lea sobre Las cinco dimensiones para una visión de conjunto
- Conozca la Preparación para Agentforce para los requisitos específicos de la IA
- Realice la Evaluación de preparación para la IA para conocer sus puntuaciones actuales