Comprender las cinco dimensiones
La calidad de los datos se mide en cinco dimensiones clave. Cada dimensión responde a una pregunta concreta sobre sus datos y, en conjunto, determinan si sus datos son aptos para su propósito.
DQS mide las cinco dimensiones de forma nativa dentro de Salesforce.
| Dimensión | Pregunta clave | Ejemplo de incidencia |
|---|---|---|
| Completitud | ¿Están presentes los datos? | Direcciones de correo faltantes |
| Validez | ¿Es correcto el formato? | Números de teléfono con formato incorrecto |
| Unicidad | ¿Es cada registro distinto? | Contactos duplicados |
| Actualidad | ¿Están vigentes los datos? | Fechas de oportunidad obsoletas |
| Consistencia | ¿Son uniformes los datos? | «USA» frente a «United States» |
1. Completitud
La completitud mide si los valores de datos requeridos están presentes y no faltan.
Qué mide DQS
- Fill Rate: porcentaje de registros con valores no vacíos
- Detección de blancos: cadenas vacías y valores con solo espacios en blanco
- Detección de placeholders: valores como «N/A», «TBD» o «Unknown»
Por qué importa la completitud
Los datos incompletos rompen la automatización. Cuando un flujo requiere una dirección de correo que no existe, el flujo falla. Cuando un informe filtra por Industry y la mitad de los registros carece de valor en Industry, su analítica muestra solo parte de la imagen.
Incidencias habituales de completitud
| Incidencia | Ejemplo | Impacto |
|---|---|---|
| Campos en blanco | Contact Phone vacío | No se puede llamar a los prospectos |
| Valores placeholder | «TBD» en Company Name | No válido para informes |
| Solo espacios en blanco | « » en Description | Parece cumplimentado, pero no lo está |
Consejo: empiece por sus campos más críticos. No necesita completitud del 100 % en todos los campos, solo en los que importan para su caso de uso.
2. Validez
La validez mide si los valores de datos se ajustan a los formatos y patrones esperados.
Qué mide DQS
- Validación de formato: patrones de correo, teléfono, URL
- Coincidencia de patrones: patrones regex personalizados
- Validación de dominio: listas de valores permitidos
Validez frente a precisión
La validez y la precisión son cosas distintas. Una dirección de correo puede ser válida (formato correcto) pero imprecisa (persona equivocada). DQS mide la validez porque la validación de formato puede automatizarse. La precisión requiere verificación externa.
| Comprobación | ¿Válido? | ¿Preciso? |
|---|---|---|
| john@company.com | Sí | Desconocido sin verificación |
| john@company | No | N/A (el formato es incorrecto) |
| john.smith@oldcompany.com | Sí | No (la persona dejó la empresa) |
Incidencias habituales de validez en Salesforce
- Direcciones de correo sin «@» o sin dominio
- Números de teléfono con un número de dígitos incorrecto
- URL sin protocolo (http/https)
- Texto libre donde se esperan valores de lista desplegable
3. Unicidad
La unicidad mide si los valores de datos son distintos y no están duplicados.
Qué mide DQS
- Detección de duplicados: coincidencias exactas entre registros
- Recuento distintivo: total de valores únicos por campo
- Análisis de entropía: diversidad y distribución de valores
El coste de los duplicados
Los registros duplicados desperdician almacenamiento, confunden a los usuarios y producen métricas infladas. Cuando Ventas tiene dos registros para la misma empresa, pierde contexto y corre el riesgo de comunicaciones duplicadas incómodas.
La investigación muestra:
- Las bases de datos B2B contienen entre un 10 % y un 30 % de registros duplicados de media
- Cada duplicado cuesta a las organizaciones en envíos de correo desperdiciados, informes confusos e historial de cliente fragmentado
Prevención frente a detección de duplicados
DQS se centra en la detección, que le ayuda a identificar los duplicados ya existentes. La prevención (detener los duplicados en el momento de la creación) requiere reglas de validación y reglas de coincidencia en la configuración de Salesforce.
4. Actualidad
La actualidad mide si los datos son lo suficientemente recientes para su uso previsto.
Qué mide DQS
- Freshness Rate: porcentaje de registros dentro de la antigüedad aceptable
- Detección de obsolescencia: registros que superan su umbral
- Antigüedad media: media de los valores de los campos de fecha
- Detección de fechas futuras: fechas no válidas en el futuro
Establecer umbrales de frescura
Los distintos tipos de datos tienen distintos requisitos de frescura:
| Tipo de dato | Umbral habitual | Motivo |
|---|---|---|
| Lead Last Activity | 30 días | Los leads fríos pierden valor |
| Información de contacto | 90 días | Las personas cambian de empleo |
| Opportunity Close Date | Trimestre en curso | Precisión de la previsión |
| Account Annual Revenue | 1 año | Se esperan actualizaciones anuales |
Por qué la actualidad importa para la IA
La IA y los modelos de aprendizaje automático aprenden de sus datos. Cuando sus datos están obsoletos, la IA aprende patrones desfasados. Agentforce, por ejemplo, utiliza sus datos de Salesforce para fundamentar las respuestas. La información de contacto obsoleta conduce a recomendaciones incorrectas.
5. Consistencia
La consistencia mide si los valores de datos son uniformes y están estandarizados.
Qué mide DQS
- Conformance Rate: porcentaje que coincide con los patrones esperados
- Detección de variantes: distintas representaciones del mismo valor
- Análisis de valor dominante: valor más habitual por campo
Tipos de inconsistencia
| Tipo | Ejemplo | Problema |
|---|---|---|
| Variación de formato | «USA» frente a «United States» frente a «US» | Rompe el filtrado y la agrupación |
| Variación ortográfica | «Acme Corp» frente a «ACME Corporation» | Genera falsos duplicados |
| Variación de mayúsculas | «new york» frente a «New York» | Da una imagen poco profesional en los informes |
Por qué la consistencia importa para la IA
Los modelos de IA tratan «USA» y «United States» como valores distintos. Si sus registros utilizan ambos, la IA no podrá agruparlos correctamente. Los datos inconsistentes fragmentan la comprensión de la IA y producen resultados poco fiables.
Lograr la consistencia
- Utilice listas desplegables en lugar de texto libre cuando sea posible
- Estandarice en un único formato cada campo
- Importe desde los valores de lista desplegable al configurar las comprobaciones de consistencia de DQS
Equilibrar las dimensiones
No todas las dimensiones son igualmente importantes para todos los casos de uso. Tenga en cuenta lo que necesita:
| Caso de uso | Dimensiones prioritarias |
|---|---|
| Campañas de marketing | Completitud, validez (para la entregabilidad) |
| Previsión de ventas | Actualidad, completitud |
| Atención al cliente | Unicidad (una única fuente de verdad) |
| IA/Agentforce | Las cinco, más las comprobaciones de preparación para la IA |
Cobertura de dimensiones en DQS
DQS mide las cinco dimensiones con capacidades integrales:
| Dimensión | Qué mide DQS |
|---|---|
| Completitud | Fill rate, detección de null, detección de blancos, detección de placeholders, lógica contextual |
| Validez | Validación de formato, patrones regex personalizados, identificación de registros no válidos |
| Unicidad | Detección de duplicados, análisis de entropía, distribución de frecuencia |
| Actualidad | Freshness rate, detección de obsolescencia, antigüedad media, detección de fechas futuras |
| Consistencia | Comprobación de conformance, descubrimiento de variantes, análisis de valor dominante |
Próximos pasos
Ahora que ya comprende las cinco dimensiones:
- Realice la Evaluación de preparación para la IA para ver sus puntuaciones actuales
- Lea sobre la Preparación para Agentforce para conocer las comprobaciones adicionales más allá de la calidad de datos básica
- Aprenda a utilizar el Definition Builder para configurar su primer análisis