Skip to main content

Consistencia

Las 6 métricas de consistencia que mide DQS, el flujo de diagnóstico para encontrar la fragmentación de valores y cómo configurar el análisis de conformance.

¿Qué es la consistencia?

La consistencia mide si los valores de sus datos se ajustan a un estándar acordado. Un campo es consistente cuando cada registro utiliza el mismo término para el mismo concepto. Un campo es inconsistente cuando existen variaciones que significan lo mismo pero se expresan de forma distinta.

«USA», «United States» y «US» se refieren al mismo país. Para Salesforce son tres valores distintos. Un informe agrupado por Country produce tres filas en lugar de una. Una automatización que filtra por «USA» pasa por alto 230 registros que contienen «United States».

Conformance Rate = (Registros conformes / Registros totales) x 100

Si 850 de 1000 registros de Account tienen un valor de Country que coincide con su lista de valores permitidos, su tasa de conformance de Country es del 85 %. El 15 % restante contiene variaciones que requieren estandarización.

Por qué importa la consistencia

Informes

Los datos inconsistentes fragmentan sus informes. Cuando su campo Country contiene cinco grafías distintas del mismo país, un informe agrupado por Country muestra cinco filas en lugar de una. El total es correcto, pero la agrupación es incorrecta. Los paneles ejecutivos basados en estos informes cuentan una historia engañosa.

Automatización

La automatización de Salesforce depende de coincidencias exactas de valor. Un flujo de trabajo que filtra por Country = "USA" pasa por alto los registros con «United States» y «US». La automatización se ejecuta correctamente sobre los registros coincidentes, pero se salta en silencio todo lo demás.

IA y Agentforce

Los modelos de IA tratan cada variación como un concepto distinto. «USA» y «United States» se convierten en dos países distintos a ojos del modelo. Agentforce genera respuestas a partir de los valores de sus campos. Los valores inconsistentes producen resultados de IA inconsistentes.

SistemaImpacto de la consistencia
InformesAgrupaciones fragmentadas, totales engañosos
Flujos de trabajoLos filtros pasan por alto las variaciones no coincidentes
Duplicate RulesLas variaciones impiden una coincidencia correcta
AgentforceLos valores de campo inconsistentes producen respuestas de IA poco fiables

Cómo mide DQS la consistencia

DQS produce 6 métricas de consistencia organizadas en torno a una pregunta de diagnóstico: «¿Se ajustan los valores de sus campos a un estándar y, si no, qué están haciendo en su lugar?»

Piense en estas métricas como un flujo de diagnóstico. Cada paso revela una capa distinta del problema.

Paso 1: ¿cuán consistente es?

Conformance Rate es la métrica principal. Calcula el porcentaje de registros en los que el valor del campo coincide con uno de sus valores permitidos definidos. Es la cifra que pondrá en un panel.

Ejecuta un análisis sobre el objeto Account. El campo Country muestra una Conformance Rate del 72 %. Eso significa que el 28 % de sus Accounts contiene valores de país fuera de su lista permitida. Sus reglas de asignación de territorio, sus paneles regionales y su lógica de localización operan todos con datos incompletos.

Todas las demás métricas de consistencia existen para explicar qué aspecto tiene ese 28 % no conforme.

Paso 2: ¿cuál es la escala?

Las tasas indican la gravedad. Los recuentos indican la carga de trabajo. Dos métricas responden a la pregunta de escala:

MétricaQué le indica
Conformance CountCuántos registros coinciden con sus valores permitidos. Úselo para informes de cobertura.
Non-Conforming CountCuántos registros quedan fuera de sus valores permitidos. Úselo para delimitar proyectos de limpieza.

Estas dos cifras siempre suman el total de registros. Si su Conformance Count es 720 y el Non-Conforming Count es 280, tiene exactamente 1000 registros evaluados.

Ejemplo: su data steward necesita limpiar el campo Industry. Non-Conforming Count es 3400. Ya sabe el alcance del proyecto, puede asignar recursos y fijar un calendario realista para la estandarización.

Paso 3: ¿cuán fragmentados están los datos?

Variant Count mide el número de valores distintos encontrados en un campo entre todos los registros. Responde a: «¿de cuántas formas distintas se expresan estos datos?».

Esta métrica funciona como indicador del estado del esquema. Un campo Country con 5 valores distintos probablemente esté bien controlado. Un campo Country con 47 valores distintos señala una fragmentación grave, incluso antes de comprobar el conformance.

CampoRegistros totalesVariant CountEvaluación
Country10005Bien controlado, probablemente consistente
Country100047Muy fragmentado, requiere estandarización
Industry50012Razonable, probablemente limitado por lista desplegable
Industry50089Caos de texto libre, requiere atención inmediata

Ejemplo: durante una auditoría de org, analiza Lead_Source__c en Leads. Variant Count devuelve 34. Su equipo de marketing definió 8 fuentes de lead. Las 26 variantes restantes son erratas, abreviaturas y entradas ad hoc de integraciones. La lista desplegable se impone técnicamente en la interfaz, pero los registros creados por API la eluden.

Paso 4: ¿cuáles son los valores reales?

Dominant Values devuelve los N valores más frecuentes del campo, junto con el recuento de frecuencia de cada valor. Esto le indica qué aspecto tienen realmente sus datos, no qué aspecto espera que tengan.

PosiciónValorRecuentoPorcentaje
1United States45045 %
2USA23023 %
3US18018 %
4U.S.A.454,5 %
5United States of America151,5 %

Esta tabla revela tres cosas. Primero, el estándar de facto: «United States» con el 45 % es lo que introduce la mayoría de los usuarios. Segundo, las variaciones habituales: «USA» y «US» suman otro 41 %. Tercero, la larga cola: «U.S.A.» y «United States of America» son raras pero están presentes.

Ejemplo: su equipo debate si estandarizar los valores de Country a códigos ISO («US») o nombres completos («United States»). Dominant Values muestra que el 45 % de los registros ya utiliza «United States». Estandarizar a ese valor requiere cambiar el 55 % de los registros. Estandarizar a «US» requiere cambiar el 82 %. Los datos le indican el camino más económico.

Por qué las tasas y los recuentos vienen en pares

Las métricas de conformance se presentan como una tasa (Conformance Rate) y su inversa (Non-Conformance Rate), además de recuentos absolutos para ambos lados. Es intencional:

  • Las tasas son para paneles, informes ejecutivos y seguimiento de tendencias. «El conformance mejoró del 72 % al 94 % este trimestre».
  • Los recuentos son para la planificación de proyectos, la estimación de la carga de trabajo y la delimitación de la limpieza. «Tenemos 3400 registros no conformes que corregir».

Use las tasas para comunicar el progreso. Use los recuentos para planificar el trabajo.

Referencia de métricas

Métricas base

Estas 2 métricas forman la base de todo análisis de consistencia. Le indican la tasa de conformance y el número de registros que coinciden.

MétricaTipoQué mide
Conformance RatePorcentajeProporción de registros que coinciden con sus valores permitidos
Conformance CountRecuentoNúmero de registros que coinciden con sus valores permitidos

Métricas avanzadas

Estas 4 métricas van más allá del «¿coincide?» para preguntar «¿qué aspecto tienen los datos no coincidentes?». Requieren el modo Advanced Conformance Analysis.

MétricaTipoQué mide
Non-Conforming CountRecuentoRegistros con valores fuera de su lista permitida
Non-Conformance RatePorcentajeProporción de registros fuera de su lista permitida
Variant CountRecuentoTotal de valores distintos encontrados en el campo
Dominant ValuesListaN valores más frecuentes con recuentos de frecuencia

Cobertura por tipo de campo

DQS admite comprobaciones de consistencia en los siguientes tipos de campo de Salesforce:

Tipo de campoFoco de consistencia
String (Text)Abreviaturas, ortografía, mayúsculas
TextAreaEstandarización de texto libre
PicklistValidación de valores reales frente a las opciones esperadas
EmailEstandarización de dominio, consistencia de formato
PhoneEstandarización de formato (códigos de área, separadores)
URLConsistencia de protocolo y ruta

Dos modos de análisis

DQS ofrece dos modos de análisis de consistencia:

Conformance Check responde a la pregunta: «¿los valores del campo coinciden con mi lista permitida?». Produce las 2 métricas base y cubre lo esencial para una auditoría rápida de conformance.

Advanced Conformance Analysis va más allá. Produce las 6 métricas, incluyendo los recuentos de no conformes, la detección de variantes y la distribución de valores dominantes. Utilice este modo cuando necesite comprender el panorama completo de la fragmentación de valores, no solo la puntuación de conformance.

Necesidad de negocioModo recomendado
Auditoría rápida de conformance o comprobación de línea baseConformance Check
Limpieza de migración de datosAdvanced (Variant Count revela el caos importado)
Evaluación de preparación para la IAAdvanced (Dominant Values muestra lo que la IA aprenderá)
Gobernanza de datos continuaEmpiece con Conformance Check y pase a Advanced cuando esté listo para un análisis más profundo

Configurar la consistencia

DQS ofrece cuatro entradas de configuración para la consistencia. Cada una puede establecerse a nivel global (se aplica a todos los campos) y sobrescribirse a nivel de campo individual.

AjusteQué controla
Expected ValuesLa lista de valores que DQS trata como «conformes». Cualquier valor de campo que no esté en esta lista se marca como no conforme. Obligatorio: debe definir al menos un valor antes de ejecutar un análisis.
Case SensitiveControla si la coincidencia de valores tiene en cuenta las mayúsculas y minúsculas. Cuando está desactivada (por defecto), «Premium», «PREMIUM» y «premium» coinciden todos con el valor permitido «Premium». Cuando está activada, solo cuenta una coincidencia exacta de mayúsculas.
Top NCuántos valores dominantes devolver (de 1 a 100). Controla el tamaño de la salida de Dominant Values. Por defecto: 5.
Min FrequencyEl número mínimo de veces que un valor debe aparecer para incluirse en la salida de Dominant Values (de 1 a 1000). Filtra los valores ultrararos que añaden ruido. Por defecto: 1.

Consejo: empiece utilizando Import from Field para ver qué valores existen realmente en sus datos antes de definir su lista de valores permitidos.

Import from Field: configuración basada en el descubrimiento

Un reto habitual con la consistencia es saber qué valores esperar. No se pueden definir valores permitidos si no se sabe qué contienen los datos.

Import from Field resuelve esto. Consulta los datos reales del campo, agrupa los valores por frecuencia y muestra los resultados como una lista de verificación.

Cómo funciona:

  1. Abra la configuración de Expected Values.
  2. Haga clic en Import from Field. DQS consulta los datos en vivo y devuelve los valores distintos ordenados por frecuencia.
  3. Revise la lista de verificación. Cada valor muestra cuántos registros lo contienen.
  4. Marque los valores que considere correctos. Deje sin marcar los valores incorrectos, mal formados o placeholders.
  5. Haga clic en Add Selected. Los valores marcados pasan a su lista de valores permitidos.

Ejemplo: configura la consistencia para un campo Rating__c. Import from Field devuelve:

ValorRegistros
Hot284
Warm198
Cold156
Very High23
240 km/h12
N/A8

Los tres primeros valores son sus valoraciones reales. Marca esos. «Very High» es un error de entrada de datos. «240 km/h» es, claramente, un dato en el campo equivocado. «N/A» es un placeholder. Deja esos sin marcar. Cuando se ejecute el análisis, esos 43 registros aparecerán como no conformes y su lista de valores permitidos se construirá a partir de lo que realmente contienen sus datos.

Este flujo invierte el enfoque tradicional de «adivinar primero, corregir después». Usted descubre primero y después define su estándar.

Incidencias habituales de consistencia

Variaciones de país y estado

La inconsistencia más habitual en los datos de Salesforce. Sin estandarización, un único concepto como «United States» aparece como 5 o más valores distintos. Los informes se fragmentan. Los filtros pierden registros. Las reglas de territorio fallan.

Solución: active las State and Country Picklists de Salesforce para todos los campos de dirección. Utilice DQS para encontrar y limpiar los valores no conformes existentes.

Campos de texto libre sin gobernanza

Los campos de texto que carecen de restricciones de lista desplegable acumulan variaciones con el tiempo. Los campos Industry, Job Title, Lead Source y Department son los infractores más habituales cuando se implementan como texto libre.

Solución: convierta los campos de texto libre de alto valor en listas desplegables. Utilice Import from Field para ver la distribución actual de valores antes de definir las opciones de la lista desplegable.

Variaciones creadas por integraciones

Los sistemas externos y las APIs escriben registros que eluden la validación de la interfaz de Salesforce. Una plataforma de automatización de marketing escribe «Info Technology» mientras que su estándar es «Information Technology». Estas variaciones se acumulan en silencio.

Solución: aplique reglas de mapeo de valores en su capa de integración. Ejecute análisis de consistencia periódicos para detectar nuevas variaciones de fuentes de datos que no controla.

Inconsistencias de mayúsculas

Los usuarios introducen «Active», «active» y «ACTIVE» en distintos registros. Con la coincidencia sensible a mayúsculas desactivada, DQS cuenta las tres como conformes. Pero el campo sigue conteniendo tres grafías distintas en los datos en bruto.

Solución: decida si las mayúsculas importan para su caso de uso. Para los campos de cara al usuario, estandarice las mayúsculas mediante limpieza de datos. Para fines de coincidencia, desactive la sensibilidad a mayúsculas en su configuración de DQS.

Buenas prácticas

Defina los estándares antes de analizar

Documente el valor esperado para cada campo restringido antes de ejecutar su primer análisis. Sin un estándar claro, no hay línea base con la que medir.

CampoEstándarRazón
CountryCódigos ISO 3166-1 alpha-2 (US, CA, DE)Estándar del sector, compacto
IndustryTaxonomía personalizada de 15 valoresCoincide con las categorías de informes
Lead Source8 fuentes definidas por marketingAlineado con el seguimiento de campañas

Utilice el flujo de descubrimiento para campos desconocidos

Para los campos en los que no dispone de un estándar predefinido, utilice Import from Field primero. Deje que los datos le digan cuál es el estándar de facto. El valor con la mayor frecuencia suele ser la opción correcta como valor canónico.

Haga seguimiento del conformance a lo largo del tiempo

Una única puntuación de conformance es una instantánea. Haga seguimiento de las puntuaciones a lo largo de varios análisis para detectar la degradación pronto, medir el progreso de la limpieza e identificar las fuentes de datos que introducen nuevas variaciones.

Utilice Variant Count como alerta temprana

Monitorice Variant Count entre análisis. Un campo que salta de 12 a 28 valores distintos entre análisis tiene una nueva fuente de variación. Investigue antes de que el problema se extienda.

Priorice por impacto en el negocio

No todos los campos necesitan un 100 % de conformance. Céntrese en los campos que impulsan los informes (Country, Industry), alimentan la automatización (Status, Stage) o proporcionan datos a la IA y Agentforce.

Próximos pasos

Ya ha completado las cinco dimensiones de calidad de datos. Continúe con su aprendizaje: