Skip to main content

Completitud

Las 10 métricas de completitud que mide DQS, el embudo de diagnóstico para encontrar datos faltantes y cómo configurar el análisis de completitud.

¿Qué es la completitud?

La completitud mide si sus datos están realmente ahí. Un campo es completo cuando contiene datos significativos. Un campo es incompleto cuando es null, está en blanco o contiene un placeholder como «N/A» o «TBD».

La completitud es la dimensión de calidad de datos más fundamental. Sin datos, no hay nada que validar, deduplicar o analizar.

Completeness Rate = (Registros con datos / Registros totales) x 100

Si 850 de 1000 registros de Contact tienen un valor de Email, su tasa de completitud de Email es del 85 %. Esta métrica (a veces llamada fill rate) es la cifra principal para cualquier campo.

Por qué importa la completitud

Informes

Los datos incompletos distorsionan su analítica. Cuando el 40 % de los registros de Account carece de valor en Industry, cualquier informe agrupado por Industry muestra solo una verdad parcial. Los paneles se vuelven poco fiables. Las decisiones ejecutivas se basan en una fracción de la imagen.

Automatización

La automatización de Salesforce depende de los valores de los campos. Un flujo que envía correos falla cuando Email está en blanco. Un proceso que actualiza Account Owner falla cuando el lookup es null. Cada valor faltante es un posible fallo de automatización.

IA y Agentforce

Los modelos de IA aprenden de sus datos. Cuando los campos están vacíos, el modelo no tiene nada de lo que aprender. Agentforce utiliza sus datos de Salesforce para generar respuestas y llevar a cabo acciones. Los datos faltantes significan contexto incompleto y resultados de IA menos útiles.

SistemaImpacto de la completitud
InformesLos datos parciales producen métricas sesgadas
Flujos de trabajoLos valores faltantes provocan fallos en los procesos
Duplicate RulesLos registros incompletos son más difíciles de emparejar
AgentforceLas lagunas de contexto reducen la precisión de la IA

Cómo mide DQS la completitud

DQS produce 10 métricas de completitud organizadas en torno a una pregunta de diagnóstico: «¿Dónde faltan los datos, por qué, y los datos que existen son realmente útiles?»

Piense en estas métricas como un embudo de diagnóstico. Cada paso se apoya en el anterior.

Paso 1: ¿qué nivel de completitud tiene?

Completeness Rate es la métrica principal. Calcula el porcentaje de registros en los que el campo contiene un valor no vacío y no null. Es la cifra que pondrá en un panel.

Ejecuta un análisis sobre el objeto Account. El campo Industry muestra una Completeness Rate del 62 %. Eso significa que el 38 % de sus Accounts no tiene valor de industria, lo que significa que sus informes de segmentación, reglas de territorio y campañas de marketing que filtran por industria funcionan todos con datos incompletos.

Todas las demás métricas de completitud existen para explicar por qué esta cifra no es del 100 %.

Paso 2: ¿cuál es la escala?

Las tasas indican la gravedad. Los recuentos indican la carga de trabajo. Populated Count responde a la pregunta de escala: cuántos registros sí tienen un valor. Úsela para informes de cobertura y para dimensionar la laguna frente a su recuento total de registros: la diferencia entre su total y el Populated Count es el trabajo pendiente de limpieza.

Ejemplo: su data steward necesita construir una campaña de limpieza. Con 50 000 Contacts y un Populated Count de 35 800 en Phone, sabe que 14 200 registros requieren enriquecimiento, puede estimar el coste con un proveedor de datos y puede fijar un calendario realista.

Paso 3: ¿por qué es incompleto?

Tres métricas desglosan la causa de la incompletitud. Cada una apunta a un problema de raíz distinto.

Null Count y Null Rate miden los registros en los que el campo tiene un null real de base de datos, lo que significa que el campo nunca se rellenó. En Salesforce, null y cadena vacía son estados distintos. Un campo que nunca se ha tocado es null. Un campo que se ha borrado explícitamente es una cadena vacía. Esta distinción le indica si los datos nunca se capturaron o se eliminaron deliberadamente.

Ejemplo: tras una migración de datos, el campo Fax en Accounts muestra un Null Rate del 45 %. Los datos de fax nunca se migraron desde el sistema heredado (null = nunca existió), en lugar de haberse capturado y borrado más tarde. Un Null Rate alto le apunta al sistema de origen, no al comportamiento de los usuarios.

Placeholder Count y Placeholder Rate miden los registros que contienen valores placeholder conocidos como «N/A», «TBD», «Unknown» o cualquier valor personalizado que usted defina. Estos valores parecen datos pero no aportan información real.

Ejemplo: los datos de Account globales muestran una Completeness Rate del 94 % en Industry. Parece estupendo sobre el papel. Pero Placeholder Rate revela que el 18 % de esos valores «cumplimentados» son en realidad «N/A», «Other» o «Unknown». La completitud real ronda el 76 %. Esta es la métrica que convierte un panel verde en rojo.

Paso 4: ¿son útiles los datos «completos»?

Los tres primeros pasos identifican lo que falta. El paso 4 plantea una pregunta más difícil: ¿los datos que están realmente merecen la pena?

Incompleted Count es la medida más amplia de datos faltantes. Combina todas las formas de incompletitud: nulls, blanks y valores placeholder. Cuando la detección de placeholders está activa, Incompleted Count es siempre mayor o igual que el Null Count por sí solo, porque también captura las entradas de solo espacios y los placeholders.

Ejemplo: su campo Description en Opportunities muestra un Null Count de 500, pero un Incompleted Count de 1800. ¿La diferencia? 1300 registros tienen descripciones como «TBD», «N/A» o «---». Esos registros están técnicamente cumplimentados, pero son prácticamente inútiles. Sin esta métrica, pensaría que solo tiene 500 registros que corregir en lugar de 1800.

Rich Text Ratio mide el porcentaje de registros de campos de texto que contienen contenido sustancial por encima de un umbral de caracteres. Separa los campos con prosa significativa de los campos con unas pocas palabras. Un campo Description está «cumplimentado» tanto si contiene «Buen cliente» como si contiene un plan de cuenta de tres párrafos. Para la preparación para la IA, la profundidad del contenido importa tanto como su presencia.

Ejemplo: su empresa está evaluando una herramienta de IA que resume las descripciones de Case. Analiza el campo Description en Cases: Completeness Rate del 88 %, pero solo un 31 % de Rich Text Ratio. Solo el 31 % de las descripciones de los casos tiene sustancia suficiente con la que la IA pueda trabajar. El resto son entradas como «devolver llamada», «ver correo» o «incidencia reportada». El proyecto de IA necesita una fase de enriquecimiento de datos antes de poder aportar valor.

Text Field Utilization mide cuánta de la capacidad de caracteres disponible de un campo de texto se está utilizando. Un Long Text Area con capacidad de 32 000 caracteres en el que la entrada media es de 45 caracteres tiene una utilización muy baja.

Average Utilization le proporciona el porcentaje medio de longitud de campo utilizado en todos los registros. Junto con Text Field Utilization, ofrece una imagen completa de si sus campos de texto tienen el tamaño adecuado.

Ejemplo: durante una evaluación de org, Text Field Utilization revela que Notes__c (un Long Text Area de 131 072 caracteres) promedia un 3,2 % de utilización, con la mayoría de las entradas por debajo de 200 caracteres. Mientras tanto, Short_Description__c (Text, 255 caracteres) muestra un 94 % de utilización con problemas frecuentes de truncamiento. El esquema necesita redimensionarse: el Long Text Area es excesivo y el campo Text es demasiado pequeño.

Nota: Text Field Utilization y Average Utilization se aplican solo a los campos String y TextArea, porque son los tipos de campo con una capacidad de caracteres definida con la que comparar.

Por qué las tasas y los recuentos vienen en pares

La mayoría de las métricas se presentan como tasa (porcentaje) y recuento (número absoluto). Es intencional:

  • Las tasas son para paneles, informes ejecutivos y seguimiento de tendencias. «La completitud mejoró del 72 % al 89 % este trimestre».
  • Los recuentos son para la planificación de proyectos, la estimación de la carga de trabajo y la delimitación de la limpieza. «Tenemos 14 200 registros que corregir».

Use las tasas para comunicar el progreso. Use los recuentos para planificar el trabajo.

Referencia de métricas

Métricas base

Estas 5 métricas forman la base de todo análisis de completitud. Funcionan en prácticamente todos los tipos de campo.

MétricaTipoSe aplica a
Completeness RatePorcentajeTodos los tipos de campo
Populated CountRecuentoTodos los tipos de campo
Incompleted CountRecuentoTodos los tipos de campo
Null RatePorcentajeTodos los tipos de campo
Null CountRecuentoTodos los tipos de campo

Métricas contextuales

Estas 5 métricas van más allá del «¿está ahí?» para preguntar «¿es significativo?». Requieren el modo de análisis Contextual Completeness.

MétricaTipoSe aplica a
Placeholder RatePorcentajeSolo campos de texto
Placeholder CountRecuentoSolo campos de texto
Rich Text RatioPorcentajeSolo campos de texto
Text Field UtilizationPorcentajeSolo String y TextArea
Average UtilizationPorcentajeSolo String y TextArea

Cobertura por tipo de campo

DQS admite comprobaciones de completitud en todos los tipos de campo estándar de Salesforce:

Grupo de coberturaTipos de campoMétricas disponibles
Todos los tipos (20)String, TextArea, LongTextArea, Html, EncryptedText, Picklist, Multipicklist, Email, Phone, URL, Reference (Lookup), Date, DateTime, Double, Integer, Currency, Percent, Boolean, Combobox, IdCompleteness Rate, Populated/Incompleted Count, Null Rate/Count
Campos de texto (8)Text, TextArea, LongTextArea, Html, EncryptedText, Email, Phone, URLLo anterior + Placeholder Rate/Count, Rich Text Ratio
String y TextArea (2)String, TextAreaLo anterior + Text Field Utilization, Average Utilization

Dos modos de análisis

DQS ofrece dos modos de análisis de completitud:

Basic Completeness responde a la pregunta: «¿están cumplimentados los campos?». Produce las 5 métricas base y cubre lo esencial que cualquier org necesita para una comprobación de higiene de datos o una auditoría rápida.

Contextual Completeness va más allá. Produce las 10 métricas, incluyendo la detección de placeholders, el análisis de texto enriquecido y la utilización de campos. Utilice este modo cuando necesite distinguir entre datos presentes y datos útiles.

Necesidad de negocioModo recomendado
Comprobación rápida de higiene o auditoría de línea baseBasic Completeness
Evaluación de migración de datosContextual (la detección de placeholders captura datos falsos de sistemas heredados)
Evaluación de preparación para la IAContextual (Rich Text Ratio y las métricas de utilización evalúan la profundidad del contenido)
Gobernanza de datos continuaEmpiece con Basic y pase a Contextual cuando esté listo para un análisis más profundo

Configurar la completitud

DQS ofrece cuatro entradas de configuración para la completitud. Cada una puede establecerse a nivel global (se aplica a todos los campos) y sobrescribirse a nivel de campo individual.

AjusteQué controla
Blank As IncompleteCuando está activada, DQS trata las cadenas vacías y los valores de solo espacios en blanco como incompletos. Por defecto: activada.
Placeholders As IncompleteCuando está activada, DQS trata los valores placeholder (como «N/A» o «TBD») como incompletos. Por defecto: desactivada.
Placeholder ValuesLa lista de cadenas que DQS trata como placeholders. Usted las define en función de los patrones de entrada de datos de su org (p. ej., N/A, TBD, Unknown, --, 000-000-0000).
Case-Sensitive PlaceholdersControla si la coincidencia de placeholders distingue entre mayúsculas y minúsculas. Cuando está activada, «tbd» y «TBD» se tratan como valores distintos. Por defecto: sensible a mayúsculas.

Consejo: empiece con los placeholders habituales («N/A», «TBD», «Unknown», «—») y añada valores específicos de la org a medida que los descubra en los resultados del análisis.

Incidencias habituales de completitud

Campos opcionales nunca cumplimentados

Cuando los campos son opcionales, los usuarios los omiten. Con el tiempo, campos valiosos como Company Description o LinkedIn URL tienen tasas de completitud cercanas a cero.

Solución: haga obligatorios los campos críticos o cree avisos durante la edición del registro.

Importaciones masivas con lagunas

Las migraciones de datos y las importaciones de listas suelen carecer de valores para ciertos campos. Una lista de contactos comprada no tiene asociación a Account. Una exportación de un sistema heredado carece de valores de Industry estandarizados.

Solución: audite las importaciones antes de cargarlas. Utilice DQS para establecer líneas base y hacer seguimiento de la mejora tras cada importación.

Abuso de placeholders

Los usuarios introducen «N/A» o «TBD» para superar las reglas de validación. El campo parece completo pero no contiene datos utilizables. Los informes estándar los cuentan como cumplimentados.

Solución: active la detección de placeholders y defina su lista de valores placeholder. Revise y actualice los valores placeholder durante el mantenimiento regular de datos.

Espacios en blanco de relleno

Algunas integraciones o la entrada manual dejan campos con solo espacios en blanco. Salesforce los cuenta como «cumplimentados», pero no contienen nada útil.

Solución: active la detección de blancos para detectar los valores de solo espacios.

Buenas prácticas

Priorice por impacto en el negocio

No todos los campos necesitan una completitud elevada. Céntrese en los campos que impulsan la automatización, aparecen en paneles ejecutivos, alimentan la IA y Agentforce o respaldan los requisitos de cumplimiento.

Haga seguimiento de las tendencias

Una única puntuación de completitud es una instantánea. Haga seguimiento de las puntuaciones a lo largo de varios análisis para detectar la degradación pronto, medir las iniciativas de mejora e identificar las fuentes de datos problemáticas.

Aborde las causas raíz

Una baja completitud señala un problema de proceso. Investigue si los usuarios se saltan los campos, si las importaciones pierden datos o si las integraciones fallan en silencio. Arregle el origen, no solo el síntoma.

Utilice el embudo de diagnóstico

No se detenga en Completeness Rate. Recorra el embudo: compruebe la escala (Populated Count), identifique la causa (Null frente a Placeholder) y después evalúe la calidad del contenido (Rich Text Ratio, utilización). Cada paso revela un tipo de problema distinto con una corrección distinta.

Próximos pasos

Ya comprende cómo medir y mejorar la completitud. Continúe aprendiendo sobre la siguiente dimensión: