Skip to main content

Consistência

Todas as 6 métricas de consistência que o DQS mede, o fluxo diagnóstico para encontrar fragmentação de valores e como configurar a análise de conformance.

O que é consistência?

Consistência mede se os valores dos seus dados seguem um padrão acordado. Um campo é consistente quando todo registro usa o mesmo termo para o mesmo conceito. É inconsistente quando existem variações que significam a mesma coisa expressas de formas diferentes.

“USA”, “United States” e “US” se referem ao mesmo país. Para o Salesforce, são três valores distintos. Um relatório agrupado por Country gera três linhas em vez de uma. Uma automação que filtra por “USA” deixa de fora 230 registros que contêm “United States”.

Conformance Rate = (Registros conformes / Total de registros) x 100

Se 850 de 1.000 registros de Account têm valor de Country que corresponde à sua lista de valores permitidos, sua taxa de conformance em Country é 85%. Os outros 15% contêm variações que precisam ser padronizadas.

Por que consistência importa

Relatórios

Dados inconsistentes fragmentam seus relatórios. Quando o campo Country contém cinco grafias diferentes do mesmo país, um relatório agrupado por Country mostra cinco linhas em vez de uma. O total está correto, mas o agrupamento está errado. Os dashboards executivos construídos sobre isso contam uma história enganosa.

Automação

A automação do Salesforce depende de correspondências exatas. Um workflow filtrando por Country = "USA" deixa de fora registros com “United States” e “US”. A automação roda certo nos que casam e silenciosamente pula o resto.

IA e Agentforce

Modelos de IA tratam cada variação como um conceito separado. “USA” e “United States” viram dois países diferentes aos olhos do modelo. O Agentforce gera respostas usando os valores dos seus campos. Valores inconsistentes produzem saídas inconsistentes.

SistemaImpacto da consistência
RelatóriosAgrupamentos fragmentados, totais enganosos
WorkflowsFiltros deixam variações de fora
Duplicate RulesVariações impedem a correspondência correta
AgentforceValores inconsistentes geram respostas pouco confiáveis

Como o DQS mede consistência

O DQS produz 6 métricas de consistência organizadas em torno de uma pergunta diagnóstica: “Seus valores seguem um padrão? Se não, o que estão fazendo em vez disso?”

Pense nessas métricas como um fluxo diagnóstico. Cada passo revela uma camada diferente do problema.

Passo 1: Quão consistente está?

Conformance Rate é a métrica principal. Calcula o percentual de registros em que o valor do campo corresponde a um dos seus valores permitidos definidos. Esse é o número para o dashboard.

Você roda um scan no objeto Account. O campo Country mostra Conformance Rate de 72%. Isso significa que 28% dos seus Accounts contêm valores de country fora da sua lista permitida. Suas regras de atribuição de território, dashboards regionais e lógica de localização operam com dados incompletos.

Toda outra métrica de consistência existe para explicar como se parecem esses 28% não conformes.

Passo 2: Qual é a escala?

Taxas dizem severidade. Contagens dizem volume de trabalho. Duas métricas respondem a essa questão:

MétricaO que ela diz
Conformance CountQuantos registros correspondem aos seus valores permitidos. Use para reporting de cobertura.
Non-Conforming CountQuantos registros caem fora dos seus valores permitidos. Use para dimensionar projetos de limpeza.

Esses dois números sempre somam ao total de registros. Se Conformance Count é 720 e Non-Conforming Count é 280, você tem exatamente 1.000 registros avaliados.

Exemplo: Sua data steward precisa limpar o campo Industry. Non-Conforming Count é 3.400. Ela agora sabe o escopo do projeto, consegue alocar recursos e definir um cronograma realista para a padronização.

Passo 3: Quão fragmentado está?

Variant Count mede o número de valores distintos encontrados em um campo em todos os registros. Responde: “De quantas formas diferentes as pessoas expressam esse dado?”

Essa métrica funciona como indicador de saúde de schema. Um campo Country com 5 valores distintos provavelmente está bem controlado. Um campo Country com 47 valores distintos sinaliza séria fragmentação, antes mesmo de verificar conformance.

CampoTotal de registrosVariant CountAvaliação
Country1.0005Bem controlado, provavelmente consistente
Country1.00047Altamente fragmentado, precisa padronizar
Industry50012Razoável, provavelmente restrito por picklist
Industry50089Caos de texto livre, precisa de atenção imediata

Exemplo: Durante uma auditoria, você varre Lead_Source__c em Leads. Variant Count retorna 34. Seu time de marketing definiu 8 lead sources. Os 26 variantes restantes são erros de escrita, abreviações e entradas ad hoc de integrações. O picklist está tecnicamente exigido na UI, mas registros criados via API contornam isso.

Passo 4: Quais são os valores reais?

Dominant Values retorna os N valores mais frequentes no campo, com a contagem de cada um. Diz como seus dados realmente se parecem, não como você espera que se pareçam.

PosiçãoValorContagemPercentual
1United States45045%
2USA23023%
3US18018%
4U.S.A.454,5%
5United States of America151,5%

Essa tabela revela três coisas. Primeiro, o padrão de facto: “United States” com 45% é o que a maioria dos usuários digita. Segundo, as variações comuns: “USA” e “US” somam outros 41%. Terceiro, a cauda longa: “U.S.A.” e “United States of America” são raros, mas presentes.

Exemplo: Seu time está debatendo padronizar Country em códigos ISO (“US”) ou em nomes completos (“United States”). Dominant Values mostra que 45% dos registros já usam “United States”. Padronizar para esse valor exige mudar 55% dos registros. Padronizar para “US” exige mudar 82%. Os dados mostram o caminho mais barato.

Por que taxas e contagens vêm em pares

As métricas de conformance vêm como taxa (Conformance Rate) e o inverso (Non-Conformance Rate), além das contagens absolutas para os dois lados. Isso é intencional:

  • Taxas são para dashboards, reporting executivo e acompanhamento de tendências. “Conformance subiu de 72% para 94% neste trimestre.”
  • Contagens são para planejamento de projetos, estimativa de esforço e escopo de limpeza. “Temos 3.400 registros não conformes para corrigir.”

Use taxas para comunicar progresso. Use contagens para planejar trabalho.

Referência de métricas

Métricas de base

Essas 2 métricas formam a base de toda análise de consistência. Informam a taxa de conformance e a contagem de registros que correspondem.

MétricaTipoO que mede
Conformance RatePercentualParcela de registros correspondendo aos valores permitidos
Conformance CountContagemNúmero de registros correspondendo aos valores permitidos

Métricas avançadas

Essas 4 métricas vão além de “corresponde?” para perguntar “como é o dado que não corresponde?”. Exigem o modo Advanced Conformance Analysis.

MétricaTipoO que mede
Non-Conforming CountContagemRegistros com valores fora da lista permitida
Non-Conformance RatePercentualParcela de registros fora da lista permitida
Variant CountContagemTotal de valores distintos encontrados no campo
Dominant ValuesListaTop N valores mais frequentes com suas contagens

Cobertura de tipos de campo

O DQS suporta verificações de consistência nos seguintes tipos de campo do Salesforce:

Tipo de campoFoco de consistência
String (Text)Abreviações, grafia, caixa
TextAreaPadronização de texto livre
PicklistValidar os valores reais contra as opções esperadas
EmailPadronização de domínio, consistência de formato
PhonePadronização de formato (códigos de área, separadores)
URLConsistência de protocolo e path

Dois modos de análise

O DQS oferece dois modos de análise de consistência:

Conformance Check responde à pergunta: “Os valores do campo correspondem à minha lista permitida?” Produz as 2 métricas de base e cobre o essencial para uma auditoria rápida de conformance.

Advanced Conformance Analysis vai mais fundo. Produz todas as 6 métricas, incluindo contagens não conformes, detecção de variantes e distribuição de valores dominantes. Use este modo quando precisar entender o cenário completo da fragmentação de valores, e não apenas a pontuação de conformance.

Necessidade de negócioModo recomendado
Auditoria rápida de conformance ou checagem baseConformance Check
Limpeza de migração de dadosAdvanced (variant count revela o caos vindo da importação)
Avaliação de prontidão para IAAdvanced (valores dominantes mostram o que a IA vai aprender)
Governança contínuaComece com Conformance Check e migre para Advanced quando estiver pronto

Configurando consistência

O DQS oferece quatro inputs de configuração para consistência. Cada um pode ser definido no nível global (aplica-se a todos os campos) e sobrescrito no nível do campo.

ConfiguraçãoO que controla
Expected ValuesA lista de valores que o DQS trata como “conformes”. Qualquer valor fora dessa lista é sinalizado como não conforme. Obrigatório: você precisa definir pelo menos um valor antes de rodar um scan.
Case SensitiveControla se a correspondência leva em conta maiúsculas/minúsculas. Quando desativado (padrão), “Premium”, “PREMIUM” e “premium” correspondem a “Premium”. Quando ativado, só o casamento exato conta.
Top NQuantos valores dominantes retornar (1 a 100). Controla o tamanho da saída de Dominant Values. Padrão: 5.
Min FrequencyA quantidade mínima de vezes que um valor precisa aparecer para entrar na saída de Dominant Values (1 a 1.000). Filtra valores ultra-raros que só adicionam ruído. Padrão: 1.

Dica: Comece usando Import from Field para ver quais valores realmente existem nos seus dados antes de definir sua lista de valores permitidos.

Import from Field: configuração por descoberta

Um desafio comum em consistência é saber quais valores esperar. Você não consegue definir valores permitidos se não sabe o que seus dados contêm.

Import from Field resolve isso. Consulta os dados reais do campo, agrupa os valores por frequência e exibe os resultados como uma checklist.

Como funciona:

  1. Abra a configuração de Expected Values.
  2. Clique em Import from Field. O DQS consulta os dados ao vivo e retorna valores distintos ordenados por frequência.
  3. Revise a checklist. Cada valor mostra quantos registros o contêm.
  4. Marque os valores que você considera corretos. Deixe desmarcados os incorretos, malformados ou placeholders.
  5. Clique em Add Selected. Os valores marcados populam sua lista de valores permitidos.

Exemplo: Você configura consistência para um campo Rating__c. Import from Field retorna:

ValorRegistros
Hot284
Warm198
Cold156
Very High23
240 km/h12
N/A8

Os três primeiros são seus ratings reais. Você os marca. “Very High” é erro de digitação. “240 km/h” é claramente dado de campo errado. “N/A” é placeholder. Você deixa esses desmarcados. Quando o scan rodar, esses 43 registros aparecem como não conformes, e sua lista de valores permitidos é construída a partir do que seus dados realmente contêm.

Esse fluxo inverte a abordagem tradicional de “adivinhe primeiro, corrija depois”. Você descobre primeiro, depois define o padrão.

Problemas comuns de consistência

Variações de Country e State

A inconsistência mais comum em dados do Salesforce. Sem padronização, um único conceito como “United States” aparece como 5 ou mais valores distintos. Relatórios fragmentam. Filtros deixam registros de fora. Regras de território falham.

Correção: Habilite os State and Country Picklists do Salesforce para todos os campos de endereço. Use o DQS para encontrar e limpar valores não conformes existentes.

Campos de texto livre sem governança

Campos de texto sem restrições por picklist acumulam variações com o tempo. Industry, Job Title, Lead Source e Department são grandes ofensores quando implementados como texto livre.

Correção: Converta campos de texto livre de alto valor para picklists. Use Import from Field para ver sua distribuição atual antes de definir as opções.

Variações criadas por integrações

Sistemas externos e APIs escrevem registros que contornam a validação da UI do Salesforce. Uma plataforma de marketing automation escreve “Info Technology” enquanto seu padrão é “Information Technology”. Essas variações se acumulam silenciosamente.

Correção: Aplique regras de mapeamento de valores na camada de integração. Rode scans periódicos para pegar novas variações em fontes que você não controla.

Inconsistências de caixa

Usuários digitam “Active”, “active” e “ACTIVE” em registros diferentes. Com case-sensitive desativado, o DQS conta os três como conformes. Mas o campo ainda contém três grafias diferentes nos dados brutos.

Correção: Decida se a caixa importa para o seu caso de uso. Para campos voltados ao display, padronize a caixa via limpeza de dados. Para propósitos de correspondência, desative a sensibilidade a caixa na configuração do DQS.

Melhores práticas

Defina padrões antes de scanear

Documente o valor esperado para cada campo restrito antes de rodar seu primeiro scan. Sem um padrão claro, você não tem baseline para comparar.

CampoPadrãoRazão
CountryCódigos ISO 3166-1 alpha-2 (US, CA, DE)Padrão do setor, compacto
IndustryTaxonomia custom de 15 valoresCorresponde às categorias de reporting
Lead Source8 fontes definidas pelo marketingAlinha com o tracking de campanhas

Use o fluxo de descoberta para campos desconhecidos

Para campos em que você não tem um padrão predefinido, use Import from Field primeiro. Deixe os dados dizerem qual é o padrão de facto. O valor de maior frequência costuma ser a escolha certa como seu valor canônico.

Acompanhe conformance ao longo do tempo

Uma pontuação isolada é um snapshot. Acompanhe ao longo de vários scans para detectar degradação cedo, medir o progresso da limpeza e identificar fontes de dados que introduzem novas variações.

Use Variant Count como alerta antecipado

Monitore Variant Count entre scans. Um campo que salta de 12 para 28 valores distintos entre scans tem uma nova fonte de variação. Investigue antes que o problema escale.

Priorize por impacto de negócio

Nem todo campo precisa de 100% de conformance. Foque em campos que alimentam relatórios (Country, Industry), automação (Status, Stage) ou IA e Agentforce.

Próximos passos

Você concluiu as cinco dimensões de qualidade de dados. Continue aprendendo: