O que é consistência?
Consistência mede se os valores dos seus dados seguem um padrão acordado. Um campo é consistente quando todo registro usa o mesmo termo para o mesmo conceito. É inconsistente quando existem variações que significam a mesma coisa expressas de formas diferentes.
“USA”, “United States” e “US” se referem ao mesmo país. Para o Salesforce, são três valores distintos. Um relatório agrupado por Country gera três linhas em vez de uma. Uma automação que filtra por “USA” deixa de fora 230 registros que contêm “United States”.
Conformance Rate = (Registros conformes / Total de registros) x 100
Se 850 de 1.000 registros de Account têm valor de Country que corresponde à sua lista de valores permitidos, sua taxa de conformance em Country é 85%. Os outros 15% contêm variações que precisam ser padronizadas.
Por que consistência importa
Relatórios
Dados inconsistentes fragmentam seus relatórios. Quando o campo Country contém cinco grafias diferentes do mesmo país, um relatório agrupado por Country mostra cinco linhas em vez de uma. O total está correto, mas o agrupamento está errado. Os dashboards executivos construídos sobre isso contam uma história enganosa.
Automação
A automação do Salesforce depende de correspondências exatas. Um workflow filtrando por Country = "USA" deixa de fora registros com “United States” e “US”. A automação roda certo nos que casam e silenciosamente pula o resto.
IA e Agentforce
Modelos de IA tratam cada variação como um conceito separado. “USA” e “United States” viram dois países diferentes aos olhos do modelo. O Agentforce gera respostas usando os valores dos seus campos. Valores inconsistentes produzem saídas inconsistentes.
| Sistema | Impacto da consistência |
|---|---|
| Relatórios | Agrupamentos fragmentados, totais enganosos |
| Workflows | Filtros deixam variações de fora |
| Duplicate Rules | Variações impedem a correspondência correta |
| Agentforce | Valores inconsistentes geram respostas pouco confiáveis |
Como o DQS mede consistência
O DQS produz 6 métricas de consistência organizadas em torno de uma pergunta diagnóstica: “Seus valores seguem um padrão? Se não, o que estão fazendo em vez disso?”
Pense nessas métricas como um fluxo diagnóstico. Cada passo revela uma camada diferente do problema.
Passo 1: Quão consistente está?
Conformance Rate é a métrica principal. Calcula o percentual de registros em que o valor do campo corresponde a um dos seus valores permitidos definidos. Esse é o número para o dashboard.
Você roda um scan no objeto Account. O campo Country mostra Conformance Rate de 72%. Isso significa que 28% dos seus Accounts contêm valores de country fora da sua lista permitida. Suas regras de atribuição de território, dashboards regionais e lógica de localização operam com dados incompletos.
Toda outra métrica de consistência existe para explicar como se parecem esses 28% não conformes.
Passo 2: Qual é a escala?
Taxas dizem severidade. Contagens dizem volume de trabalho. Duas métricas respondem a essa questão:
| Métrica | O que ela diz |
|---|---|
| Conformance Count | Quantos registros correspondem aos seus valores permitidos. Use para reporting de cobertura. |
| Non-Conforming Count | Quantos registros caem fora dos seus valores permitidos. Use para dimensionar projetos de limpeza. |
Esses dois números sempre somam ao total de registros. Se Conformance Count é 720 e Non-Conforming Count é 280, você tem exatamente 1.000 registros avaliados.
Exemplo: Sua data steward precisa limpar o campo Industry. Non-Conforming Count é 3.400. Ela agora sabe o escopo do projeto, consegue alocar recursos e definir um cronograma realista para a padronização.
Passo 3: Quão fragmentado está?
Variant Count mede o número de valores distintos encontrados em um campo em todos os registros. Responde: “De quantas formas diferentes as pessoas expressam esse dado?”
Essa métrica funciona como indicador de saúde de schema. Um campo Country com 5 valores distintos provavelmente está bem controlado. Um campo Country com 47 valores distintos sinaliza séria fragmentação, antes mesmo de verificar conformance.
| Campo | Total de registros | Variant Count | Avaliação |
|---|---|---|---|
| Country | 1.000 | 5 | Bem controlado, provavelmente consistente |
| Country | 1.000 | 47 | Altamente fragmentado, precisa padronizar |
| Industry | 500 | 12 | Razoável, provavelmente restrito por picklist |
| Industry | 500 | 89 | Caos de texto livre, precisa de atenção imediata |
Exemplo: Durante uma auditoria, você varre Lead_Source__c em Leads. Variant Count retorna 34. Seu time de marketing definiu 8 lead sources. Os 26 variantes restantes são erros de escrita, abreviações e entradas ad hoc de integrações. O picklist está tecnicamente exigido na UI, mas registros criados via API contornam isso.
Passo 4: Quais são os valores reais?
Dominant Values retorna os N valores mais frequentes no campo, com a contagem de cada um. Diz como seus dados realmente se parecem, não como você espera que se pareçam.
| Posição | Valor | Contagem | Percentual |
|---|---|---|---|
| 1 | United States | 450 | 45% |
| 2 | USA | 230 | 23% |
| 3 | US | 180 | 18% |
| 4 | U.S.A. | 45 | 4,5% |
| 5 | United States of America | 15 | 1,5% |
Essa tabela revela três coisas. Primeiro, o padrão de facto: “United States” com 45% é o que a maioria dos usuários digita. Segundo, as variações comuns: “USA” e “US” somam outros 41%. Terceiro, a cauda longa: “U.S.A.” e “United States of America” são raros, mas presentes.
Exemplo: Seu time está debatendo padronizar Country em códigos ISO (“US”) ou em nomes completos (“United States”). Dominant Values mostra que 45% dos registros já usam “United States”. Padronizar para esse valor exige mudar 55% dos registros. Padronizar para “US” exige mudar 82%. Os dados mostram o caminho mais barato.
Por que taxas e contagens vêm em pares
As métricas de conformance vêm como taxa (Conformance Rate) e o inverso (Non-Conformance Rate), além das contagens absolutas para os dois lados. Isso é intencional:
- Taxas são para dashboards, reporting executivo e acompanhamento de tendências. “Conformance subiu de 72% para 94% neste trimestre.”
- Contagens são para planejamento de projetos, estimativa de esforço e escopo de limpeza. “Temos 3.400 registros não conformes para corrigir.”
Use taxas para comunicar progresso. Use contagens para planejar trabalho.
Referência de métricas
Métricas de base
Essas 2 métricas formam a base de toda análise de consistência. Informam a taxa de conformance e a contagem de registros que correspondem.
| Métrica | Tipo | O que mede |
|---|---|---|
| Conformance Rate | Percentual | Parcela de registros correspondendo aos valores permitidos |
| Conformance Count | Contagem | Número de registros correspondendo aos valores permitidos |
Métricas avançadas
Essas 4 métricas vão além de “corresponde?” para perguntar “como é o dado que não corresponde?”. Exigem o modo Advanced Conformance Analysis.
| Métrica | Tipo | O que mede |
|---|---|---|
| Non-Conforming Count | Contagem | Registros com valores fora da lista permitida |
| Non-Conformance Rate | Percentual | Parcela de registros fora da lista permitida |
| Variant Count | Contagem | Total de valores distintos encontrados no campo |
| Dominant Values | Lista | Top N valores mais frequentes com suas contagens |
Cobertura de tipos de campo
O DQS suporta verificações de consistência nos seguintes tipos de campo do Salesforce:
| Tipo de campo | Foco de consistência |
|---|---|
| String (Text) | Abreviações, grafia, caixa |
| TextArea | Padronização de texto livre |
| Picklist | Validar os valores reais contra as opções esperadas |
| Padronização de domínio, consistência de formato | |
| Phone | Padronização de formato (códigos de área, separadores) |
| URL | Consistência de protocolo e path |
Dois modos de análise
O DQS oferece dois modos de análise de consistência:
Conformance Check responde à pergunta: “Os valores do campo correspondem à minha lista permitida?” Produz as 2 métricas de base e cobre o essencial para uma auditoria rápida de conformance.
Advanced Conformance Analysis vai mais fundo. Produz todas as 6 métricas, incluindo contagens não conformes, detecção de variantes e distribuição de valores dominantes. Use este modo quando precisar entender o cenário completo da fragmentação de valores, e não apenas a pontuação de conformance.
| Necessidade de negócio | Modo recomendado |
|---|---|
| Auditoria rápida de conformance ou checagem base | Conformance Check |
| Limpeza de migração de dados | Advanced (variant count revela o caos vindo da importação) |
| Avaliação de prontidão para IA | Advanced (valores dominantes mostram o que a IA vai aprender) |
| Governança contínua | Comece com Conformance Check e migre para Advanced quando estiver pronto |
Configurando consistência
O DQS oferece quatro inputs de configuração para consistência. Cada um pode ser definido no nível global (aplica-se a todos os campos) e sobrescrito no nível do campo.
| Configuração | O que controla |
|---|---|
| Expected Values | A lista de valores que o DQS trata como “conformes”. Qualquer valor fora dessa lista é sinalizado como não conforme. Obrigatório: você precisa definir pelo menos um valor antes de rodar um scan. |
| Case Sensitive | Controla se a correspondência leva em conta maiúsculas/minúsculas. Quando desativado (padrão), “Premium”, “PREMIUM” e “premium” correspondem a “Premium”. Quando ativado, só o casamento exato conta. |
| Top N | Quantos valores dominantes retornar (1 a 100). Controla o tamanho da saída de Dominant Values. Padrão: 5. |
| Min Frequency | A quantidade mínima de vezes que um valor precisa aparecer para entrar na saída de Dominant Values (1 a 1.000). Filtra valores ultra-raros que só adicionam ruído. Padrão: 1. |
Dica: Comece usando Import from Field para ver quais valores realmente existem nos seus dados antes de definir sua lista de valores permitidos.
Import from Field: configuração por descoberta
Um desafio comum em consistência é saber quais valores esperar. Você não consegue definir valores permitidos se não sabe o que seus dados contêm.
Import from Field resolve isso. Consulta os dados reais do campo, agrupa os valores por frequência e exibe os resultados como uma checklist.
Como funciona:
- Abra a configuração de Expected Values.
- Clique em Import from Field. O DQS consulta os dados ao vivo e retorna valores distintos ordenados por frequência.
- Revise a checklist. Cada valor mostra quantos registros o contêm.
- Marque os valores que você considera corretos. Deixe desmarcados os incorretos, malformados ou placeholders.
- Clique em Add Selected. Os valores marcados populam sua lista de valores permitidos.
Exemplo: Você configura consistência para um campo Rating__c. Import from Field retorna:
| Valor | Registros |
|---|---|
| Hot | 284 |
| Warm | 198 |
| Cold | 156 |
| Very High | 23 |
| 240 km/h | 12 |
| N/A | 8 |
Os três primeiros são seus ratings reais. Você os marca. “Very High” é erro de digitação. “240 km/h” é claramente dado de campo errado. “N/A” é placeholder. Você deixa esses desmarcados. Quando o scan rodar, esses 43 registros aparecem como não conformes, e sua lista de valores permitidos é construída a partir do que seus dados realmente contêm.
Esse fluxo inverte a abordagem tradicional de “adivinhe primeiro, corrija depois”. Você descobre primeiro, depois define o padrão.
Problemas comuns de consistência
Variações de Country e State
A inconsistência mais comum em dados do Salesforce. Sem padronização, um único conceito como “United States” aparece como 5 ou mais valores distintos. Relatórios fragmentam. Filtros deixam registros de fora. Regras de território falham.
Correção: Habilite os State and Country Picklists do Salesforce para todos os campos de endereço. Use o DQS para encontrar e limpar valores não conformes existentes.
Campos de texto livre sem governança
Campos de texto sem restrições por picklist acumulam variações com o tempo. Industry, Job Title, Lead Source e Department são grandes ofensores quando implementados como texto livre.
Correção: Converta campos de texto livre de alto valor para picklists. Use Import from Field para ver sua distribuição atual antes de definir as opções.
Variações criadas por integrações
Sistemas externos e APIs escrevem registros que contornam a validação da UI do Salesforce. Uma plataforma de marketing automation escreve “Info Technology” enquanto seu padrão é “Information Technology”. Essas variações se acumulam silenciosamente.
Correção: Aplique regras de mapeamento de valores na camada de integração. Rode scans periódicos para pegar novas variações em fontes que você não controla.
Inconsistências de caixa
Usuários digitam “Active”, “active” e “ACTIVE” em registros diferentes. Com case-sensitive desativado, o DQS conta os três como conformes. Mas o campo ainda contém três grafias diferentes nos dados brutos.
Correção: Decida se a caixa importa para o seu caso de uso. Para campos voltados ao display, padronize a caixa via limpeza de dados. Para propósitos de correspondência, desative a sensibilidade a caixa na configuração do DQS.
Melhores práticas
Defina padrões antes de scanear
Documente o valor esperado para cada campo restrito antes de rodar seu primeiro scan. Sem um padrão claro, você não tem baseline para comparar.
| Campo | Padrão | Razão |
|---|---|---|
| Country | Códigos ISO 3166-1 alpha-2 (US, CA, DE) | Padrão do setor, compacto |
| Industry | Taxonomia custom de 15 valores | Corresponde às categorias de reporting |
| Lead Source | 8 fontes definidas pelo marketing | Alinha com o tracking de campanhas |
Use o fluxo de descoberta para campos desconhecidos
Para campos em que você não tem um padrão predefinido, use Import from Field primeiro. Deixe os dados dizerem qual é o padrão de facto. O valor de maior frequência costuma ser a escolha certa como seu valor canônico.
Acompanhe conformance ao longo do tempo
Uma pontuação isolada é um snapshot. Acompanhe ao longo de vários scans para detectar degradação cedo, medir o progresso da limpeza e identificar fontes de dados que introduzem novas variações.
Use Variant Count como alerta antecipado
Monitore Variant Count entre scans. Um campo que salta de 12 para 28 valores distintos entre scans tem uma nova fonte de variação. Investigue antes que o problema escale.
Priorize por impacto de negócio
Nem todo campo precisa de 100% de conformance. Foque em campos que alimentam relatórios (Country, Industry), automação (Status, Stage) ou IA e Agentforce.
Próximos passos
Você concluiu as cinco dimensões de qualidade de dados. Continue aprendendo:
- No Salesforce: Qualidade de dados no Salesforce - padronize valores de picklist e de referência no Salesforce
- Próximo: Preparação para Agentforce - Conheça os requisitos específicos de IA
- Anterior: Atualidade - Meça frescor e atualidade
- Visão geral: As cinco dimensões - Revisão de todas as dimensões
- Ação: AI Readiness Assessment - Veja suas pontuações de consistência e mais