Consistência: cenários de configuração

O que estes cenários cobrem

Esta página apresenta três configurações reais de consistência, da configuração inicial à leitura dos resultados. Cada cenário usa um contexto de negócio diferente e um modo de análise distinto.

Estes cenários se apoiam nos conceitos e métricas do artigo principal de Consistência. Leia primeiro se termos como Conformance Rate, Variant Count e Dominant Values forem novos.

Cenário 1: padronização do campo Country com descoberta

O contexto de negócio

Sua org tem 15.000 registros de Account vindos de 3 empresas mescladas. O campo Country é texto livre. Dashboards regionais mostram dados fragmentados: “United States” é uma linha, “USA” outra, “US” uma terceira. Regras de atribuição de território perdem registros porque filtram por uma única grafia. Você precisa padronizar, mas não sabe quais valores existem nos três sistemas.

Walkthrough da configuração

Comece com Import from Field para descobrir o que seus dados realmente contêm antes de definir os valores permitidos.

Abra a configuração de Expected Values do campo Country.
Clique em Import from Field. O DQS consulta os dados ao vivo e retorna valores distintos ordenados por frequência.
Revise a checklist. O import revela o quadro completo:

Valor	Registros
United States	4.500
USA	2.300
US	1.800
Canada	1.400
U.S.A.	450
United States of America	150
… (mais 41 variações)	…

Decida sobre seu padrão. Códigos ISO (“US”, “CA”, “UK”) são compactos, padrão de setor e inequívocos. Marque os códigos ISO do import.
Clique em Add Selected para popular seus valores permitidos.

Defina o restante da configuração:

Configuração	Valor	Razão
Modo de análise	Advanced Conformance Analysis	Você precisa de variant counts e dominant values para dimensionar a limpeza
Expected Values	US, CA, UK, DE, FR, AU, JP	Códigos ISO dos seus mercados ativos
Case Sensitive	OFF	Pega “us”, “Us” e “US” como o mesmo valor
Top N	10	Veja as variações mais comuns
Min Frequency	5	Filtre erros isolados

O que o scan produz

Métrica	Valor
Conformance Rate	12%
Conformance Count	1.800
Non-Conforming Count	13.200
Variant Count	47
Dominant Values	Top 10 valores com contagens (ver tabela acima)

Lendo os resultados

12% de conformance é esperado. Você definiu um padrão novo (códigos ISO) para o qual os dados nunca foram normalizados. Apenas os 1.800 registros já contendo “US” casam. Não é um score ruim. É seu ponto de partida.

47 variantes revelam a escala da fragmentação. Três sistemas mesclados produziram 47 formas diferentes de expressar países. Sem esse número, você subestimaria o esforço.

Dominant Values mostra onde focar. As três maiores variações (“United States”, “USA”, “US”) somam 8.600 registros. Padronizar só esses três já sobe seu conformance de 12% para 69%. Comece por aí.

Non-Conforming Count (13.200) é o escopo exato de limpeza. Seu data steward tem um tamanho de projeto concreto, não um chute.

Próxima ação

Construa uma tabela de mapeamento de valores usando o Dominant Values. Mapeie “United States” para “US”, “USA” para “US”, e assim por diante. Rode a normalização. Re-execute o scan para verificar seu novo Conformance Rate.

Cenário 2: validação de Lead Rating

O contexto de negócio

Seu campo Lead Rating (Rating__c) é texto que aceita “Hot”, “Warm” ou “Cold”. Gerentes de vendas reportam valores estranhos nos relatórios de pipeline. Um filtro por Rating = "Hot" retorna menos registros do que o esperado. Você precisa de uma auditoria rápida de conformance para saber o que está no campo e quantos registros precisam de limpeza.

Walkthrough da configuração

Comece com Import from Field para ver os valores reais antes de configurar o scan.

Abra a configuração de Expected Values para Rating__c.
Clique em Import from Field. O import retorna:

Valor	Registros
Hot	284
Warm	198
Cold	156
Very High	23
240 km/h	12
N/A	8

Os três primeiros são seus ratings reais. “Very High” vem de outra picklist (alguém colou do campo errado). “240 km/h” é claramente dado de outro campo. “N/A” é placeholder.

Marque “Hot”, “Warm” e “Cold”. Deixe o resto desmarcado.
Clique em Add Selected.

Defina o restante:

Configuração	Valor	Razão
Modo de análise	Conformance Check	Você precisa de uma resposta sim/não, não análise profunda
Expected Values	Hot, Warm, Cold	Seus três ratings válidos
Case Sensitive	OFF	Pega “hot”, “HOT” e “Hot” como casando

O que o scan produz

Métrica	Valor
Conformance Rate	93,7%
Conformance Count	638

Lendo os resultados

93,7% estão conformes. Isso significa que 43 registros têm dados lixo. Para uma auditoria rápida, o Conformance Check dá a resposta rápido, sem computar métricas avançadas.

O passo de Import from Field já disse como é o lixo. “Very High” (23 registros de picklist errado), “240 km/h” (12 registros com dado de campo errado) e “N/A” (8 placeholders). Você não precisa de Dominant Values aqui, o import já deu a quebra antes do scan rodar.

43 registros é uma limpeza gerenciável. Não é um projeto de migração. É uma correção manual de 30 minutos ou um único job de atualização.

Próxima ação

Conserte os 43 registros não conformes. Depois converta Rating__c de texto para picklist para evitar problemas futuros. Registros criados via API contornam a validação da picklist, então rode scans periódicos para pegar novas variações de integrações.

Cenário 3: conformance de Job Title para persona targeting

O contexto de negócio

Seu time de marketing roda campanhas baseadas em persona, mirando “VP ou acima”. O campo Title é texto livre com milhares de variações. Antes de cada campanha, alguém busca manualmente por palavras-chave, perde metade das variações e monta uma audiência incompleta. O time precisa de uma resposta baseada em dados a duas perguntas: “Quantos contatos VP+ temos?” e “Quais títulos os demais têm?”

Walkthrough da configuração

Abra a configuração de Expected Values para Title em Contacts.
Clique em Import from Field. Retorna centenas de valores. Muitos para checar individualmente, mas as frequências dão contexto.
Defina seus valores permitidos com base no mapeamento de persona. Marque ou digite os valores que o time considera “VP ou acima”:

VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President

Clique em Add Selected.

Defina o restante:

Configuração	Valor	Razão
Modo de análise	Advanced Conformance Analysis	Você precisa da distribuição de valores completa
Expected Values	(os 16 valores acima)	Sua definição de persona VP+
Case Sensitive	OFF	Pega “vp of sales”, “VP of Sales”, “VP OF SALES”
Top N	20	Veja uma distribuição ampla
Min Frequency	5	Filtre entradas isoladas como “Chief Happiness Officer”

O que o scan produz

Métrica	Valor
Conformance Rate	34%
Conformance Count	3.400
Non-Conforming Count	6.600
Variant Count	312

Dominant Values (Top 20):

Pos	Valor	Contagem
1	Manager	820
2	Sales Representative	650
3	Account Executive	480
4	Director of Marketing	340
5	VP of Sales	290
6	Senior Manager	275
7	Consultant	240
8	Engineer	210
9	CEO	195
10	Head of Operations	180
…	(mais 10)	…

Lendo os resultados

34% de conformance não é falha. Isso não é um problema de qualidade. Significa que 34% dos seus Contacts têm cargos VP+, e essa é a audiência da campanha. O número responde ao que o marketing vinha adivinhando.

312 no Variant Count confirma que Title em texto livre é altamente fragmentado. 312 valores distintos em 10.000 Contacts. É normal para campos de texto livre e explica por que buscas manuais perdem pessoas.

Dominant Values mostra os cargos que você tem de fato. Muitos dos valores do topo estão abaixo de VP (Manager, Sales Rep, Account Executive). Isso é esperado. Esses contatos são registros válidos com cargos válidos. Caem fora da persona-alvo.

Non-Conforming Count (6.600) NÃO é escopo de limpeza. Ao contrário do cenário de Country, estes não são registros sujos. São contatos com cargos fora do filtro VP+. “Manager” é um cargo real, não um erro. Trate Non-Conforming Count como “contatos fora desta persona”, não “registros para corrigir”.

O insight real: Você agora tem um tamanho de audiência baseado em dados. 3.400 contatos VP+, verificados varrendo os dados reais. Sem mais buscas manuais.

Próxima ação

Use o Conformance Count (3.400) como tamanho da audiência VP+. Revise a lista de Dominant Values por cargos esquecidos. “Senior Manager” (275 registros) e “Head of Operations” (180 registros) são fronteiriços. Se qualificam para suas campanhas, adicione aos valores permitidos e re-execute.

Escolhendo sua configuração

Se você precisa…	Comece com	Configurações-chave
Auditar um campo controlado (picklist, rating, status)	Import from Field, depois Conformance Check	Expected Values do import, Case Sensitive OFF
Padronizar um campo fragmentado (country, industry)	Import from Field, depois Advanced Conformance Analysis	Expected Values como seu padrão-alvo, Top N 10+, Min Frequency 5+
Dimensionar uma audiência ou segmento a partir de texto livre	Import from Field, depois Advanced Conformance Analysis	Expected Values como sua definição, Top N 20, Min Frequency 5
Obter uma baseline rápida antes de uma limpeza	Import from Field, depois Conformance Check	Expected Values do seu padrão

Para a explicação completa das 6 métricas, modos de análise e inputs de configuração, volte ao artigo principal de Consistência.

Pronto para medir sua qualidade de dados? Faça a AI Readiness Assessment para ver suas pontuações de consistência e muito mais.