Skip to main content

Consistência: cenários de configuração

Três walkthroughs práticos mostrando como configurar a análise de consistência do DQS para diferentes necessidades de negócio.

O que estes cenários cobrem

Esta página apresenta três configurações reais de consistência, da configuração inicial à leitura dos resultados. Cada cenário usa um contexto de negócio diferente e um modo de análise distinto.

Estes cenários se apoiam nos conceitos e métricas do artigo principal de Consistência. Leia primeiro se termos como Conformance Rate, Variant Count e Dominant Values forem novos.

Cenário 1: padronização do campo Country com descoberta

O contexto de negócio

Sua org tem 15.000 registros de Account vindos de 3 empresas mescladas. O campo Country é texto livre. Dashboards regionais mostram dados fragmentados: “United States” é uma linha, “USA” outra, “US” uma terceira. Regras de atribuição de território perdem registros porque filtram por uma única grafia. Você precisa padronizar, mas não sabe quais valores existem nos três sistemas.

Walkthrough da configuração

Comece com Import from Field para descobrir o que seus dados realmente contêm antes de definir os valores permitidos.

  1. Abra a configuração de Expected Values do campo Country.
  2. Clique em Import from Field. O DQS consulta os dados ao vivo e retorna valores distintos ordenados por frequência.
  3. Revise a checklist. O import revela o quadro completo:
ValorRegistros
United States4.500
USA2.300
US1.800
Canada1.400
U.S.A.450
United States of America150
… (mais 41 variações)
  1. Decida sobre seu padrão. Códigos ISO (“US”, “CA”, “UK”) são compactos, padrão de setor e inequívocos. Marque os códigos ISO do import.
  2. Clique em Add Selected para popular seus valores permitidos.

Defina o restante da configuração:

ConfiguraçãoValorRazão
Modo de análiseAdvanced Conformance AnalysisVocê precisa de variant counts e dominant values para dimensionar a limpeza
Expected ValuesUS, CA, UK, DE, FR, AU, JPCódigos ISO dos seus mercados ativos
Case SensitiveOFFPega “us”, “Us” e “US” como o mesmo valor
Top N10Veja as variações mais comuns
Min Frequency5Filtre erros isolados

O que o scan produz

MétricaValor
Conformance Rate12%
Conformance Count1.800
Non-Conforming Count13.200
Variant Count47
Dominant ValuesTop 10 valores com contagens (ver tabela acima)

Lendo os resultados

12% de conformance é esperado. Você definiu um padrão novo (códigos ISO) para o qual os dados nunca foram normalizados. Apenas os 1.800 registros já contendo “US” casam. Não é um score ruim. É seu ponto de partida.

47 variantes revelam a escala da fragmentação. Três sistemas mesclados produziram 47 formas diferentes de expressar países. Sem esse número, você subestimaria o esforço.

Dominant Values mostra onde focar. As três maiores variações (“United States”, “USA”, “US”) somam 8.600 registros. Padronizar só esses três já sobe seu conformance de 12% para 69%. Comece por aí.

Non-Conforming Count (13.200) é o escopo exato de limpeza. Seu data steward tem um tamanho de projeto concreto, não um chute.

Próxima ação

Construa uma tabela de mapeamento de valores usando o Dominant Values. Mapeie “United States” para “US”, “USA” para “US”, e assim por diante. Rode a normalização. Re-execute o scan para verificar seu novo Conformance Rate.

Cenário 2: validação de Lead Rating

O contexto de negócio

Seu campo Lead Rating (Rating__c) é texto que aceita “Hot”, “Warm” ou “Cold”. Gerentes de vendas reportam valores estranhos nos relatórios de pipeline. Um filtro por Rating = "Hot" retorna menos registros do que o esperado. Você precisa de uma auditoria rápida de conformance para saber o que está no campo e quantos registros precisam de limpeza.

Walkthrough da configuração

Comece com Import from Field para ver os valores reais antes de configurar o scan.

  1. Abra a configuração de Expected Values para Rating__c.
  2. Clique em Import from Field. O import retorna:
ValorRegistros
Hot284
Warm198
Cold156
Very High23
240 km/h12
N/A8

Os três primeiros são seus ratings reais. “Very High” vem de outra picklist (alguém colou do campo errado). “240 km/h” é claramente dado de outro campo. “N/A” é placeholder.

  1. Marque “Hot”, “Warm” e “Cold”. Deixe o resto desmarcado.
  2. Clique em Add Selected.

Defina o restante:

ConfiguraçãoValorRazão
Modo de análiseConformance CheckVocê precisa de uma resposta sim/não, não análise profunda
Expected ValuesHot, Warm, ColdSeus três ratings válidos
Case SensitiveOFFPega “hot”, “HOT” e “Hot” como casando

O que o scan produz

MétricaValor
Conformance Rate93,7%
Conformance Count638

Lendo os resultados

93,7% estão conformes. Isso significa que 43 registros têm dados lixo. Para uma auditoria rápida, o Conformance Check dá a resposta rápido, sem computar métricas avançadas.

O passo de Import from Field já disse como é o lixo. “Very High” (23 registros de picklist errado), “240 km/h” (12 registros com dado de campo errado) e “N/A” (8 placeholders). Você não precisa de Dominant Values aqui, o import já deu a quebra antes do scan rodar.

43 registros é uma limpeza gerenciável. Não é um projeto de migração. É uma correção manual de 30 minutos ou um único job de atualização.

Próxima ação

Conserte os 43 registros não conformes. Depois converta Rating__c de texto para picklist para evitar problemas futuros. Registros criados via API contornam a validação da picklist, então rode scans periódicos para pegar novas variações de integrações.

Cenário 3: conformance de Job Title para persona targeting

O contexto de negócio

Seu time de marketing roda campanhas baseadas em persona, mirando “VP ou acima”. O campo Title é texto livre com milhares de variações. Antes de cada campanha, alguém busca manualmente por palavras-chave, perde metade das variações e monta uma audiência incompleta. O time precisa de uma resposta baseada em dados a duas perguntas: “Quantos contatos VP+ temos?” e “Quais títulos os demais têm?”

Walkthrough da configuração

  1. Abra a configuração de Expected Values para Title em Contacts.
  2. Clique em Import from Field. Retorna centenas de valores. Muitos para checar individualmente, mas as frequências dão contexto.
  3. Defina seus valores permitidos com base no mapeamento de persona. Marque ou digite os valores que o time considera “VP ou acima”:
VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President
  1. Clique em Add Selected.

Defina o restante:

ConfiguraçãoValorRazão
Modo de análiseAdvanced Conformance AnalysisVocê precisa da distribuição de valores completa
Expected Values(os 16 valores acima)Sua definição de persona VP+
Case SensitiveOFFPega “vp of sales”, “VP of Sales”, “VP OF SALES”
Top N20Veja uma distribuição ampla
Min Frequency5Filtre entradas isoladas como “Chief Happiness Officer”

O que o scan produz

MétricaValor
Conformance Rate34%
Conformance Count3.400
Non-Conforming Count6.600
Variant Count312

Dominant Values (Top 20):

PosValorContagem
1Manager820
2Sales Representative650
3Account Executive480
4Director of Marketing340
5VP of Sales290
6Senior Manager275
7Consultant240
8Engineer210
9CEO195
10Head of Operations180
(mais 10)

Lendo os resultados

34% de conformance não é falha. Isso não é um problema de qualidade. Significa que 34% dos seus Contacts têm cargos VP+, e essa é a audiência da campanha. O número responde ao que o marketing vinha adivinhando.

312 no Variant Count confirma que Title em texto livre é altamente fragmentado. 312 valores distintos em 10.000 Contacts. É normal para campos de texto livre e explica por que buscas manuais perdem pessoas.

Dominant Values mostra os cargos que você tem de fato. Muitos dos valores do topo estão abaixo de VP (Manager, Sales Rep, Account Executive). Isso é esperado. Esses contatos são registros válidos com cargos válidos. Caem fora da persona-alvo.

Non-Conforming Count (6.600) NÃO é escopo de limpeza. Ao contrário do cenário de Country, estes não são registros sujos. São contatos com cargos fora do filtro VP+. “Manager” é um cargo real, não um erro. Trate Non-Conforming Count como “contatos fora desta persona”, não “registros para corrigir”.

O insight real: Você agora tem um tamanho de audiência baseado em dados. 3.400 contatos VP+, verificados varrendo os dados reais. Sem mais buscas manuais.

Próxima ação

Use o Conformance Count (3.400) como tamanho da audiência VP+. Revise a lista de Dominant Values por cargos esquecidos. “Senior Manager” (275 registros) e “Head of Operations” (180 registros) são fronteiriços. Se qualificam para suas campanhas, adicione aos valores permitidos e re-execute.

Escolhendo sua configuração

Se você precisa…Comece comConfigurações-chave
Auditar um campo controlado (picklist, rating, status)Import from Field, depois Conformance CheckExpected Values do import, Case Sensitive OFF
Padronizar um campo fragmentado (country, industry)Import from Field, depois Advanced Conformance AnalysisExpected Values como seu padrão-alvo, Top N 10+, Min Frequency 5+
Dimensionar uma audiência ou segmento a partir de texto livreImport from Field, depois Advanced Conformance AnalysisExpected Values como sua definição, Top N 20, Min Frequency 5
Obter uma baseline rápida antes de uma limpezaImport from Field, depois Conformance CheckExpected Values do seu padrão

Para a explicação completa das 6 métricas, modos de análise e inputs de configuração, volte ao artigo principal de Consistência.

Pronto para medir sua qualidade de dados? Faça a AI Readiness Assessment para ver suas pontuações de consistência e muito mais.