O que estes cenários cobrem
Esta página apresenta três configurações reais de consistência, da configuração inicial à leitura dos resultados. Cada cenário usa um contexto de negócio diferente e um modo de análise distinto.
Estes cenários se apoiam nos conceitos e métricas do artigo principal de Consistência. Leia primeiro se termos como Conformance Rate, Variant Count e Dominant Values forem novos.
Cenário 1: padronização do campo Country com descoberta
O contexto de negócio
Sua org tem 15.000 registros de Account vindos de 3 empresas mescladas. O campo Country é texto livre. Dashboards regionais mostram dados fragmentados: “United States” é uma linha, “USA” outra, “US” uma terceira. Regras de atribuição de território perdem registros porque filtram por uma única grafia. Você precisa padronizar, mas não sabe quais valores existem nos três sistemas.
Walkthrough da configuração
Comece com Import from Field para descobrir o que seus dados realmente contêm antes de definir os valores permitidos.
- Abra a configuração de Expected Values do campo
Country. - Clique em Import from Field. O DQS consulta os dados ao vivo e retorna valores distintos ordenados por frequência.
- Revise a checklist. O import revela o quadro completo:
| Valor | Registros |
|---|---|
| United States | 4.500 |
| USA | 2.300 |
| US | 1.800 |
| Canada | 1.400 |
| U.S.A. | 450 |
| United States of America | 150 |
| … (mais 41 variações) | … |
- Decida sobre seu padrão. Códigos ISO (“US”, “CA”, “UK”) são compactos, padrão de setor e inequívocos. Marque os códigos ISO do import.
- Clique em Add Selected para popular seus valores permitidos.
Defina o restante da configuração:
| Configuração | Valor | Razão |
|---|---|---|
| Modo de análise | Advanced Conformance Analysis | Você precisa de variant counts e dominant values para dimensionar a limpeza |
| Expected Values | US, CA, UK, DE, FR, AU, JP | Códigos ISO dos seus mercados ativos |
| Case Sensitive | OFF | Pega “us”, “Us” e “US” como o mesmo valor |
| Top N | 10 | Veja as variações mais comuns |
| Min Frequency | 5 | Filtre erros isolados |
O que o scan produz
| Métrica | Valor |
|---|---|
| Conformance Rate | 12% |
| Conformance Count | 1.800 |
| Non-Conforming Count | 13.200 |
| Variant Count | 47 |
| Dominant Values | Top 10 valores com contagens (ver tabela acima) |
Lendo os resultados
12% de conformance é esperado. Você definiu um padrão novo (códigos ISO) para o qual os dados nunca foram normalizados. Apenas os 1.800 registros já contendo “US” casam. Não é um score ruim. É seu ponto de partida.
47 variantes revelam a escala da fragmentação. Três sistemas mesclados produziram 47 formas diferentes de expressar países. Sem esse número, você subestimaria o esforço.
Dominant Values mostra onde focar. As três maiores variações (“United States”, “USA”, “US”) somam 8.600 registros. Padronizar só esses três já sobe seu conformance de 12% para 69%. Comece por aí.
Non-Conforming Count (13.200) é o escopo exato de limpeza. Seu data steward tem um tamanho de projeto concreto, não um chute.
Próxima ação
Construa uma tabela de mapeamento de valores usando o Dominant Values. Mapeie “United States” para “US”, “USA” para “US”, e assim por diante. Rode a normalização. Re-execute o scan para verificar seu novo Conformance Rate.
Cenário 2: validação de Lead Rating
O contexto de negócio
Seu campo Lead Rating (Rating__c) é texto que aceita “Hot”, “Warm” ou “Cold”. Gerentes de vendas reportam valores estranhos nos relatórios de pipeline. Um filtro por Rating = "Hot" retorna menos registros do que o esperado. Você precisa de uma auditoria rápida de conformance para saber o que está no campo e quantos registros precisam de limpeza.
Walkthrough da configuração
Comece com Import from Field para ver os valores reais antes de configurar o scan.
- Abra a configuração de Expected Values para
Rating__c. - Clique em Import from Field. O import retorna:
| Valor | Registros |
|---|---|
| Hot | 284 |
| Warm | 198 |
| Cold | 156 |
| Very High | 23 |
| 240 km/h | 12 |
| N/A | 8 |
Os três primeiros são seus ratings reais. “Very High” vem de outra picklist (alguém colou do campo errado). “240 km/h” é claramente dado de outro campo. “N/A” é placeholder.
- Marque “Hot”, “Warm” e “Cold”. Deixe o resto desmarcado.
- Clique em Add Selected.
Defina o restante:
| Configuração | Valor | Razão |
|---|---|---|
| Modo de análise | Conformance Check | Você precisa de uma resposta sim/não, não análise profunda |
| Expected Values | Hot, Warm, Cold | Seus três ratings válidos |
| Case Sensitive | OFF | Pega “hot”, “HOT” e “Hot” como casando |
O que o scan produz
| Métrica | Valor |
|---|---|
| Conformance Rate | 93,7% |
| Conformance Count | 638 |
Lendo os resultados
93,7% estão conformes. Isso significa que 43 registros têm dados lixo. Para uma auditoria rápida, o Conformance Check dá a resposta rápido, sem computar métricas avançadas.
O passo de Import from Field já disse como é o lixo. “Very High” (23 registros de picklist errado), “240 km/h” (12 registros com dado de campo errado) e “N/A” (8 placeholders). Você não precisa de Dominant Values aqui, o import já deu a quebra antes do scan rodar.
43 registros é uma limpeza gerenciável. Não é um projeto de migração. É uma correção manual de 30 minutos ou um único job de atualização.
Próxima ação
Conserte os 43 registros não conformes. Depois converta Rating__c de texto para picklist para evitar problemas futuros. Registros criados via API contornam a validação da picklist, então rode scans periódicos para pegar novas variações de integrações.
Cenário 3: conformance de Job Title para persona targeting
O contexto de negócio
Seu time de marketing roda campanhas baseadas em persona, mirando “VP ou acima”. O campo Title é texto livre com milhares de variações. Antes de cada campanha, alguém busca manualmente por palavras-chave, perde metade das variações e monta uma audiência incompleta. O time precisa de uma resposta baseada em dados a duas perguntas: “Quantos contatos VP+ temos?” e “Quais títulos os demais têm?”
Walkthrough da configuração
- Abra a configuração de Expected Values para
Titleem Contacts. - Clique em Import from Field. Retorna centenas de valores. Muitos para checar individualmente, mas as frequências dão contexto.
- Defina seus valores permitidos com base no mapeamento de persona. Marque ou digite os valores que o time considera “VP ou acima”:
VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President
- Clique em Add Selected.
Defina o restante:
| Configuração | Valor | Razão |
|---|---|---|
| Modo de análise | Advanced Conformance Analysis | Você precisa da distribuição de valores completa |
| Expected Values | (os 16 valores acima) | Sua definição de persona VP+ |
| Case Sensitive | OFF | Pega “vp of sales”, “VP of Sales”, “VP OF SALES” |
| Top N | 20 | Veja uma distribuição ampla |
| Min Frequency | 5 | Filtre entradas isoladas como “Chief Happiness Officer” |
O que o scan produz
| Métrica | Valor |
|---|---|
| Conformance Rate | 34% |
| Conformance Count | 3.400 |
| Non-Conforming Count | 6.600 |
| Variant Count | 312 |
Dominant Values (Top 20):
| Pos | Valor | Contagem |
|---|---|---|
| 1 | Manager | 820 |
| 2 | Sales Representative | 650 |
| 3 | Account Executive | 480 |
| 4 | Director of Marketing | 340 |
| 5 | VP of Sales | 290 |
| 6 | Senior Manager | 275 |
| 7 | Consultant | 240 |
| 8 | Engineer | 210 |
| 9 | CEO | 195 |
| 10 | Head of Operations | 180 |
| … | (mais 10) | … |
Lendo os resultados
34% de conformance não é falha. Isso não é um problema de qualidade. Significa que 34% dos seus Contacts têm cargos VP+, e essa é a audiência da campanha. O número responde ao que o marketing vinha adivinhando.
312 no Variant Count confirma que Title em texto livre é altamente fragmentado. 312 valores distintos em 10.000 Contacts. É normal para campos de texto livre e explica por que buscas manuais perdem pessoas.
Dominant Values mostra os cargos que você tem de fato. Muitos dos valores do topo estão abaixo de VP (Manager, Sales Rep, Account Executive). Isso é esperado. Esses contatos são registros válidos com cargos válidos. Caem fora da persona-alvo.
Non-Conforming Count (6.600) NÃO é escopo de limpeza. Ao contrário do cenário de Country, estes não são registros sujos. São contatos com cargos fora do filtro VP+. “Manager” é um cargo real, não um erro. Trate Non-Conforming Count como “contatos fora desta persona”, não “registros para corrigir”.
O insight real: Você agora tem um tamanho de audiência baseado em dados. 3.400 contatos VP+, verificados varrendo os dados reais. Sem mais buscas manuais.
Próxima ação
Use o Conformance Count (3.400) como tamanho da audiência VP+. Revise a lista de Dominant Values por cargos esquecidos. “Senior Manager” (275 registros) e “Head of Operations” (180 registros) são fronteiriços. Se qualificam para suas campanhas, adicione aos valores permitidos e re-execute.
Escolhendo sua configuração
| Se você precisa… | Comece com | Configurações-chave |
|---|---|---|
| Auditar um campo controlado (picklist, rating, status) | Import from Field, depois Conformance Check | Expected Values do import, Case Sensitive OFF |
| Padronizar um campo fragmentado (country, industry) | Import from Field, depois Advanced Conformance Analysis | Expected Values como seu padrão-alvo, Top N 10+, Min Frequency 5+ |
| Dimensionar uma audiência ou segmento a partir de texto livre | Import from Field, depois Advanced Conformance Analysis | Expected Values como sua definição, Top N 20, Min Frequency 5 |
| Obter uma baseline rápida antes de uma limpeza | Import from Field, depois Conformance Check | Expected Values do seu padrão |
Para a explicação completa das 6 métricas, modos de análise e inputs de configuração, volte ao artigo principal de Consistência.
Pronto para medir sua qualidade de dados? Faça a AI Readiness Assessment para ver suas pontuações de consistência e muito mais.