Entendendo as cinco dimensões
Qualidade de dados é medida em cinco dimensões principais. Cada uma responde a uma pergunta específica sobre seus dados, e juntas determinam se os dados estão aptos ao propósito.
O DQS mede as cinco dimensões nativamente dentro do Salesforce.
| Dimensão | Pergunta central | Problema exemplo |
|---|---|---|
| Completude | Os dados estão presentes? | Endereços de e-mail faltando |
| Validade | O formato está correto? | Números de telefone malformados |
| Unicidade | Cada registro é único? | Contacts duplicados |
| Atualidade | Os dados estão atuais? | Close dates desatualizadas em Opportunities |
| Consistência | Os dados são uniformes? | ”USA” vs “United States” |
1. Completude
Completude mede se os valores de dados obrigatórios estão presentes e não faltando.
O que o DQS mede
- Fill Rate: Percentual de registros com valores não vazios
- Blank Detection: Strings vazias e valores só com espaços
- Placeholder Detection: Valores como “N/A”, “TBD” ou “Unknown”
Por que completude importa
Dados incompletos quebram automação. Quando um workflow exige um endereço de e-mail que não existe, ele falha. Quando um relatório filtra por Industry e metade dos registros não têm valor em Industry, os analytics mostram só parte do retrato.
Problemas comuns de completude
| Problema | Exemplo | Impacto |
|---|---|---|
| Campos em branco | Phone vazio em Contact | Não dá para ligar para os prospects |
| Valores placeholder | ”TBD” em Company Name | Inválido para reporting |
| Só espaços em branco | ” ” em Description | Parece preenchido, mas não está |
Dica: Comece pelos seus campos mais críticos. Você não precisa de 100% de completude em todo campo, só naqueles que importam para o seu caso de uso.
2. Validade
Validade mede se os valores seguem formatos e padrões esperados.
O que o DQS mede
- Format Validation: Padrões de e-mail, telefone, URL
- Pattern Matching: Padrões regex customizados
- Domain Validation: Listas de valores permitidos
Validade vs precisão
Validade e precisão são coisas diferentes. Um e-mail pode ser válido (formato correto), mas impreciso (pessoa errada). O DQS mede validade porque a validação de formato pode ser automatizada. Precisão exige verificação externa.
| Verificação | Válido? | Preciso? |
|---|---|---|
| john@company.com | Sim | Desconhecido sem verificação |
| john@company | Não | N/A (formato errado) |
| john.smith@oldcompany.com | Sim | Não (a pessoa saiu da empresa) |
Problemas comuns de validade no Salesforce
- Endereços de e-mail sem ”@” ou domínio
- Números de telefone com contagem de dígitos errada
- URLs sem protocolo (http/https)
- Texto livre onde são esperados valores de picklist
3. Unicidade
Unicidade mede se os valores são distintos e não duplicados.
O que o DQS mede
- Duplicate Detection: Correspondências exatas entre registros
- Distinct Count: Total de valores únicos por campo
- Entropy Analysis: Diversidade e distribuição de valores
O custo das duplicatas
Registros duplicados desperdiçam armazenamento, confundem usuários e produzem métricas infladas. Quando vendas tem dois registros para a mesma empresa, perde contexto e corre o risco de fazer outreach duplicado.
Pesquisas mostram:
- Bases B2B contêm 10-30% de registros duplicados em média
- Cada duplicata custa às organizações em envios de e-mail desperdiçados, reporting confuso e histórico fragmentado do cliente
Prevenção vs detecção de duplicatas
O DQS foca em detecção, que ajuda a identificar duplicatas que já existem. A prevenção (barrar duplicatas na criação) requer validation rules e matching rules na configuração do Salesforce.
4. Atualidade
Atualidade mede se os dados estão suficientemente atuais para o uso pretendido.
O que o DQS mede
- Freshness Rate: Percentual de registros dentro da janela de atualidade
- Staleness Detection: Registros que excedem seu limite
- Average Age: Idade média dos valores de campos de data
- Future Date Detection: Datas inválidas no futuro
Definindo limites de atualidade
Tipos de dados diferentes têm requisitos diferentes de atualidade:
| Tipo de dado | Limite típico | Por quê |
|---|---|---|
| Lead Last Activity | 30 dias | Leads frios perdem valor |
| Informações de Contact | 90 dias | Pessoas mudam de emprego |
| Opportunity Close Date | Trimestre atual | Precisão da previsão |
| Account Annual Revenue | 1 ano | Atualizações anuais esperadas |
Por que atualidade importa para IA
Modelos de IA e machine learning aprendem com seus dados. Quando os dados estão desatualizados, a IA aprende padrões defasados. O Agentforce, por exemplo, usa seus dados do Salesforce para fundamentar respostas. Informações de contato desatualizadas levam a recomendações erradas.
5. Consistência
Consistência mede se os valores são uniformes e padronizados.
O que o DQS mede
- Conformance Rate: Percentual que corresponde aos padrões esperados
- Variant Detection: Diferentes representações do mesmo valor
- Dominant Value Analysis: Valor mais comum por campo
Tipos de inconsistência
| Tipo | Exemplo | Problema |
|---|---|---|
| Variação de formato | ”USA” vs “United States” vs “US” | Quebra filtro e agrupamento |
| Variação de escrita | ”Acme Corp” vs “ACME Corporation” | Cria falsas duplicatas |
| Variação de caixa | ”new york” vs “New York” | Parece pouco profissional em relatórios |
Por que consistência importa para IA
Modelos de IA tratam “USA” e “United States” como valores diferentes. Se seus registros usam os dois, a IA não consegue agrupá-los corretamente. Dados inconsistentes fragmentam o entendimento da sua IA e produzem saídas pouco confiáveis.
Alcançando consistência
- Use picklists em vez de texto livre sempre que possível
- Padronize um único formato para cada campo
- Importe valores do campo ao configurar as verificações de consistência no DQS
Balanceando as dimensões
Nem toda dimensão é igualmente importante para todo caso de uso. Considere o que você precisa:
| Caso de uso | Dimensões prioritárias |
|---|---|
| Campanhas de marketing | Completude, Validade (para entregabilidade) |
| Previsão de vendas | Atualidade, Completude |
| Atendimento ao cliente | Unicidade (uma única fonte de verdade) |
| AI/Agentforce | As cinco, mais verificações de AI Readiness |
Cobertura de dimensões no DQS
O DQS mede as cinco dimensões com capacidades abrangentes:
| Dimensão | O que o DQS mede |
|---|---|
| Completude | Fill rate, detecção de nulls, blank, placeholder, lógica contextual |
| Validade | Validação de formato, padrões regex custom, identificação de registros inválidos |
| Unicidade | Detecção de duplicatas, análise de entropia, distribuição de frequência |
| Atualidade | Freshness rate, detecção de staleness, idade média, detecção de datas futuras |
| Consistência | Verificação de conformance, descoberta de variantes, análise de valores dominantes |
Próximos passos
Agora que você entende as cinco dimensões:
- Faça a AI Readiness Assessment para ver suas pontuações atuais
- Leia sobre Preparação para Agentforce para verificações adicionais além da qualidade de dados básica
- Aprenda a usar o Definition Builder para configurar seu primeiro scan