Zrozumienie pięciu wymiarów
Jakość danych mierzy się w pięciu kluczowych wymiarach. Każdy wymiar odpowiada na konkretne pytanie o Twoje dane, a razem decydują o tym, czy Twoje dane są przydatne do celu.
DQS mierzy wszystkie pięć wymiarów natywnie w Salesforce.
| Wymiar | Kluczowe pytanie | Przykładowy problem |
|---|---|---|
| Kompletność | Czy dane są obecne? | Brakujące adresy e-mail |
| Poprawność | Czy format jest prawidłowy? | Zniekształcone numery telefonów |
| Unikalność | Czy każdy rekord jest odrębny? | Zduplikowane kontakty |
| Aktualność | Czy dane są bieżące? | Przestarzałe daty Opportunity |
| Spójność | Czy dane są jednolite? | „USA” vs „United States” |
1. Kompletność
Kompletność mierzy, czy wymagane wartości danych są obecne i nie brakuje ich.
Co DQS mierzy
- Stopień wypełnienia: Procent rekordów z niepustymi wartościami
- Wykrywanie pustych wartości: Puste ciągi znaków i wartości zawierające tylko białe znaki
- Wykrywanie wartości zastępczych: Wartości takie jak „N/A”, „TBD” lub „Unknown”
Dlaczego kompletność ma znaczenie
Niekompletne dane psują automatyzację. Kiedy Flow wymaga adresu e-mail, którego nie ma, Flow kończy się niepowodzeniem. Kiedy raport filtruje po polu Industry, a połowa rekordów nie ma wartości Industry, analityka pokazuje tylko część obrazu.
Typowe problemy z kompletnością
| Problem | Przykład | Wpływ |
|---|---|---|
| Puste pola | Puste Contact Phone | Nie można dzwonić do prospektów |
| Wartości zastępcze | „TBD” w Company Name | Nieprawidłowe do raportowania |
| Tylko białe znaki | „ ” w Description | Wygląda na wypełnione, ale nie jest |
Wskazówka: Zacznij od najbardziej krytycznych pól. Nie potrzebujesz 100% kompletności w każdym polu, tylko w tych, które mają znaczenie dla Twojego przypadku użycia.
2. Poprawność
Poprawność mierzy, czy wartości danych są zgodne z oczekiwanymi formatami i wzorcami.
Co DQS mierzy
- Walidacja formatu: Wzorce e-mail, telefonu, URL
- Dopasowanie wzorca: Niestandardowe wyrażenia regularne
- Walidacja domeny: Listy dozwolonych wartości
Poprawność a dokładność
Poprawność i dokładność to różne rzeczy. Adres e-mail może być poprawny (prawidłowy format), ale niedokładny (zła osoba). DQS mierzy poprawność, ponieważ walidację formatu można zautomatyzować. Dokładność wymaga weryfikacji zewnętrznej.
| Sprawdzenie | Poprawne? | Dokładne? |
|---|---|---|
| john@company.com | Tak | Nieznane bez weryfikacji |
| john@company | Nie | N/D (format jest zły) |
| john.smith@oldcompany.com | Tak | Nie (osoba odeszła z firmy) |
Typowe problemy z poprawnością w Salesforce
- Adresy e-mail bez „@” lub domeny
- Numery telefonów z niewłaściwą liczbą cyfr
- URL bez protokołu (http/https)
- Tekst dowolny tam, gdzie oczekiwane są wartości picklisty
3. Unikalność
Unikalność mierzy, czy wartości danych są odrębne i nie zduplikowane.
Co DQS mierzy
- Wykrywanie duplikatów: Dokładne dopasowania między rekordami
- Liczba odrębnych wartości: Łączna liczba unikalnych wartości w polu
- Analiza entropii: Różnorodność i rozkład wartości
Koszt duplikatów
Zduplikowane rekordy marnują przestrzeń dyskową, dezorientują użytkowników i produkują zawyżone metryki. Kiedy Sales ma dwa rekordy dla tej samej firmy, tracą kontekst i ryzykują zawstydzające zdublowane działania.
Badania pokazują:
- Bazy danych B2B zawierają średnio 10-30% zduplikowanych rekordów
- Każdy duplikat kosztuje organizacje w postaci zmarnowanych wysyłek e-mail, błędnych raportów i fragmentarycznej historii klienta
Zapobieganie duplikatom vs wykrywanie
DQS koncentruje się na wykrywaniu, co pomaga zidentyfikować duplikaty, które już istnieją. Zapobieganie (blokowanie duplikatów przy tworzeniu) wymaga reguł walidacji i reguł dopasowania w konfiguracji Salesforce.
4. Aktualność
Aktualność mierzy, czy dane są wystarczająco bieżące do zamierzonego użytku.
Co DQS mierzy
- Stopień świeżości: Procent rekordów w akceptowalnym wieku
- Wykrywanie nieaktualnych danych: Rekordy przekraczające próg
- Średni wiek: Średni wiek wartości pól dat
- Wykrywanie dat z przyszłości: Nieprawidłowe daty w przyszłości
Ustalanie progów świeżości
Różne typy danych mają różne wymagania co do świeżości:
| Typ danych | Typowy próg | Dlaczego |
|---|---|---|
| Lead Last Activity | 30 dni | Zimne Leady tracą wartość |
| Dane kontaktowe | 90 dni | Ludzie zmieniają pracę |
| Opportunity Close Date | Bieżący kwartał | Dokładność prognozy |
| Account Annual Revenue | 1 rok | Oczekiwane aktualizacje roczne |
Dlaczego aktualność ma znaczenie dla AI
Modele AI i ML uczą się z Twoich danych. Kiedy dane są nieaktualne, AI uczy się przestarzałych wzorców. Agentforce na przykład wykorzystuje dane Salesforce do formułowania odpowiedzi. Nieaktualne informacje kontaktowe prowadzą do nieprawidłowych rekomendacji.
5. Spójność
Spójność mierzy, czy wartości danych są jednolite i ustandaryzowane.
Co DQS mierzy
- Wskaźnik zgodności: Procent dopasowania do oczekiwanych wzorców
- Wykrywanie wariantów: Różne reprezentacje tej samej wartości
- Analiza wartości dominującej: Najczęstsza wartość w polu
Typy niespójności
| Typ | Przykład | Problem |
|---|---|---|
| Wariacja formatu | „USA” vs „United States” vs „US” | Psuje filtrowanie i grupowanie |
| Wariacja pisowni | „Acme Corp” vs „ACME Corporation” | Tworzy fałszywe duplikaty |
| Wariacja wielkości liter | „new york” vs „New York” | Wygląda nieprofesjonalnie w raportach |
Dlaczego spójność ma znaczenie dla AI
Modele AI traktują „USA” i „United States” jako różne wartości. Jeśli Twoje rekordy używają obu, AI nie może ich poprawnie zgrupować. Niespójne dane fragmentują rozumienie AI i dają nierzetelne wyniki.
Osiąganie spójności
- Używaj picklist zamiast tekstu dowolnego tam, gdzie to możliwe
- Standaryzuj jeden format dla każdego pola
- Importuj z wartości picklist przy konfigurowaniu sprawdzeń spójności DQS
Balansowanie wymiarów
Nie każdy wymiar jest równie ważny dla każdego przypadku użycia. Zastanów się, czego potrzebujesz:
| Przypadek użycia | Priorytetowe wymiary |
|---|---|
| Kampanie marketingowe | Kompletność, Poprawność (dla dostarczalności) |
| Prognozowanie sprzedaży | Aktualność, Kompletność |
| Obsługa klienta | Unikalność (jedno źródło prawdy) |
| AI/Agentforce | Wszystkie pięć, plus sprawdzenia gotowości na AI |
Pokrycie wymiarów przez DQS
DQS mierzy wszystkie pięć wymiarów kompleksowo:
| Wymiar | Co DQS mierzy |
|---|---|
| Kompletność | Stopień wypełnienia, wykrywanie null, wykrywanie pustych wartości, wykrywanie wartości zastępczych, logika kontekstowa |
| Poprawność | Walidacja formatu, niestandardowe wyrażenia regularne, identyfikacja nieprawidłowych rekordów |
| Unikalność | Wykrywanie duplikatów, analiza entropii, rozkład częstości |
| Aktualność | Stopień świeżości, wykrywanie nieaktualnych danych, średni wiek, wykrywanie dat z przyszłości |
| Spójność | Sprawdzanie zgodności, odkrywanie wariantów, analiza wartości dominującej |
Następne kroki
Teraz, gdy rozumiesz pięć wymiarów:
- Wykonaj ocenę gotowości na AI, aby zobaczyć swoje aktualne wyniki
- Przeczytaj o Przygotowaniu do Agentforce, aby poznać dodatkowe sprawdzenia wykraczające poza podstawową jakość danych
- Dowiedz się, jak używać Definition Builder, aby skonfigurować pierwsze skanowanie