Skip to main content

Pięć wymiarów jakości danych

Poznaj pięć wymiarów mierzonych przez DQS: Kompletność, Poprawność, Unikalność, Aktualność i Spójność.

Zrozumienie pięciu wymiarów

Jakość danych mierzy się w pięciu kluczowych wymiarach. Każdy wymiar odpowiada na konkretne pytanie o Twoje dane, a razem decydują o tym, czy Twoje dane są przydatne do celu.

DQS mierzy wszystkie pięć wymiarów natywnie w Salesforce.

WymiarKluczowe pytaniePrzykładowy problem
KompletnośćCzy dane są obecne?Brakujące adresy e-mail
PoprawnośćCzy format jest prawidłowy?Zniekształcone numery telefonów
UnikalnośćCzy każdy rekord jest odrębny?Zduplikowane kontakty
AktualnośćCzy dane są bieżące?Przestarzałe daty Opportunity
SpójnośćCzy dane są jednolite?„USA” vs „United States”

1. Kompletność

Kompletność mierzy, czy wymagane wartości danych są obecne i nie brakuje ich.

Co DQS mierzy

  • Stopień wypełnienia: Procent rekordów z niepustymi wartościami
  • Wykrywanie pustych wartości: Puste ciągi znaków i wartości zawierające tylko białe znaki
  • Wykrywanie wartości zastępczych: Wartości takie jak „N/A”, „TBD” lub „Unknown”

Dlaczego kompletność ma znaczenie

Niekompletne dane psują automatyzację. Kiedy Flow wymaga adresu e-mail, którego nie ma, Flow kończy się niepowodzeniem. Kiedy raport filtruje po polu Industry, a połowa rekordów nie ma wartości Industry, analityka pokazuje tylko część obrazu.

Typowe problemy z kompletnością

ProblemPrzykładWpływ
Puste polaPuste Contact PhoneNie można dzwonić do prospektów
Wartości zastępcze„TBD” w Company NameNieprawidłowe do raportowania
Tylko białe znaki„ ” w DescriptionWygląda na wypełnione, ale nie jest

Wskazówka: Zacznij od najbardziej krytycznych pól. Nie potrzebujesz 100% kompletności w każdym polu, tylko w tych, które mają znaczenie dla Twojego przypadku użycia.

2. Poprawność

Poprawność mierzy, czy wartości danych są zgodne z oczekiwanymi formatami i wzorcami.

Co DQS mierzy

  • Walidacja formatu: Wzorce e-mail, telefonu, URL
  • Dopasowanie wzorca: Niestandardowe wyrażenia regularne
  • Walidacja domeny: Listy dozwolonych wartości

Poprawność a dokładność

Poprawność i dokładność to różne rzeczy. Adres e-mail może być poprawny (prawidłowy format), ale niedokładny (zła osoba). DQS mierzy poprawność, ponieważ walidację formatu można zautomatyzować. Dokładność wymaga weryfikacji zewnętrznej.

SprawdzeniePoprawne?Dokładne?
john@company.comTakNieznane bez weryfikacji
john@companyNieN/D (format jest zły)
john.smith@oldcompany.comTakNie (osoba odeszła z firmy)

Typowe problemy z poprawnością w Salesforce

  • Adresy e-mail bez „@” lub domeny
  • Numery telefonów z niewłaściwą liczbą cyfr
  • URL bez protokołu (http/https)
  • Tekst dowolny tam, gdzie oczekiwane są wartości picklisty

3. Unikalność

Unikalność mierzy, czy wartości danych są odrębne i nie zduplikowane.

Co DQS mierzy

  • Wykrywanie duplikatów: Dokładne dopasowania między rekordami
  • Liczba odrębnych wartości: Łączna liczba unikalnych wartości w polu
  • Analiza entropii: Różnorodność i rozkład wartości

Koszt duplikatów

Zduplikowane rekordy marnują przestrzeń dyskową, dezorientują użytkowników i produkują zawyżone metryki. Kiedy Sales ma dwa rekordy dla tej samej firmy, tracą kontekst i ryzykują zawstydzające zdublowane działania.

Badania pokazują:

  • Bazy danych B2B zawierają średnio 10-30% zduplikowanych rekordów
  • Każdy duplikat kosztuje organizacje w postaci zmarnowanych wysyłek e-mail, błędnych raportów i fragmentarycznej historii klienta

Zapobieganie duplikatom vs wykrywanie

DQS koncentruje się na wykrywaniu, co pomaga zidentyfikować duplikaty, które już istnieją. Zapobieganie (blokowanie duplikatów przy tworzeniu) wymaga reguł walidacji i reguł dopasowania w konfiguracji Salesforce.

4. Aktualność

Aktualność mierzy, czy dane są wystarczająco bieżące do zamierzonego użytku.

Co DQS mierzy

  • Stopień świeżości: Procent rekordów w akceptowalnym wieku
  • Wykrywanie nieaktualnych danych: Rekordy przekraczające próg
  • Średni wiek: Średni wiek wartości pól dat
  • Wykrywanie dat z przyszłości: Nieprawidłowe daty w przyszłości

Ustalanie progów świeżości

Różne typy danych mają różne wymagania co do świeżości:

Typ danychTypowy prógDlaczego
Lead Last Activity30 dniZimne Leady tracą wartość
Dane kontaktowe90 dniLudzie zmieniają pracę
Opportunity Close DateBieżący kwartałDokładność prognozy
Account Annual Revenue1 rokOczekiwane aktualizacje roczne

Dlaczego aktualność ma znaczenie dla AI

Modele AI i ML uczą się z Twoich danych. Kiedy dane są nieaktualne, AI uczy się przestarzałych wzorców. Agentforce na przykład wykorzystuje dane Salesforce do formułowania odpowiedzi. Nieaktualne informacje kontaktowe prowadzą do nieprawidłowych rekomendacji.

5. Spójność

Spójność mierzy, czy wartości danych są jednolite i ustandaryzowane.

Co DQS mierzy

  • Wskaźnik zgodności: Procent dopasowania do oczekiwanych wzorców
  • Wykrywanie wariantów: Różne reprezentacje tej samej wartości
  • Analiza wartości dominującej: Najczęstsza wartość w polu

Typy niespójności

TypPrzykładProblem
Wariacja formatu„USA” vs „United States” vs „US”Psuje filtrowanie i grupowanie
Wariacja pisowni„Acme Corp” vs „ACME Corporation”Tworzy fałszywe duplikaty
Wariacja wielkości liter„new york” vs „New York”Wygląda nieprofesjonalnie w raportach

Dlaczego spójność ma znaczenie dla AI

Modele AI traktują „USA” i „United States” jako różne wartości. Jeśli Twoje rekordy używają obu, AI nie może ich poprawnie zgrupować. Niespójne dane fragmentują rozumienie AI i dają nierzetelne wyniki.

Osiąganie spójności

  • Używaj picklist zamiast tekstu dowolnego tam, gdzie to możliwe
  • Standaryzuj jeden format dla każdego pola
  • Importuj z wartości picklist przy konfigurowaniu sprawdzeń spójności DQS

Balansowanie wymiarów

Nie każdy wymiar jest równie ważny dla każdego przypadku użycia. Zastanów się, czego potrzebujesz:

Przypadek użyciaPriorytetowe wymiary
Kampanie marketingoweKompletność, Poprawność (dla dostarczalności)
Prognozowanie sprzedażyAktualność, Kompletność
Obsługa klientaUnikalność (jedno źródło prawdy)
AI/AgentforceWszystkie pięć, plus sprawdzenia gotowości na AI

Pokrycie wymiarów przez DQS

DQS mierzy wszystkie pięć wymiarów kompleksowo:

WymiarCo DQS mierzy
KompletnośćStopień wypełnienia, wykrywanie null, wykrywanie pustych wartości, wykrywanie wartości zastępczych, logika kontekstowa
PoprawnośćWalidacja formatu, niestandardowe wyrażenia regularne, identyfikacja nieprawidłowych rekordów
UnikalnośćWykrywanie duplikatów, analiza entropii, rozkład częstości
AktualnośćStopień świeżości, wykrywanie nieaktualnych danych, średni wiek, wykrywanie dat z przyszłości
SpójnośćSprawdzanie zgodności, odkrywanie wariantów, analiza wartości dominującej

Następne kroki

Teraz, gdy rozumiesz pięć wymiarów:

  1. Wykonaj ocenę gotowości na AI, aby zobaczyć swoje aktualne wyniki
  2. Przeczytaj o Przygotowaniu do Agentforce, aby poznać dodatkowe sprawdzenia wykraczające poza podstawową jakość danych
  3. Dowiedz się, jak używać Definition Builder, aby skonfigurować pierwsze skanowanie