Czym jest kompletność?
Kompletność mierzy, czy Twoje dane rzeczywiście są obecne. Pole jest kompletne, gdy zawiera sensowne dane. Pole jest niekompletne, gdy jest null, puste lub wypełnione wartością zastępczą typu „N/A” lub „TBD”.
Kompletność to najbardziej fundamentalny wymiar jakości danych. Bez danych nie ma nic do walidacji, deduplikacji ani analizy.
Stopień kompletności = (Rekordy z danymi / Łączna liczba rekordów) x 100
Jeśli 850 z 1000 rekordów Contact ma wartość Email, Twój stopień kompletności dla Email wynosi 85%. Ta metryka (czasem nazywana stopniem wypełnienia) to nagłówkowa liczba dla dowolnego pola.
Dlaczego kompletność ma znaczenie
Raportowanie
Niekompletne dane zniekształcają Twoją analitykę. Kiedy 40% rekordów Account nie ma wartości Industry, każdy raport grupowany po Industry pokazuje tylko część prawdy. Dashboardy stają się nierzetelne. Decyzje zarządu opierają się na ułamku obrazu.
Automatyzacja
Automatyzacja Salesforce zależy od wartości pól. Flow wysyłający e-maile zawiedzie, gdy Email jest puste. Proces aktualizujący Account Owner zawiedzie, gdy lookup jest null. Każda brakująca wartość to potencjalna awaria automatyzacji.
AI i Agentforce
Modele AI uczą się z Twoich danych. Kiedy pola są puste, model nie ma z czego się uczyć. Agentforce wykorzystuje dane Salesforce do generowania odpowiedzi i podejmowania działań. Brakujące dane oznaczają niekompletny kontekst i mniej użyteczne wyniki AI.
| System | Wpływ kompletności |
|---|---|
| Raporty | Częściowe dane produkują zniekształcone metryki |
| Flows | Brakujące wartości powodują awarie procesów |
| Reguły duplikatów | Niekompletne rekordy są trudniejsze do dopasowania |
| Agentforce | Luki w kontekście zmniejszają dokładność AI |
Jak DQS mierzy kompletność
DQS produkuje 10 metryk kompletności zorganizowanych wokół pytania diagnostycznego: „Gdzie brakuje danych, dlaczego i czy dane, które istnieją, są rzeczywiście użyteczne?”
Pomyśl o tych metrykach jak o lejku diagnostycznym. Każdy krok opiera się na poprzednim.
Krok 1: Jak kompletne są dane?
Stopień kompletności to metryka nagłówkowa. Oblicza procent rekordów, w których pole zawiera niepustą, niezerową wartość. To liczba, którą umieszcza się na dashboardzie.
Uruchamiasz skanowanie obiektu Account. Pole Industry pokazuje Stopień kompletności 62%. Oznacza to, że 38% Twoich Accounts nie ma wartości branży, co oznacza, że raporty segmentacji, reguły terytorialne i kampanie marketingowe filtrowane po branży działają na niekompletnych danych.
Każda inna metryka kompletności istnieje, aby wyjaśnić, dlaczego ta liczba nie wynosi 100%.
Krok 2: Jaka jest skala?
Procenty mówią o dotkliwości. Liczby mówią o nakładzie pracy. Populated Count odpowiada na pytanie o skalę: ile rekordów rzeczywiście ma wartość. Używaj go do raportowania pokrycia i do określenia rozmiaru luki względem łącznej liczby rekordów — różnica między Twoim totalem a Populated Count to zaległość czyszczenia.
Przykład: Twój data steward musi zbudować kampanię czyszczenia. Przy 50 000 Contacts i Populated Count 35 800 na Phone wie, że 14 200 rekordów wymaga wzbogacenia, może oszacować koszt z dostawcą danych i ustawić realistyczny harmonogram.
Krok 3: Dlaczego jest niekompletne?
Trzy metryki rozkładają przyczynę niekompletności. Każda wskazuje na inny problem źródłowy.
Null Count i Null Rate mierzą rekordy, w których pole ma prawdziwe null w bazie danych, co oznacza, że pole nigdy nie zostało wypełnione. W Salesforce null i pusty ciąg znaków to różne stany. Pole, którego nigdy nie dotknięto, jest null. Pole, które zostało świadomie wyczyszczone, jest pustym ciągiem znaków. To rozróżnienie mówi, czy dane nigdy nie zostały przechwycone, czy zostały celowo usunięte.
Przykład: Po migracji danych pole Fax na Accounts pokazuje 45% Null Rate. Dane faksu nigdy nie zostały zmigrowane ze starego systemu (null = nigdy nie istniały) zamiast zostać przechwycone i później wyczyszczone. Wysoki Null Rate wskazuje na system źródłowy, a nie na zachowanie użytkowników.
Placeholder Count i Placeholder Rate mierzą rekordy zawierające znane wartości zastępcze takie jak „N/A”, „TBD”, „Unknown” lub dowolne wartości niestandardowe, które zdefiniujesz. Te wartości wyglądają jak dane, ale nie niosą żadnej realnej informacji.
Przykład: Twoje globalne dane Account pokazują 94% Stopnia kompletności dla Industry. Wygląda świetnie na papierze. Ale Placeholder Rate ujawnia, że 18% tych „wypełnionych” wartości to faktycznie „N/A”, „Other” lub „Unknown”. Rzeczywista kompletność jest bliższa 76%. To metryka, która zmienia zielony dashboard w czerwony.
Krok 4: Czy „kompletne” dane są użyteczne?
Pierwsze trzy kroki identyfikują, czego brakuje. Krok 4 zadaje trudniejsze pytanie: czy dane, które są obecne, są w ogóle warte posiadania?
Incompleted Count to najszersza miara brakujących danych. Łączy wszystkie formy niekompletności: null, puste wartości, oraz wartości zastępcze. Gdy wykrywanie wartości zastępczych jest aktywne, Incompleted Count jest zawsze większe lub równe samemu Null Count, ponieważ obejmuje również wpisy złożone tylko z białych znaków i wartości zastępcze.
Przykład: Twoje pole Description na Opportunities pokazuje Null Count 500, ale Incompleted Count 1800. Różnica? 1300 rekordów ma opisy typu „TBD”, „N/A” lub „---”. Te rekordy są technicznie wypełnione, ale praktycznie bezużyteczne. Bez tej metryki myślałbyś, że masz tylko 500 rekordów do naprawy zamiast 1800.
Rich Text Ratio mierzy procent rekordów pola tekstowego, które zawierają znaczącą treść powyżej progu liczby znaków. Oddziela pola z sensowną prozą od pól z kilkoma słowami. Pole Description jest „wypełnione”, niezależnie od tego, czy zawiera „Dobry klient”, czy trzyparagrafowy plan konta. Dla gotowości na AI głębokość treści ma takie samo znaczenie, jak jej obecność.
Przykład: Twoja firma ocenia narzędzie AI podsumowujące opisy Case. Skanujesz pole Description na Cases: 88% Stopnia kompletności, ale tylko 31% Rich Text Ratio. Tylko 31% opisów case ma wystarczająco dużo treści, aby AI mogło z nimi pracować. Reszta to wpisy typu „call back”, „see email” lub „issue reported”. Projekt AI potrzebuje fazy wzbogacania danych, zanim będzie mógł dostarczyć wartość.
Text Field Utilization mierzy, ile z dostępnej pojemności pola tekstowego jest wykorzystywane. Long Text Area o pojemności 32 000 znaków, w którym średni wpis ma 45 znaków, ma bardzo niskie wykorzystanie.
Average Utilization daje średni procent wykorzystanej długości pola we wszystkich rekordach. Razem z Text Field Utilization maluje pełny obraz tego, czy Twoje pola tekstowe mają odpowiedni rozmiar.
Przykład: Podczas oceny org, Text Field Utilization ujawnia, że Notes__c (Long Text Area, 131 072 znaków) ma średnio 3,2% wykorzystania, przy czym większość wpisów ma mniej niż 200 znaków. Tymczasem Short_Description__c (Text, 255 znaków) pokazuje 94% wykorzystania z częstymi problemami obcinania. Schemat wymaga dostosowania rozmiaru: Long Text Area jest przesadą, a pole Text jest za małe.
Uwaga: Text Field Utilization i Average Utilization mają zastosowanie tylko do pól String i TextArea, ponieważ to typy pól z określoną pojemnością znaków do mierzenia.
Dlaczego stopnie i liczby występują w parach
Większość metryk występuje jako stopień (procent) i liczba (wartość bezwzględna). Jest to celowe:
- Stopnie są dla dashboardów, raportowania dla zarządu i śledzenia trendów. „Kompletność poprawiła się z 72% do 89% w tym kwartale.”
- Liczby są do planowania projektów, szacowania obciążenia pracą i określania zakresu czyszczenia. „Mamy 14 200 rekordów do naprawy.”
Używaj stopni do komunikowania postępu. Używaj liczb do planowania pracy.
Referencja metryk
Metryki podstawowe
Te 5 metryk tworzy bazę każdej analizy kompletności. Działają praktycznie na wszystkich typach pól.
| Metryka | Typ | Dotyczy |
|---|---|---|
| Completeness Rate | Procent | Wszystkie typy pól |
| Populated Count | Liczba | Wszystkie typy pól |
| Incompleted Count | Liczba | Wszystkie typy pól |
| Null Rate | Procent | Wszystkie typy pól |
| Null Count | Liczba | Wszystkie typy pól |
Metryki kontekstowe
Te 5 metryk wykracza poza „czy jest tam?”, pytając „czy jest sensowne?”. Wymagają trybu analizy Contextual Completeness.
| Metryka | Typ | Dotyczy |
|---|---|---|
| Placeholder Rate | Procent | Tylko pola tekstowe |
| Placeholder Count | Liczba | Tylko pola tekstowe |
| Rich Text Ratio | Procent | Tylko pola tekstowe |
| Text Field Utilization | Procent | Tylko String i TextArea |
| Average Utilization | Procent | Tylko String i TextArea |
Pokrycie typów pól
DQS obsługuje sprawdzenia kompletności na wszystkich standardowych typach pól Salesforce:
| Grupa pokrycia | Typy pól | Dostępne metryki |
|---|---|---|
| Wszystkie typy (20) | String, TextArea, LongTextArea, Html, EncryptedText, Picklist, Multipicklist, Email, Phone, URL, Reference (Lookup), Date, DateTime, Double, Integer, Currency, Percent, Boolean, Combobox, Id | Completeness Rate, Populated/Incompleted Count, Null Rate/Count |
| Pola tekstowe (8) | Text, TextArea, LongTextArea, Html, EncryptedText, Email, Phone, URL | Powyższe + Placeholder Rate/Count, Rich Text Ratio |
| String i TextArea (2) | String, TextArea | Powyższe + Text Field Utilization, Average Utilization |
Dwa tryby analizy
DQS oferuje dwa tryby analizy kompletności:
Basic Completeness odpowiada na pytanie: „Czy pola są wypełnione?” Produkuje 5 metryk podstawowych i pokrywa podstawy, których każde org potrzebuje do sprawdzenia higieny danych lub szybkiego audytu.
Contextual Completeness idzie głębiej. Produkuje wszystkie 10 metryk, w tym wykrywanie wartości zastępczych, analizę rich text i wykorzystanie pól. Używaj tego trybu, gdy musisz odróżnić dane, które są obecne, od danych, które są użyteczne.
| Potrzeba biznesowa | Rekomendowany tryb |
|---|---|
| Szybkie sprawdzenie higieny lub audyt bazowy | Basic Completeness |
| Ocena migracji danych | Contextual (wykrywanie wartości zastępczych wychwytuje fałszywe dane ze starszych systemów) |
| Ocena gotowości na AI | Contextual (Rich Text Ratio i metryki wykorzystania oceniają głębokość treści) |
| Bieżące zarządzanie danymi | Zacznij od Basic, przejdź do Contextual, gdy będziesz gotowy na głębszą analizę |
Konfigurowanie kompletności
DQS udostępnia cztery wejścia konfiguracyjne dla kompletności. Każde można ustawić na poziomie globalnym (dotyczy wszystkich pól) i nadpisać na poziomie pojedynczego pola.
| Ustawienie | Co kontroluje |
|---|---|
| Blank As Incomplete | Gdy włączone, DQS traktuje puste ciągi i wartości złożone tylko z białych znaków jako niekompletne. Domyślnie: włączone. |
| Placeholders As Incomplete | Gdy włączone, DQS traktuje wartości zastępcze (jak „N/A” lub „TBD”) jako niekompletne. Domyślnie: wyłączone. |
| Placeholder Values | Lista ciągów, które DQS traktuje jako wartości zastępcze. Definiujesz je w oparciu o wzorce wprowadzania danych w Twoim org (np. N/A, TBD, Unknown, --, 000-000-0000). |
| Case-Sensitive Placeholders | Kontroluje, czy dopasowanie wartości zastępczych uwzględnia wielkość liter. Gdy włączone, „tbd” i „TBD” są traktowane jako różne wartości. Domyślnie: z uwzględnieniem wielkości liter. |
Wskazówka: Zacznij od typowych wartości zastępczych („N/A”, „TBD”, „Unknown”, „—”) i dodawaj wartości specyficzne dla org, gdy odkryjesz je w wynikach skanowania.
Typowe problemy z kompletnością
Pola opcjonalne nigdy nie wypełniane
Kiedy pola są opcjonalne, użytkownicy je pomijają. Z czasem cenne pola takie jak Company Description lub LinkedIn URL mają niemal zerowe stopnie kompletności.
Rozwiązanie: Ustaw krytyczne pola jako wymagane lub twórz monity podczas edycji rekordu.
Masowe importy z lukami
Migracje danych i importy list często nie mają wartości dla pewnych pól. Kupiona lista kontaktów nie ma powiązania z Account. Eksport ze starego systemu nie ma zestandaryzowanych wartości Industry.
Rozwiązanie: Audytuj importy przed załadowaniem. Używaj DQS do ustalenia poziomów bazowych i śledzenia poprawy po każdym imporcie.
Nadużywanie wartości zastępczych
Użytkownicy wprowadzają „N/A” lub „TBD”, aby przejść reguły walidacji. Pole wydaje się kompletne, ale nie zawiera użytecznych danych. Standardowe raporty liczą je jako wypełnione.
Rozwiązanie: Włącz wykrywanie wartości zastępczych i zdefiniuj listę wartości. Przeglądaj i aktualizuj wartości zastępcze podczas regularnego utrzymania danych.
Wypełnianie białymi znakami
Niektóre integracje lub ręczne wprowadzanie zostawiają pola tylko z białymi znakami. Salesforce liczy je jako „wypełnione”, ale nie zawierają niczego użytecznego.
Rozwiązanie: Włącz wykrywanie pustych wartości, aby wychwycić wartości złożone tylko z białych znaków.
Najlepsze praktyki
Ustal priorytety według wpływu biznesowego
Nie każde pole potrzebuje wysokiej kompletności. Skoncentruj się na polach napędzających automatyzację, pojawiających się w dashboardach zarządu, zasilających AI i Agentforce lub wspierających wymagania zgodności.
Śledź trendy w czasie
Pojedynczy wynik kompletności to migawka. Śledź wyniki z wielu skanowań, aby wcześnie wykrywać degradację, mierzyć inicjatywy poprawy i identyfikować problematyczne źródła danych.
Rozwiązuj przyczyny źródłowe
Niska kompletność sygnalizuje problem procesowy. Zbadaj, czy użytkownicy pomijają pola, czy importy nie mają danych, czy integracje cicho zawodzą. Naprawiaj źródło, a nie tylko objaw.
Użyj lejka diagnostycznego
Nie zatrzymuj się na Stopniu kompletności. Przejdź przez lejek: sprawdź skalę (Populated Count), zidentyfikuj przyczynę (Null vs Placeholder), następnie oceń jakość treści (Rich Text Ratio, Utilization). Każdy krok ujawnia inny typ problemu z inną poprawką.
Następne kroki
Teraz rozumiesz, jak mierzyć i poprawiać kompletność. Kontynuuj naukę o następnym wymiarze:
- Dalej: Poprawność - Zapewnij zgodność danych z oczekiwanymi formatami
- Powiązane: Pięć wymiarów - Przegląd wszystkich wymiarów
- Działanie: Ocena gotowości na AI - Zobacz swoje aktualne wyniki kompletności