Kompletność | DQS Resources

Czym jest kompletność?

Kompletność mierzy, czy Twoje dane rzeczywiście są obecne. Pole jest kompletne, gdy zawiera sensowne dane. Pole jest niekompletne, gdy jest null, puste lub wypełnione wartością zastępczą typu „N/A” lub „TBD”.

Kompletność to najbardziej fundamentalny wymiar jakości danych. Bez danych nie ma nic do walidacji, deduplikacji ani analizy.

Stopień kompletności = (Rekordy z danymi / Łączna liczba rekordów) x 100

Jeśli 850 z 1000 rekordów Contact ma wartość Email, Twój stopień kompletności dla Email wynosi 85%. Ta metryka (czasem nazywana stopniem wypełnienia) to nagłówkowa liczba dla dowolnego pola.

Dlaczego kompletność ma znaczenie

Raportowanie

Niekompletne dane zniekształcają Twoją analitykę. Kiedy 40% rekordów Account nie ma wartości Industry, każdy raport grupowany po Industry pokazuje tylko część prawdy. Dashboardy stają się nierzetelne. Decyzje zarządu opierają się na ułamku obrazu.

Automatyzacja

Automatyzacja Salesforce zależy od wartości pól. Flow wysyłający e-maile zawiedzie, gdy Email jest puste. Proces aktualizujący Account Owner zawiedzie, gdy lookup jest null. Każda brakująca wartość to potencjalna awaria automatyzacji.

AI i Agentforce

Modele AI uczą się z Twoich danych. Kiedy pola są puste, model nie ma z czego się uczyć. Agentforce wykorzystuje dane Salesforce do generowania odpowiedzi i podejmowania działań. Brakujące dane oznaczają niekompletny kontekst i mniej użyteczne wyniki AI.

System	Wpływ kompletności
Raporty	Częściowe dane produkują zniekształcone metryki
Flows	Brakujące wartości powodują awarie procesów
Reguły duplikatów	Niekompletne rekordy są trudniejsze do dopasowania
Agentforce	Luki w kontekście zmniejszają dokładność AI

Jak DQS mierzy kompletność

DQS produkuje 10 metryk kompletności zorganizowanych wokół pytania diagnostycznego: „Gdzie brakuje danych, dlaczego i czy dane, które istnieją, są rzeczywiście użyteczne?”

Pomyśl o tych metrykach jak o lejku diagnostycznym. Każdy krok opiera się na poprzednim.

Krok 1: Jak kompletne są dane?

Stopień kompletności to metryka nagłówkowa. Oblicza procent rekordów, w których pole zawiera niepustą, niezerową wartość. To liczba, którą umieszcza się na dashboardzie.

Uruchamiasz skanowanie obiektu Account. Pole Industry pokazuje Stopień kompletności 62%. Oznacza to, że 38% Twoich Accounts nie ma wartości branży, co oznacza, że raporty segmentacji, reguły terytorialne i kampanie marketingowe filtrowane po branży działają na niekompletnych danych.

Każda inna metryka kompletności istnieje, aby wyjaśnić, dlaczego ta liczba nie wynosi 100%.

Krok 2: Jaka jest skala?

Procenty mówią o dotkliwości. Liczby mówią o nakładzie pracy. Populated Count odpowiada na pytanie o skalę: ile rekordów rzeczywiście ma wartość. Używaj go do raportowania pokrycia i do określenia rozmiaru luki względem łącznej liczby rekordów — różnica między Twoim totalem a Populated Count to zaległość czyszczenia.

Przykład: Twój data steward musi zbudować kampanię czyszczenia. Przy 50 000 Contacts i Populated Count 35 800 na Phone wie, że 14 200 rekordów wymaga wzbogacenia, może oszacować koszt z dostawcą danych i ustawić realistyczny harmonogram.

Krok 3: Dlaczego jest niekompletne?

Trzy metryki rozkładają przyczynę niekompletności. Każda wskazuje na inny problem źródłowy.

Null Count i Null Rate mierzą rekordy, w których pole ma prawdziwe null w bazie danych, co oznacza, że pole nigdy nie zostało wypełnione. W Salesforce null i pusty ciąg znaków to różne stany. Pole, którego nigdy nie dotknięto, jest null. Pole, które zostało świadomie wyczyszczone, jest pustym ciągiem znaków. To rozróżnienie mówi, czy dane nigdy nie zostały przechwycone, czy zostały celowo usunięte.

Przykład: Po migracji danych pole Fax na Accounts pokazuje 45% Null Rate. Dane faksu nigdy nie zostały zmigrowane ze starego systemu (null = nigdy nie istniały) zamiast zostać przechwycone i później wyczyszczone. Wysoki Null Rate wskazuje na system źródłowy, a nie na zachowanie użytkowników.

Placeholder Count i Placeholder Rate mierzą rekordy zawierające znane wartości zastępcze takie jak „N/A”, „TBD”, „Unknown” lub dowolne wartości niestandardowe, które zdefiniujesz. Te wartości wyglądają jak dane, ale nie niosą żadnej realnej informacji.

Przykład: Twoje globalne dane Account pokazują 94% Stopnia kompletności dla Industry. Wygląda świetnie na papierze. Ale Placeholder Rate ujawnia, że 18% tych „wypełnionych” wartości to faktycznie „N/A”, „Other” lub „Unknown”. Rzeczywista kompletność jest bliższa 76%. To metryka, która zmienia zielony dashboard w czerwony.

Krok 4: Czy „kompletne” dane są użyteczne?

Pierwsze trzy kroki identyfikują, czego brakuje. Krok 4 zadaje trudniejsze pytanie: czy dane, które są obecne, są w ogóle warte posiadania?

Incompleted Count to najszersza miara brakujących danych. Łączy wszystkie formy niekompletności: null, puste wartości, oraz wartości zastępcze. Gdy wykrywanie wartości zastępczych jest aktywne, Incompleted Count jest zawsze większe lub równe samemu Null Count, ponieważ obejmuje również wpisy złożone tylko z białych znaków i wartości zastępcze.

Przykład: Twoje pole Description na Opportunities pokazuje Null Count 500, ale Incompleted Count 1800. Różnica? 1300 rekordów ma opisy typu „TBD”, „N/A” lub „---”. Te rekordy są technicznie wypełnione, ale praktycznie bezużyteczne. Bez tej metryki myślałbyś, że masz tylko 500 rekordów do naprawy zamiast 1800.

Rich Text Ratio mierzy procent rekordów pola tekstowego, które zawierają znaczącą treść powyżej progu liczby znaków. Oddziela pola z sensowną prozą od pól z kilkoma słowami. Pole Description jest „wypełnione”, niezależnie od tego, czy zawiera „Dobry klient”, czy trzyparagrafowy plan konta. Dla gotowości na AI głębokość treści ma takie samo znaczenie, jak jej obecność.

Przykład: Twoja firma ocenia narzędzie AI podsumowujące opisy Case. Skanujesz pole Description na Cases: 88% Stopnia kompletności, ale tylko 31% Rich Text Ratio. Tylko 31% opisów case ma wystarczająco dużo treści, aby AI mogło z nimi pracować. Reszta to wpisy typu „call back”, „see email” lub „issue reported”. Projekt AI potrzebuje fazy wzbogacania danych, zanim będzie mógł dostarczyć wartość.

Text Field Utilization mierzy, ile z dostępnej pojemności pola tekstowego jest wykorzystywane. Long Text Area o pojemności 32 000 znaków, w którym średni wpis ma 45 znaków, ma bardzo niskie wykorzystanie.

Average Utilization daje średni procent wykorzystanej długości pola we wszystkich rekordach. Razem z Text Field Utilization maluje pełny obraz tego, czy Twoje pola tekstowe mają odpowiedni rozmiar.

Przykład: Podczas oceny org, Text Field Utilization ujawnia, że Notes__c (Long Text Area, 131 072 znaków) ma średnio 3,2% wykorzystania, przy czym większość wpisów ma mniej niż 200 znaków. Tymczasem Short_Description__c (Text, 255 znaków) pokazuje 94% wykorzystania z częstymi problemami obcinania. Schemat wymaga dostosowania rozmiaru: Long Text Area jest przesadą, a pole Text jest za małe.

Uwaga: Text Field Utilization i Average Utilization mają zastosowanie tylko do pól String i TextArea, ponieważ to typy pól z określoną pojemnością znaków do mierzenia.

Dlaczego stopnie i liczby występują w parach

Większość metryk występuje jako stopień (procent) i liczba (wartość bezwzględna). Jest to celowe:

Stopnie są dla dashboardów, raportowania dla zarządu i śledzenia trendów. „Kompletność poprawiła się z 72% do 89% w tym kwartale.”
Liczby są do planowania projektów, szacowania obciążenia pracą i określania zakresu czyszczenia. „Mamy 14 200 rekordów do naprawy.”

Używaj stopni do komunikowania postępu. Używaj liczb do planowania pracy.

Referencja metryk

Metryki podstawowe

Te 5 metryk tworzy bazę każdej analizy kompletności. Działają praktycznie na wszystkich typach pól.

Metryka	Typ	Dotyczy
Completeness Rate	Procent	Wszystkie typy pól
Populated Count	Liczba	Wszystkie typy pól
Incompleted Count	Liczba	Wszystkie typy pól
Null Rate	Procent	Wszystkie typy pól
Null Count	Liczba	Wszystkie typy pól

Metryki kontekstowe

Te 5 metryk wykracza poza „czy jest tam?”, pytając „czy jest sensowne?”. Wymagają trybu analizy Contextual Completeness.

Metryka	Typ	Dotyczy
Placeholder Rate	Procent	Tylko pola tekstowe
Placeholder Count	Liczba	Tylko pola tekstowe
Rich Text Ratio	Procent	Tylko pola tekstowe
Text Field Utilization	Procent	Tylko String i TextArea
Average Utilization	Procent	Tylko String i TextArea

Pokrycie typów pól

DQS obsługuje sprawdzenia kompletności na wszystkich standardowych typach pól Salesforce:

Grupa pokrycia	Typy pól	Dostępne metryki
Wszystkie typy (20)	String, TextArea, LongTextArea, Html, EncryptedText, Picklist, Multipicklist, Email, Phone, URL, Reference (Lookup), Date, DateTime, Double, Integer, Currency, Percent, Boolean, Combobox, Id	Completeness Rate, Populated/Incompleted Count, Null Rate/Count
Pola tekstowe (8)	Text, TextArea, LongTextArea, Html, EncryptedText, Email, Phone, URL	Powyższe + Placeholder Rate/Count, Rich Text Ratio
String i TextArea (2)	String, TextArea	Powyższe + Text Field Utilization, Average Utilization

Dwa tryby analizy

DQS oferuje dwa tryby analizy kompletności:

Basic Completeness odpowiada na pytanie: „Czy pola są wypełnione?” Produkuje 5 metryk podstawowych i pokrywa podstawy, których każde org potrzebuje do sprawdzenia higieny danych lub szybkiego audytu.

Contextual Completeness idzie głębiej. Produkuje wszystkie 10 metryk, w tym wykrywanie wartości zastępczych, analizę rich text i wykorzystanie pól. Używaj tego trybu, gdy musisz odróżnić dane, które są obecne, od danych, które są użyteczne.

Potrzeba biznesowa	Rekomendowany tryb
Szybkie sprawdzenie higieny lub audyt bazowy	Basic Completeness
Ocena migracji danych	Contextual (wykrywanie wartości zastępczych wychwytuje fałszywe dane ze starszych systemów)
Ocena gotowości na AI	Contextual (Rich Text Ratio i metryki wykorzystania oceniają głębokość treści)
Bieżące zarządzanie danymi	Zacznij od Basic, przejdź do Contextual, gdy będziesz gotowy na głębszą analizę

Konfigurowanie kompletności

DQS udostępnia cztery wejścia konfiguracyjne dla kompletności. Każde można ustawić na poziomie globalnym (dotyczy wszystkich pól) i nadpisać na poziomie pojedynczego pola.

Ustawienie	Co kontroluje
Blank As Incomplete	Gdy włączone, DQS traktuje puste ciągi i wartości złożone tylko z białych znaków jako niekompletne. Domyślnie: włączone.
Placeholders As Incomplete	Gdy włączone, DQS traktuje wartości zastępcze (jak „N/A” lub „TBD”) jako niekompletne. Domyślnie: wyłączone.
Placeholder Values	Lista ciągów, które DQS traktuje jako wartości zastępcze. Definiujesz je w oparciu o wzorce wprowadzania danych w Twoim org (np. `N/A, TBD, Unknown, --, 000-000-0000`).
Case-Sensitive Placeholders	Kontroluje, czy dopasowanie wartości zastępczych uwzględnia wielkość liter. Gdy włączone, „tbd” i „TBD” są traktowane jako różne wartości. Domyślnie: z uwzględnieniem wielkości liter.

Wskazówka: Zacznij od typowych wartości zastępczych („N/A”, „TBD”, „Unknown”, „—”) i dodawaj wartości specyficzne dla org, gdy odkryjesz je w wynikach skanowania.

Typowe problemy z kompletnością

Pola opcjonalne nigdy nie wypełniane

Kiedy pola są opcjonalne, użytkownicy je pomijają. Z czasem cenne pola takie jak Company Description lub LinkedIn URL mają niemal zerowe stopnie kompletności.

Rozwiązanie: Ustaw krytyczne pola jako wymagane lub twórz monity podczas edycji rekordu.

Masowe importy z lukami

Migracje danych i importy list często nie mają wartości dla pewnych pól. Kupiona lista kontaktów nie ma powiązania z Account. Eksport ze starego systemu nie ma zestandaryzowanych wartości Industry.

Rozwiązanie: Audytuj importy przed załadowaniem. Używaj DQS do ustalenia poziomów bazowych i śledzenia poprawy po każdym imporcie.

Nadużywanie wartości zastępczych

Użytkownicy wprowadzają „N/A” lub „TBD”, aby przejść reguły walidacji. Pole wydaje się kompletne, ale nie zawiera użytecznych danych. Standardowe raporty liczą je jako wypełnione.

Rozwiązanie: Włącz wykrywanie wartości zastępczych i zdefiniuj listę wartości. Przeglądaj i aktualizuj wartości zastępcze podczas regularnego utrzymania danych.

Wypełnianie białymi znakami

Niektóre integracje lub ręczne wprowadzanie zostawiają pola tylko z białymi znakami. Salesforce liczy je jako „wypełnione”, ale nie zawierają niczego użytecznego.

Rozwiązanie: Włącz wykrywanie pustych wartości, aby wychwycić wartości złożone tylko z białych znaków.

Najlepsze praktyki

Ustal priorytety według wpływu biznesowego

Nie każde pole potrzebuje wysokiej kompletności. Skoncentruj się na polach napędzających automatyzację, pojawiających się w dashboardach zarządu, zasilających AI i Agentforce lub wspierających wymagania zgodności.

Śledź trendy w czasie

Pojedynczy wynik kompletności to migawka. Śledź wyniki z wielu skanowań, aby wcześnie wykrywać degradację, mierzyć inicjatywy poprawy i identyfikować problematyczne źródła danych.

Rozwiązuj przyczyny źródłowe

Niska kompletność sygnalizuje problem procesowy. Zbadaj, czy użytkownicy pomijają pola, czy importy nie mają danych, czy integracje cicho zawodzą. Naprawiaj źródło, a nie tylko objaw.

Użyj lejka diagnostycznego

Nie zatrzymuj się na Stopniu kompletności. Przejdź przez lejek: sprawdź skalę (Populated Count), zidentyfikuj przyczynę (Null vs Placeholder), następnie oceń jakość treści (Rich Text Ratio, Utilization). Każdy krok ujawnia inny typ problemu z inną poprawką.

Następne kroki

Teraz rozumiesz, jak mierzyć i poprawiać kompletność. Kontynuuj naukę o następnym wymiarze:

Dalej: Poprawność - Zapewnij zgodność danych z oczekiwanymi formatami
Powiązane: Pięć wymiarów - Przegląd wszystkich wymiarów
Działanie: Ocena gotowości na AI - Zobacz swoje aktualne wyniki kompletności