완전성: 구성 시나리오

이 시나리오가 다루는 내용

이 페이지는 DQS 완전성 분석의 세 가지 실제 구성을 안내합니다. 각 시나리오는 특정 비즈니스 문제를 다루고, 사용할 정확한 설정을 보여주며, 결과를 읽는 방법을 설명합니다.

이 워크스루는 주요 완전성 문서의 개념을 기반으로 합니다. 완전성 메트릭 또는 진단 퍼널이 새로운 경우 먼저 그것을 읽으십시오.

시나리오 1: Contact의 이메일 위생

문제

영업팀이 이메일 캠페인의 전달률이 낮다고 보고합니다. 마케팅 운영팀은 데이터를 탓하지만 아무도 실제로 얼마나 많은 이메일 데이터가 누락되었는지 알지 못합니다. 사용 가능한 이메일 주소가 없는 Contact의 명확한 수가 필요합니다.

구성

이것은 간단한 채움 비율 확인입니다. Email 필드를 대상으로 Contact 오브젝트에서 기본 완전성 모드를 사용하십시오.

설정	값	이유
분석 모드	기본 완전성	채움 비율과 분류가 필요하며, 자리 표시자 탐지는 필요하지 않음
공백을 불완전으로 처리	켜기	null뿐만 아니라 양식 제출의 빈 문자열도 포착
자리 표시자를 불완전으로 처리	끄기	이메일 필드에는 “N/A”와 같은 자리 표시자 값이 거의 없음

Email 필드는 Salesforce의 텍스트 기반 필드이므로 DQS는 null 및 공백 분류를 모두 생성합니다.

샘플 결과

메트릭	값
완전성 비율	73%
빈 수	2,700
입력된 수	7,300
Null 수	1,800
Null 비율	18%
공백 수	900
공백 비율	9%

전체 Contact 레코드: 10,000.

결과 읽기

헤드라인부터 시작하십시오: 73% 완전성. 즉, 2,700개의 Contact에 이메일 주소가 없습니다. 이메일 캠페인은 기껏해야 10,000개의 contact 중 7,300개에만 도달할 수 있습니다.

이제 진단 퍼널을 통해 2,700개 레코드가 왜 비어 있는지 이해하십시오.

Null 수: 1,800. 이 Contact들은 이메일이 입력된 적이 없습니다. 필드가 한 번도 건드려지지 않았습니다. 이 패턴은 빠른 데이터 입력 중에 담당자가 이메일 필드를 건너뛰거나, 이메일을 캡처하지 않은 시스템에서 가져온 레거시 레코드에서 흔합니다.

공백 수: 900. 이 Contact들의 이메일 필드에는 빈 문자열이 있습니다. 필드에 값이 없이 작성되었습니다. 이 패턴은 다른 근본 원인을 가리킵니다: 이메일 필드가 비어 있더라도 레코드를 제출하는 웹 양식 통합. 통합이 필드를 null로 남겨두는 대신 '' (빈 문자열)를 작성합니다.

두 가지 근본 원인에는 두 가지 다른 수정이 필요합니다:

1,800개 null에 대해: 데이터 입력 격차를 해결하십시오. Contact 페이지 레이아웃에서 이메일 필드를 필수로 만들거나 레코드 생성 중에 프롬프트를 추가하십시오.
900개 공백에 대해: 통합을 수정하십시오. 웹 양식에 클라이언트 측 유효성 검사를 추가하여 빈 이메일 필드가 제출되지 않도록 하거나, 이메일에 빈 문자열을 거부하는 Salesforce 유효성 검사 규칙을 추가하십시오.

다음에 할 일

빈 수(2,700)를 사용하여 데이터 보강 프로젝트의 범위를 정하십시오. 데이터 벤더와 협력하는 경우 비용 견적을 위한 레코드 수입니다. 수정이 작동하는지 측정하기 위해 시간에 따른 완전성 비율을 추적하십시오.

시나리오 2: Account의 산업 자리 표시자 탐지

문제

Account 세분화 보고서는 Account의 94%에 Industry 값이 있음을 보여줍니다. 마케팅은 이 숫자를 신뢰하고 캠페인 타겟팅에 사용합니다. 94%가 실제 정보 없이 데이터처럼 보이는 “N/A” 및 “Unknown”과 같은 자리 표시자 값으로 부풀려졌다고 의심합니다.

구성

Account 오브젝트의 Industry 필드를 대상으로 상황별 완전성 모드를 사용하십시오. 이 모드는 자리 표시자 탐지를 활성화하며, 이것이 이론을 테스트하는 데 필요한 것입니다.

설정	값	이유
분석 모드	상황별 완전성	자리 표시자 탐지 및 내용 품질 메트릭 활성화
공백을 불완전으로 처리	켜기	null과 함께 빈 문자열 포착
자리 표시자를 불완전으로 처리	켜기	이 분석의 핵심
자리 표시자 값	N/A, TBD, Unknown, Other, None, Not Applicable, -	선택 목록 필드에 대한 일반적인 자리 표시자 값
대소문자 구분 자리 표시자	끄기	”n/a”, “tbd”, “unknown” 및 기타 대소문자 변형 포착

이 스캔에서는 대소문자 구분을 끄십시오. 사용자들은 “n/a”, “N/a”, “N/A”와 같이 모든 종류의 대소문자로 자리 표시자를 입력합니다. 모든 변형을 포착하면 진정한 그림을 얻을 수 있습니다.

샘플 결과

메트릭	값
완전성 비율	94%
빈 수	600
입력된 수	9,400
불완전 수	2,400
자리 표시자 수	1,800
자리 표시자 비율	18%

전체 Account 레코드: 10,000.

결과 읽기

헤드라인 숫자는 건강해 보입니다: 94% 완전성. 하지만 이것이 바로 당신이 오해를 불러일으킨다고 의심했던 것입니다.

빈 수와 불완전 수 사이의 격차를 보십시오. 빈 수는 600개 레코드에 전혀 값이 없다고 말합니다. 불완전 수는 2,400개 레코드에 사용 가능한 값이 없다고 말합니다. 차이는 자리 표시자 값을 가진 1,800개 레코드입니다.

수학:

불완전 수 (2,400) = 빈 수 (600) + 자리 표시자 수 (1,800)

600개 레코드는 눈에 띄게 비어 있습니다. 표준 Salesforce 보고서를 실행하는 누구든 이것을 발견할 것입니다. 하지만 1,800개 레코드는 실제 세분화 데이터 없이 완전성 비율을 높이는 “N/A”, “Other” 또는 “Unknown”과 같은 값을 포함합니다.

진정한 사용 가능한 완전성은 94%가 아닌 76%에 가깝습니다. 그 18포인트 격차는 표준 보고서가 놓치는 숨겨진 불완전성입니다.

세분화에 이것이 왜 중요한가: 마케팅이 “Technology” 산업 Account를 대상으로 캠페인을 실행한다면 세그먼트 수는 정확합니다. 하지만 산업별 전체 커버리지를 보여주는 보고서를 실행한다면 94% 헤드라인은 “입력된” 레코드의 거의 5개 중 1개가 사용 가능한 산업 정보를 제공하지 않는다는 사실을 숨깁니다.

다음에 할 일

데이터 보강 프로젝트의 범위를 600개가 아닌 2,400개 레코드로 정하십시오. 정리 목표는 빈 수가 아닌 불완전 수입니다. Account 관리자와 협력하여 실제 산업 값을 채우거나 보강 서비스를 사용하십시오. 정리 후 스캔을 다시 실행하여 개선을 측정하십시오.

시나리오 3: AI 준비를 위한 Case 설명 깊이

문제

귀사는 지원 에이전트를 위해 Case 설명을 요약하는 AI 도구를 평가 중입니다. 벤더는 AI가 효과적으로 작동하려면 “풍부한 텍스트 데이터”가 필요하다고 말합니다. 도구에 투자하기 전에 AI가 유용한 요약을 생성하기에 충분한 내용이 Case Description 필드에 있는지 평가해야 합니다.

구성

Case 오브젝트의 Description 필드를 대상으로 상황별 완전성 모드를 사용하십시오. 전체 상황별 메트릭 세트가 필요합니다: 자리 표시자 탐지 및 텍스트 품질 메트릭 (풍부한 텍스트 비율, 텍스트 필드 활용률, 평균 활용률).

설정	값	이유
분석 모드	상황별 완전성	AI 준비성 평가에 필요한 내용 깊이 메트릭 생성
공백을 불완전으로 처리	켜기	빈 설명 포착
자리 표시자를 불완전으로 처리	켜기	얕은 채우기 항목 포착
자리 표시자 값	이메일 참조, 다시 전화, TBD, N/A, -, 보류 중	에이전트가 실제 설명 대신 사용하는 일반적인 단축키

여기의 자리 표시자 목록은 지원 에이전트가 실제로 Description 필드를 채우는 방식을 반영합니다. 실제 설명을 작성하는 대신 빠른 약어를 입력합니다. 이러한 항목은 기술적으로 입력되었지만 AI에게 요약할 내용을 제공하지 않습니다.

샘플 결과

메트릭	값
완전성 비율	88%
빈 수	500
입력된 수	3,700
불완전 수	1,800
자리 표시자 수	1,300
풍부한 텍스트 비율	31%
텍스트 필드 활용률	12%
평균 활용률	8.4%

전체 Case 레코드: 4,200 (빈 500개와 입력된 수에서 추정).

결과 읽기

헤드라인부터 시작하십시오: 88% 완전성. 텍스트 필드의 경우 건강하게 들립니다. 하지만 이 분석은 데이터 위생이 아닌 AI 준비성에 관한 것입니다. 헤드라인 숫자만으로는 충분하지 않습니다.

불완전 수 vs 빈 수. 500개 레코드에는 설명이 전혀 없습니다. 하지만 1,800개 레코드는 자리 표시자를 포함할 때 불완전합니다. 1,300개 레코드의 격차에는 “이메일 참조”, “다시 전화”, “보류 중”과 같은 항목이 포함됩니다. 이 레코드들은 기본 완전성 확인을 통과하지만 AI에게 작업할 내용을 제공하지 않습니다.

풍부한 텍스트 비율: 31%. 이것이 귀하의 질문에 답하는 숫자입니다. Case 설명의 31%만이 문자 임계값 이상의 의미 있는 내용을 가집니다. 나머지 69%의 “입력된” 설명은 자리 표시자(이미 위에서 계산됨) 또는 “문제 보고”, “고객 전화”, “에스컬레이션됨”과 같이 AI가 요약하기에 너무 짧고 얕은 항목입니다.

텍스트 필드 활용률: 12%. Description 필드는 대용량 문자 용량을 가진 긴 텍스트 영역입니다. 레코드는 데이터셋 전반에서 평균적으로 그 용량의 12%만 사용하고 있습니다. 대부분의 항목이 매우 짧다는 것을 확인합니다.

평균 활용률: 8.4%. 모든 레코드에 걸친 평균 사용량은 필드 용량의 8.4%입니다. 대부분의 설명은 단락이 아닌 몇 단어입니다.

AI 준비성 평결: AI 요약 도구는 Case의 약 31%에 대해 유용한 결과를 생성할 것입니다. 나머지 69%에 대해 AI는 요약 생성에 실패하거나 문장 단편을 기반으로 무언가를 생성할 것입니다. 도구는 케이스 볼륨의 3분의 2 이상에서 저조한 성능을 보일 것입니다.

다음에 할 일

AI 도구에 투자하기 전에 이해관계자에게 이 데이터를 제시하십시오. 숫자가 명확하게 케이스를 만듭니다: AI 프로젝트에는 먼저 데이터 보강 단계가 필요합니다. 목표 풍부한 텍스트 비율을 정의하고(60% 이상으로 시작) 설명 품질을 개선하기 위한 계획을 구축하십시오. 옵션에는 다음이 포함됩니다:

최소 설명 길이를 요구하도록 Case 생성 프로세스 업데이트
유용한 설명 작성에 대한 지원 에이전트 교육
Case 접수 중에 자세한 정보를 요청하는 화면 흐름 추가

각 개선 주기 후에 스캔을 다시 실행하십시오. AI 준비성을 위한 기본 진행 메트릭으로 풍부한 텍스트 비율을 추적하십시오.

구성 선택

이 표를 사용하여 완전성 분석에 맞는 시작점을 선택하십시오.

필요한 것…	시작점	핵심 설정
위생 감사를 위한 기본 채움 비율 확인	기본 완전성	공백을 불완전으로 처리: 켜기
숫자를 부풀리는 자리 표시자 값 탐지	상황별 완전성	자리 표시자를 불완전으로 처리: 켜기, 자리 표시자 목록 정의
AI 준비성을 위한 내용 깊이 평가	상황별 완전성	자리 표시자를 불완전으로 처리: 켜기, 풍부한 텍스트 비율 및 활용률 메트릭 검토
데이터 정리 프로젝트 범위 결정	두 모드 중 하나	레코드 수에 빈 수 (기본) 또는 불완전 수 (상황별) 사용
”입력된 적 없음”과 “지워진” 데이터 구분	두 모드 중 하나	근본 원인 식별을 위해 Null 수 vs 공백 수 비교

13가지 완전성 메트릭과 진단 퍼널에 맞는 위치에 대한 전체 참조는 주요 완전성 문서로 돌아가십시오.

완전성 및 기타 데이터 품질 차원이 AI 준비성에 어떤 영향을 미치는지 보려면 AI 준비성 평가를 받으십시오.