Agentforceのデータ品質：SalesforceデータをAI向けに準備する

AgentforceエージェントはバックにあるSalesforceデータと同じだけしか信頼できません。Agentforceのデータ対応とは、突き詰めればデータ品質の問題です。レコードが揃っていること、値が一貫していること、そしてエージェントが読むフィールドにPIIが含まれていないこと。本ガイドでは、Salesforceデータを評価しAI向けに準備する方法をフェーズごとに解説します。

Agentforceとは

Agentforceは、自律型エージェントを作成するためのSalesforceのAIプラットフォームです。これらのエージェントはSalesforceレコードから情報を取得し、データに基づいて応答を生成し、ユーザーに代わってアクションを実行します。

データの品質がエージェントの振る舞いの品質を決定します。エージェントは見つけたものを使って動作します。データが不完全、一貫性がない、またはPIIを含む場合、エージェントは不完全、一貫性のない、またはコンプライアンスに反する出力を生成します。

Agentforceにとってデータ品質が重要な理由

3つのデータ問題がAgentforceに3つの明確な障害を生みます。

**不完全なデータは曖昧な応答を生みます。**Agentforceが空のDescriptionを持つCaseレコードを取得したとき、利用できるものがありません。参照するコンテキストがないため、エージェントは一般的な応答を生成します。完全性率はスコープ内のすべてのフィールドにわたって、何件のレコードにこの問題があるかを示します。

**一貫性のないデータは矛盾した回答を生みます。**Countryフィールドに「US」「USA」「United States」「U.S.A.」が含まれていると、エージェントはそれらを4つの異なる値として扱います。米国の業務について尋ねる顧客は、エージェントがどのレコードを取得するかによって異なる回答を得ます。準拠率はデータがどれほど分断されているかを明らかにします。

**テキストフィールド内のPIIはコンプライアンス上の露出を生みます。**エージェントがSocial Security Numberを含むCaseコメントを取得したとき、そのPIIはAIのコンテキストに入ります。エージェントはそれを応答に表面化させることができます。PII Exposure Rateは、このリスクがテキストフィールド全体にどれほど広がっているかを示します。

Agentforceデータ対応のタイムライン

Agentforceのデータ対応を4つのフェーズで計画しましょう。

フェーズ1：評価（3か月以上前）

Agentforceがアクセスするすべてのオブジェクトに対してDQSスキャンを実行します。各次元のベースライン指標を測定します。

次元	主要指標	示す内容
完全性	完全性率	データを持つフィールドの割合
一貫性	準拠率	期待値に一致する割合
妥当性	妥当性率	フォーマットルールを通過する割合
適時性	鮮度率	最新レコードの割合
一意性	重複率	重複レコードの割合
PII Detection	PII Exposure Rate	PIIを含むレコードの割合

これらのベースラインをドキュメント化します。修復後の比較のために必要です。

フェーズ2：修復（2か月前）

優先順位順に次元に取り組みます。まずPII、次にAIコンテキスト品質に影響する次元です。

**1. PII（第1〜2週）。**まずSSNとクレジットカードの検出結果を修復します。Criticalプリセットスキャンを使って金融系PIIを分離します。マッチを確認し、確認されたものをマスク、削除、または除外します。クレンジングを検証するためにスキャンを再実行します。

**2. 完全性（第2〜4週）。**Agentforceが応答に使うフィールド、すなわちDescription、Comments、Notesに焦点を当てます。欠損データは欠損するAIコンテキストを意味します。最も完全性率が低いフィールドから対象にしましょう。

**3. 一貫性（第3〜5週）。**選択リストと参照フィールドを標準化します。Import from Fieldを使って既存のバリアントを発見し、正規値を定義して正規化します。フィールドあたりのバリアントが少ないほど、エージェントの応答は信頼できます。

**4. 妥当性（第4〜6週）。**構造化フィールド（メール、電話、日付）のフォーマット問題を修正します。無効なフォーマットはAI取得に信頼できないデータを生みます。妥当性率が90%未満のフィールドに焦点を当てます。

**5. 適時性と一意性（第5〜8週）。**古いレコードと重複に対処します。古いデータはエージェントに時代遅れのパターンを学習させます。重複は、エージェントが同じレコードの異なるバージョンを取得したときに矛盾した応答を生みます。

フェーズ3：検証（1か月前）

すべてのDQSスキャンを再実行します。結果をフェーズ1のベースラインと比較します。

指標	ベースライン	修復後	目標
完全性率（主要フィールド）	___%	___%	85%以上
準拠率（選択リスト）	___%	___%	90%以上
妥当性率（構造化フィールド）	___%	___%	90%以上
PII Exposure Rate	___%	___%	1%未満

修復後のデータでエージェントの応答をテストします。エージェントが正確で適切な出力を返し、生成されたコンテンツにPIIが現れないことを確認します。

導入前にコンプライアンスチームの承認を得ましょう。

フェーズ4：モニタリング（継続）

定期的なDQSスキャンをスケジュール設定します。ユーザーが新しいレコードを入力するにつれてデータ品質は劣化するため、一度きりの修復では不十分です。

推奨サイクル：

スキャン	頻度	オブジェクト
PII Detection	毎週	Case、Lead（大量のテキストフィールド）
完全性＋一貫性	毎月	Agentforceスコープ内のすべてのオブジェクト
フルスキャン（全次元）	四半期ごと	組織全体

指標のトレンドを時系列で追跡しましょう。定期的なスキャンは、エージェントのパフォーマンスに影響する前に劣化を早期に捕捉します。

導入前チェックリスト

データ品質

AgentforceスコープのすべてのオブジェクトをDQSでスキャンした
Agentforceが使うフィールドの完全性率が85%以上
選択リストと参照フィールドの準拠率が90%以上
構造化フィールド（メール、電話、日付）の妥当性率が90%以上

PII安全性

Agentforceがアクセスするテキストフィールドのpii Exposure Rateが1%未満
CaseのDescriptionとCommentsにSSNやクレジットカードのマッチがゼロ
想定コンテンツのフィールドに対してフィールドごとのパターンオーバーライドを設定

運用

定期スキャンのスケジュールを設定
トレンド追跡のためにベースライン指標をドキュメント化
次元ごとに修復担当を割り当て

よくある落とし穴

**1. 評価なしの導入。**導入計画の前にDQSスキャンを実行しましょう。ほとんどの組織は想定していなかった問題を発見します。15分のスキャンが、手動で見つけるには数か月かかる問題を明らかにします。

**2. PII露出の過小評価。**PIIはユーザーが顧客コミュニケーションを貼り付けるDescription、Notes、Commentsフィールドに隠れています。email-to-caseは受信メッセージからSSNやクレジットカード番号を取得します。専用のPIIフィールドだけでなく、すべてのテキストフィールドをスキャンしましょう。

**3. 一度きりの修復。**ユーザーが新しいレコードを入力するにつれてデータ品質は劣化します。今日クリーンなデータセットは、数週間以内に新しい問題を蓄積します。定期スキャンをスケジュールし、エージェントに到達する前に劣化を捕捉するために指標のトレンドをモニタリングしましょう。

次のステップ

PII Detection：Agentforceデータ向けのPIIスキャンを設定する
完全性：AIが使うデータがフィールドにあることを確認する
一貫性：AIが取得する値を標準化する
5つの次元：すべてのデータ品質次元の完全な概要
AI対応度診断：現在の対応度スコアを取得する