AgentforceとRAG： AIエージェントを向上させるベストプラクティス

非構造化データと長い自由テキストフィールドでAgentforceを強化するためのベストプラクティスガイド

Reinier van Leuken、Agentforce部門製品管理シニアディレクター

I. はじめに

1.1 本ガイドの目的

非構造化データと長い自由テキストフィールドでAgentforceを強化するためのベストプラクティス

このガイドでは、非構造化データと長い自由テキストフィールドを活用して、Headless 360 platform上で検索拡張生成（RAG）によってAgentforceを強化するためのベストプラクティスを提供します。 RAGは、ファイル、メール、記事、ドキュメント、通話メモ、目的の説明、構造化されたテーブルのフィールドなどを含む企業のエンタープライズナレッジを活用して、AIエージェントの応答をより正確で最新のものにし、関連性を高めることで、その質を高めます。 RAGツールの中には、シンプルでそのまま使用できるものもあれば、詳細な設定オプションを提供しているものもあります。本ガイドは、Salesforceシステム管理者および開発者が、情報にもとづいて設計に関する選択を行いソリューションを最適化する上で役立ちます。

実際のシナリオに着想を得たコンテンツ

このコンテンツは実際の導入シナリオにもとづいており、一般公開中、またはオープンベータ版のテクノロジーを対象としています。ロードマップの項目について審議される場合があり、これらは#ロードマップと記されており、可能な場合にはリリースのタイムラインが提供されています。これは、付録内の将来予想に関する記述の対象となります。

公式ドキュメントの補完

このドキュメントは、help.salesforce.comおよびTrailheadドキュメントを補完し、高性能AIエージェントを実現するための実践的なガイダンスを提供します。

はじめに：概要および前提条件

本ガイドの「はじめに」では、Headless 360 platform上のRAGの概要をご紹介します。ただし、本ガイドは完全な初心者向けではありません。この章の最後には、本ガイドの残りの部分を理解するための前提条件が記載されています。

チャプター 1

2. RAG向けコンテンツのキュレーション
チャプター 2

3. RAGを活用したAIエージェントの設計
チャプター 3

4. ハイブリッド検索
チャプター 4

5. 検索インデックスの最適化：フィールドの選択、チャンク化、ベクトル化
チャプター 5

6. リトリーバーの設定
チャプター 6

7. RAGとプロンプトエンジニアリング
チャプター 7

8. 引用 #ロードマップ
チャプター 8

9. リトリーバーなしのプロコードRAG
チャプター 9

10. RAGに適したLLMの選定
チャプター 10

11. Flow内のRAG
チャプター 11

12. RAGを活用したAIエージェントのデバッグとトラブルシューティング
チャプター 12

13. さらなるインサイト： RAGの最適化と非生成的ユースケース
チャプター 13

付録

2. RAG向けコンテンツのキュレーション

3. RAGを活用したAIエージェントの設計

4. ハイブリッド検索

5. 検索インデックスの最適化：フィールドの選択、チャンク化、ベクトル化

6. リトリーバーの設定

7. RAGとプロンプトエンジニアリング

8. 引用 #ロードマップ

9. リトリーバーなしのプロコードRAG

10. RAGに適したLLMの選定

11. Flow内のRAG

12. RAGを活用したAIエージェントのデバッグとトラブルシューティング

13. さらなるインサイト： RAGの最適化と非生成的ユースケース

付録

1.2 Headless 360 platform上の検索拡張生成（RAG）の概要

Data 360のRAGは、大規模言語モデル（LLM）のプロンプトをグラウンディングするためのフレームワークです。正確かつ最新で関連性の高い情報を追加することで、RAGはユーザーへのLLMの応答の関連性と価値を高めます。プロンプトにデータを取り込むには、差し込み項目やデータグラフなど、さまざまな方法があります。本ガイドでRAGについて言及する場合、クエリとの意味的な類似性にもとづいて取得された長文テキストコンテンツでプロンプトを拡張することを指します。

LLMプロンプトを送信すると、Data 360のRAGは以下のように動作します。

ナレッジストアである検索インデックスから、構造化および非構造化コンテンツなどの関連情報を取得
元のプロンプトとこの情報を組み合わせてプロンプトを拡張
プロンプトの応答を生成

多くのLLMは、インターネット上で一般公開されている静的なコンテンツをもとに学習しています。 RAGは、企業の非公開データなど、LLMの学習データに含まれていない、正確な最新情報をプロンプトに追加し、ナレッジストアからの関連情報によってLLMの機能を補完します。 RAGを使用すると、ユーザーはモデルの再学習や微調整を行うことなく、独自のデータをLLMに提供できます。その結果、ユーザーのコンテキストやユースケースにより適したLLMの応答を得ることができます。

RAGのユースケースの例は以下のとおりです。

ナレッジ記事、ドキュメント、研究論文を使用して質問に回答する
メモ、メール、通話の文字起こしを使用して営業会議の概要を生成する
過去の類似ケースの解決結果を使用してサービス返信を生成する

オフライン準備とオンライン利用の2つの主要な部分で分けて考えると、RAGを理解しやすくなります。

リトリーバーを含むプロンプトテンプレートが実行されるたびに、上記の図に示されているようなシーケンスが発生します。

リトリーバーは、プロンプトテンプレートの動的クエリで呼び出されます。
クエリはベクトル化され、数値表現に変換されます。ベクトル化によって、すでにベクトル化されている検索インデックス内で、この検索が意味的な一致を見つけることができるようになります。
クエリは、検索インデックス内のインデックス化されたデータから関連するコンテンツを取得します。
元のプロンプトには、検索インデックスから取得した情報が入力されます。
プロンプトがLLMに送信され、応答が生成されて返信されます。

クエリはプロンプトにおける重要な要素です。これには、ユーザーのインテントを反映した検索文字列が含まれています。 RAGプロセスは、この検索文字列を使用して、意味的な類似性にもとづいて関連するデータを検索します。このプロセスでは、正確な単語ではなく、意味に重点が置かれます。ハイブリッド検索は、セマンティック検索にキーワードの類似性を追加することで、LLMの応答品質を向上させることができます。 RAGは、識別子や単一のキーワードを使った単なるデータ検索とは異なります。 RAGには必ず、複数のキーワードを含む検索文字列との意味的な類似性にもとづいて、より長い自由記述形式のテキストデータを特定することが伴います。

オフライン準備のクイックスタート

Agentforce Builderまたは設定でAgentforceデータライブラリ（ADL）を追加することが、RAGソリューションを設定する最短の方法です。 ADLを作成すると、RAGを活用したソリューションの動作に必要なすべてのコンポーネントが自動的に設定されます。これらのコンポーネントには、データストリーム、オブジェクトとマッピング、ベクトルデータストア、検索インデックス、リトリーバー、プロンプトテンプレート、およびエージェントアクションが含まれます。 Salesforceは、これらのコンポーネントにデフォルト設定を使用します。作成したコンポーネントをベースとして、さらに設定や改良を行うこともできます。たとえば、カスタムテンプレートでデフォルトのリトリーバーを使用したり、検索インデックス用にカスタムリトリーバーを作成したりできます。

オフライン準備のための高度な設定

Data 360でRAGを手動で実装するには、まず、LLMプロンプトのグラウンディングのために、RAGが関連情報を取得する構造化データおよび非構造化データを接続します。Data 360は、検索インデックスを使用して、構造化および非構造化コンテンツを検索に最適化された方法で管理します。サポートされているファイルタイプのコンテンツは、さまざまなソースから取り込むことができます。 RAGで使用される非構造化コンテンツには、サービス返信、ケース、RFPの回答、ナレッジ記事、よくある質問、メール、会議メモなどがあります。

Data 360でのオフライン準備の手順は以下のとおりです。

非構造化データ（DSO → DLO/UDLO → DMO/UDMO）を接続します。
コンテンツをチャンク化してベクトル化するための検索インデックスの設定を作成します。チャンク化によって、テキストを文や段落のような小さな単位に分割します。ベクトル化によって、これらの分割された要素を、意味的な類似性を捉える数値表現に変換します。
Data 360で検索インデックスを保存および管理します。

詳細については、AI、自動化、分析の検索をご確認ください。

橋渡し役であるリトリーバー

リトリーバーは、検索インデックスとプロンプトテンプレートの間の橋渡し役として機能します。検索インデックスを作成すると、Data 360は自動的にデフォルトのリトリーバーを作成します。これは、エージェントスタジオで表示されます。さまざまなユースケースに対応するために、エージェントスタジオでカスタムリトリーバーを作成できます。プロンプトを拡張するために、カスタムリトリーバーは検索条件を改善し、フィルターを追加したり、追加の返信フィールドを含めたりするなどして、コンテキストとの関連性がもっとも高い情報を取得します。詳細については、リトリーバーの管理をご確認ください。

オンライン使用：プロンプトテンプレートへのリトリーバーの追加

RAG実装の最後の要素となるのが、プロンプトテンプレートにリトリーバーへの呼び出しを追加することです。特定のプロンプトテンプレートに対して、プロンプトデザイナーは、リトリーバークエリおよび結果設定をカスタマイズすることができます。これにより、プロンプトとの関連性がもっとも高い情報が入力されます。詳細については、Data 360における検索拡張生成（RAG）によるグラウンディングをご確認ください。

RAGを活用したAIエージェント

これまで、検索インデックスのオフライン準備と、プロンプトテンプレート内でのオンライン使用について説明してきました。 RAGをAgentforceで実装するには、このプロンプトテンプレートを呼び出すエージェントアクションが必要です。以下の図は、RAGを活用したAIエージェントのランタイムフロー全体を示しています。

RAGを活用したAIエージェントのフロー

上のフローは、Agentforceが適切なモデルとリトリーバーを選択し、構造化データと半構造化データを組み合わせた非構造化データにもとづいて適切なアクションを実行する方法を示しています。

1.3 推奨文献

本ガイドの内容への理解を深めるために、以下のコンテンツをご確認ください。

Trailheadモジュールを完了する：検索拡張生成：概要
Trailheadモジュールを完了する： Data 360における非構造化データ
デモ動画を見る：非構造化データからAgentforceへ
ドキュメントを読む：データライブラリを追加
ドキュメントを読む： AI、自動化、分析の検索
ドキュメントを読む：リトリーバーを管理
ドキュメントを読む： Data 360における検索拡張生成（RAG）によるグラウンディング

チャプター 1 2. RAG向けコンテンツのキュレーション

構造化コンテンツ

構造化コンテンツには、数値や関係性を備えた意味のある構造に従ったオブジェクトやデータテーブルが含まれます。これらには、カテゴリ型（ピックリスト、識別子）、数値型、参照型などのフィールドがあります一部の構造化コンテンツには、説明、会話、記事などの長文テキストフィールドがあります。これらのフィールドのうち、意味的に有益なファクトイドを表す完全な文がテキストに最低1つ含まれているもののみ、RAGに使用できます。機密レベル、閲覧数、商品の種類など、インデックス化可能なテキストに関連するカテゴリ型および数値型のフィールドは、セクション5.1で説明されているように、インデックスを充実させる目的で使用できます。

構造化コンテンツの例には、ナレッジ記事用のSalesforceオブジェクト（記事本文、説明などを含む）、ケース（ケース詳細、解決結果、まとめなどを含む）、アクティビティ（アクティビティメモを含む）があります。

非構造化コンテンツ

ドキュメント、記事、メール、メモなどの長文テキストのファイルは、非構造化コンテンツと呼ばれます。これには、RAGプロセス向けにテキスト化された音声ファイルや動画ファイルが含まれる場合もあります。音声ファイルと動画ファイルは、元の場所（ゼロコピー・ファイルストア）に保持されます。これらは、音声をテキストに変換する文字起こしサービスに送信されます。次に、文字起こしされたデータはチャンク化およびベクトル化され、分割要素とベクトルのみがData 360に保存されます。

当然ながら、すべてのファイルが非構造化に該当するわけではありません。ファイルにJSON、CSV、XML形式などのフィールドと値を持つ固有の構造が含まれている場合、まず構造化データとして読み込む必要があります。長文テキストのみがチャンク化およびベクトル化に使用できます。その他のフィールドは、セクション5.1で説明されているように、インデックスおよび検索の強化に使用できます。

コンテンツキュレーション

LLMのプロンプトや応答を向上させるために、ソースコンテンツを調整して、情報検索を最適化します。特定の製品の機能は、インデックス化の強化（セクション5.4）やフィールドのプリペンド（セクション5.1）など、不適切に作成されたコンテンツの問題に対応しています。しかし、ソースコンテンツにコンテンツキュレーションの手法を適用すれば、検索を強化し、結果を向上させることができます。

2.1 検索インデックスでサポートされているコンテンツの種類とプラットフォーム

Agentforceデータライブラリ（ADL）の検索インデックス

Salesforceナレッジ記事
以下の形式でアップロードされたファイル
- PDF（最大100MB）
- HTML（最大4MB）
- txt（最大4MB）

Data 360の手動検索インデックス

Data 360で手動作成された検索インデックスでは、以下のような追加のコンテンツソースに対応しています。

任意のDMO上の自由テキストを含むテキストフィールド。例： CRMコネクターを使用してSalesforceオブジェクトから発生した場合、または他のシステムからData 360に取り込まれた場合。
Salesforceレコードからの関連ファイル
Salesforceナレッジ記事（Data 360でDMOとして取り込むパターンを使用）
サポートされているファイル形式：
- PDF（最大100MB）
- HTML（最大4MB）
- txt（最大4MB）
- 音声（mp3、wav、flac、mpga、m4a、ogg）
- 動画（mp4、mpeg、webm）
サポートされているファイルストレージプラットフォーム*：
- AWS S3
- Google Cloud Storage
- Azure Blob Store
- #ロードマップ MuleSoft Directコネクター経由：
- SharePoint
- Googleドライブ（Googleドキュメントを含む）
- Confluence
- Sitemap

*注：ファイルはData 360にコピーされません。その代わりに、必要なメタデータとインデックス化されたコンテンツのみを処理して保存するゼロコピーアプローチを使用します。

2.2 最適なRAG結果を得るためのコンテンツの整理

ベストプラクティスをドキュメント化（ナレッジを含む）

以下の推奨事項は、ナレッジ記事やその他の長文テキストを含むオブジェクトなど、長文テキストフィールドに保存されたドキュメントや長文テキストに適用されます。 AIによって生成された記事の場合、これらの推奨事項をプロンプト内の指示として提供できます。

高度な詳細と徹底的な説明を提供する
生成AIは、きめ細やかで完全な情報が提供される場合にもっとも効果的に機能します。プロンプトで指定された特定のオーディエンスに合わせて、詳細の程度を変えながらデータをまとめ、ユーザーへと提供することができます。たとえば、AIエージェントとのチャットにおいて、顧客は短くて直接的な回答を求めがちです。しかし、サービス担当者が複雑な問題を診断する場合、通常は包括的な技術情報が必要となります。一般的に、ナレッジコンテンツでは、簡潔すぎるよりも、きめ細やかで詳細であることが最善です。詳細なコンテキスト情報を提供することで、適切なコンテンツを取得できます。たとえば、記事内で一般的な類義語や略語を説明することで、LLMはナレッジコンテンツ内のさまざまな概念の関連性をさらに深く理解できるようになります。
実際の事例を提供する
ナレッジ記事では、指定されたトピックについて一般的なユーザーが直面し得る事例を含め、それらを詳細に説明しましょう。これらのシナリオを会話形式で提供することで、検索プロセスがユーザーの問い合わせに対して適切なコンテンツを特定しやすくなります。
記事を適切に構成する
各文が互いに論理的に関連付けられているようにします。意味的かつ論理的にまとまりのある段落にコンテンツを整理します。 HTML形式のコンテンツでは、見出しタグ（H1からH6）を使用して、コンテンツの階層的な関係を示します。チャンク化プロセスは、チャンクの区切りとして見出しタグを使用します。
Salesforceナレッジ記事のフィールドにコンテンツを分散する
Salesforceナレッジ記事をチャンク化およびベクトル化する際、検索インデックスは構造化されたDMOに対して構築されます。長文コンテンツを質問、説明、解決結果、例外など複数のフィールドに分散させることで、この構造を活用できます。ナレッジ記事に、セクション5.1で説明されているフィルタリングとプリペンド用のメタデータを付与します。
メディアに代替テキストを付与する
チャンク化およびベクトル化プロセスは、ドキュメントに含まれる動画ファイルと画像を無視します。ただし、それらに関連付けられた説明はチャンク化され、ベクトル化されます。メディアのコンテンツを詳細な代替テキストで説明し、その意味と値が検索インデックスに含まれるようにします。
一般的なユーザーの質問に合わせてコンテンツの焦点を絞って構造化する
RAGは、多くの場合、よくある質問エージェントなどがユーザーの質問に回答するために使用されます。システムはそこから、コンテンツとユーザーのクエリの意味的な関係を確立する必要があります。質問と回答が一緒にベクトル化されるため、ドキュメント内で質問と回答を明示的にリンクすることで意味的なつながりが強化されます。一般的なユーザーマニュアルといった、その他のドキュメント手法の場合、質問とコンテンツの意味的な一致はそれほど明確ではありません。記事が単一のトピックに重点を置けるように、コンテンツをセグメント化します。無関係またはほぼ関係のない複数のトピックを1つの記事にまとめないようにします。
タイトル、見出し、小見出しを使用する
タイトル、見出し、小見出しによって、コンテンツに有用なコンテキストを提供できます。さらに、この情報を追加のフィールドに保存し、プリペンドに使用すると効果的です（セクション5.1を参照）。このコンテキストは、強化されたチャンク化機能（セクション5.4を参照）によって生成することもできますが、LLMにこのコンテキストを追加させるのではなく、ドキュメント内で明示的に含めるのが最善です。
ナレッジ監査を実施し、ガバナンスを適用する
不正確で古い情報にグラウンディングすると、同様の応答がAIによって生成されてしまいます。ナレッジベースの定期的な監査を実施し、問題があれば迅速に修正します。ナレッジコンテンツにはバージョン管理を使用し、バージョンを管理して検索インデックスのコンテンツを統制します。

2.3 非構造化コンテンツの自動キュレーション

従来のRAGのベストプラクティスでは、長いテーブルを分割したり、PDFをJSONに変換してから取り込んだりなど、複雑なドキュメントをフォーマットする多大な手作業が必要でした。 Data 360のインテリジェントコンテキストや高度な解析オプションの導入により、この手作業によるキュレーションを行う必要がなくなりました。 AIを活用して、コンテンツを自動的にキュレーション、解析、構造化し、最適な検索を実現できるようになっています。

Data 360のインテリジェントコンテキスト

インテリジェントコンテキストは、Data 360内のAIを活用したワークスペースです。完全な検索インデックスを構築する前に、非構造化データの処理方法を対話的にテストおよび調整できます。「ブラックボックス」的な取り込みプロセスの代わりに、チャンク化および抽出論理を最適化できる実践的な環境を実現できます。

主な機能

プロンプトベースのカスタマイズ： 自然言語の指示を使用して、「ドライブトレインテーブルをマークダウンとして抽出する」や「法的免責事項のフッターを無視する」など、抽出に関する特定の問題を修正できます。
カスタマイズ可能なビュー（レンズ）： 同じドキュメントに対して複数の「レンズ」を作成できます。たとえば、営業レンズは価格設定や価値提案を抽出し、サービスレンズは同じ製品仕様PDFからトラブルシューティング手順やメンテナンススケジュールを抽出することができます。
テストから本番環境への展開： 少数のサンプルドキュメント（5つのPDFなど）をワークスペースにアップロードし、生成されたチャンクとベクトルを確認した後、その設定を非構造化データモデルオブジェクト（UDMO）に公開して、膨大な数のレコードに拡張します。

インテリジェントコンテキストのワークフロー

アップロード： インテリジェントコンテキスト・ワークスペースで、サンプルファイル（PDF、音声など）をアップロードします。
設定： AIスマートデフォルトを使用して初期設定を生成するか、解析戦略を手動で選択します。
テストと反復： 検索インデックスが正しい情報を取得しているかを確認するために、AIエージェントチャットウィンドウで質問します。チャンクをクリックしてソーステキストを確認します。
公開： すべて確認できたら、設定を検索インデックスに公開し、ライブデータストリームにリンクします。

LLM解析と Docling解析の違い

インデックス戦略を設定する際は、インテリジェントコンテキスト内または標準の高度な検索インデックス設定のいずれかで、解析方法を選択する必要があります。この選択によって、特にテーブルやレイアウトのような複雑な要素に対して、ドキュメント構造をシステムが読み取る方法を決定します。

LLMベースの解析

LLMベースの解析は、マルチモーダル大規模言語モデル（例：GPT-4o）を使用して、ドキュメントを視覚的に「読み取り」ます。ここでは意味的な理解もとづいてコンテンツの解釈が行われます。

最適なドキュメント： 意味を理解することが構造を抽出する上で重要な、「扱いにくく」ノイズが多い、非常に不規則なドキュメントに最適です。
強み： 未知のフォーマットへの高い適応力を持ち、複雑で非標準的なテーブルの解釈にも優れています。
トレードオフ： ローカルモデルと比較して処理速度が遅く、通常APIのコストや遅延が大きくなります。

Docling解析の違い

Docling（IBM製）は、ドキュメントのレイアウト分析向けに最適化されたコンピュータビジョンとOCRモデルを使用しています。これは、ドキュメントの構造的完全性の復元に重点を置いています。

最適なドキュメント： デジタルで作成されたPDF、レポート、再現可能な安定した構造を持つマニュアルに最適です。
強み： 論理的な読み取りの順序の維持や、表構造をクリーンなマークダウンまたはJSONに再構築することに優れています。一般的に、LLM解析よりも高速かつ効率的です。
トレードオフ： 最先端のマルチモーダルLLMと比べて、著しく崩れたコンテンツや手書きのコンテンツへの対応が難しい場合があります。

比較表

機能	LLMベースの解析	Docling解析の違い
主なアプローチ	セマンティック分析とビジュアル推論	コンピュータビジョンとレイアウト分析
最適なデータソース	不規則で乱雑、またはスキャンされたドキュメント	構造化された、デジタル作成されたPDF
テーブル処理	コンテンツの意味を解釈	構造レイアウトを再構築
パフォーマンス	遅い（推論が多い）	高速/最適化

設定オプション

これらの自動キュレーション機能は、実装パスに応じてプラットフォームの複数の領域で利用できます。

インテリジェントコンテキスト・ワークスペース： Data Cloud > プロセスコンテンツ > インテリジェントコンテキストからアクセスできます。設定をUDMOに公開する前に構築およびテストできる推奨プレイグラウンドです。
高度な検索インデックス設定： 標準フローで検索インデックスを手動で作成する場合、「解析オプションの設定」メニューでDoclingまたはLLM解析を選択できます。
Agentforceデータライブラリ（ADL）： 現在ADLは、手動による設定なしで、10MB未満のすべてのアップロードされたドキュメントに対して自動的にインテリジェントコンテキスト論理を呼び出し、品質基準を確保しています。

2.4 多言語サポート

セクション5.5に詳細が記載されている多言語埋め込みモデルによって、検索インデックスは多くの言語のコンテンツに対応しています。数十種類の異なる言語に対応し、言語間で意味的な類似性を保持します。これは、ある言語のクエリに対して、別の言語で書かれたコンテンツから意味的に関連する結果を取得できるということを意味します。埋め込みモデルの学習データセットにその言語が含まれているかどうかによって、結果は異なる場合があります。詳細については、セクション5.5をご確認ください。

言語は事前フィルターとしても使用できます（セクション5.1を参照）。コンテンツを複数の言語で使用すべきでない場合や、クエリと同じ言語のコンテンツを使用して応答を生成する必要がある場合に役立ちます。

Agentforceでの言語サポートは、広範なトピックであることにご注意ください。以下は、機能ごとの言語サポートの内訳です。

非構造化データとRAG（埋め込みおよびインデックス化）：チャンク化およびベクトル化には数十の言語が対応しており、意味的類似度と語彙の類似度による検索の両方を可能にします。
- 詳細をセクション5.5で確認する。
プロンプトテンプレート入力（グラウンディング言語）：プロンプトテンプレートを介してRAG応答を生成するLLMが、グラウンディングの対応言語を決定します。プロンプトビルダーで利用可能なデフォルトのモデルは、多言語埋め込みモデルと同じ言語に対応しています。
プロンプトテンプレートの出力：プロンプトランタイムが、応答生成でサポートされる出力言語を決定します。
- プロンプトテンプレートの応答の対応言語を確認する。
Trust Layer: Language support varies for trust components, such as toxicity detection and data masking.
- See Trust Layer Region and Language Support .
Agentforce: The Agentforce platform has its own set of supported languages, including for its conversational experience and reasoning engine.
- Agentforce （デフォルト）検討事項を確認する。

2.5 Intelligent Document Processing（IDP）とデータ前処理

Intelligent Document Processing（IDP）とデータ前処理は、Agentforceで効果的にRAGが機能するための基礎となります。 IDPは、PDFや画像などの非構造化ドキュメントから構造化データを自動的に抽出し、このデータをデータレイクオブジェクト（DLO）でアクセスできるようにします。 RAGシステムは、適切に準備された関連性の高いデータによって最大限に機能するため、これは重要なプロセスとなります。データ前処理は、広い意味で、Agentforceエージェントによって使用される前にコンテンツを調整し、クリーンアップするために必要なすべての作業を含みます。これにより、最適なパフォーマンスを確保できます。

IDPの主なユースケースには、自動請求書処理、カスタマーサービス文書の処理、契約書分析、自動オンボーディングがあります。抽出された値をData 360に入力し、Agentforceがそれらを活用して実践的なインサイトを提供します。

RAGのシナリオでは、IDPは大量のドキュメント処理において特に有用です。これにより、大量の非構造化ファイルからのデータのストリーミングおよび抽出が可能になります。これらのインサイトはAgentforceに保存されます。このプロセスにより、RAG、セグメンテーション、分析などのダウンストリームアプリケーションを有効化できます。

効果的な前処理には、特定の見出しをインデックス化から除外したり、Agentforceへの引き渡し前にコンテンツをクリーンアップしたりすることも含まれます。これにより、高品質な情報のみが使用されることを保証できます。

チャプター 2 3. RAGを活用したAIエージェントの設計

3.1 データライブラリ内部で起こっていること。（再）設定可能な要素について

Agentforceデータライブラリ（ADL）を設定することで、RAGを活用したAIエージェントを最短でセットアップすることができます。ユーザーは、ADLにファイルをアップロードするか、設定またはAgentforce Builderインターフェースを通じてナレッジ記事を選択できます。ただし、ADLに他の形式のコンテンツを追加することはできません。たとえば、ナレッジ記事以外のSalesforceオブジェクトからコンテンツを取得する必要がある場合は、RAGパイプラインを手動で設定する必要があります。 ADLのオープンWeb検索は2025年5月時点で利用可能ですが、この機能はデータの取り込みや検索インデックスの構築を行わないため、本ガイドでは取り扱っていません。

ファイルは手動でADLにアップロードされ、Salesforceが管理するファイルストレージに保存されます。ファイルのコンテンツはRAGに使用されます。そのストレージからファイルをダウンロードすることはできません。また、ユーザーがそのファイルに戻るためのクリック可能なリンクもありません。ユーザーによって削除されるまで、ファイルは保存されたままになります。

ADLを設定した後、RAGパイプラインの構成要素はすべて、以下に記載されているデフォルト設定を使用して自動的に作成されます。

ファイルベースの検索インデックス

Data Cloudオブジェクト
- ファイル用の非構造化データモデルオブジェクトの名前はFileUDMO__dlm です。このオブジェクトには実際のファイルは含まれておらず、メタデータ（ファイルタイプやファイルの場所など）のみが含まれています。
検索インデックス組織内には、すべてのADL用にFileUDMO_SIという名前の検索インデックスが1つ存在します。異なるADLのファイルは同じ検索インデックス内に整理されます。対応するインデックスDMOオブジェクト（ベクトルを含む）であるFileUDMO_SI_index__dlmは、GroundingSourceId__cというフィールドを介してADLへの参照が含まれています。このグラウンディングソースIDは、ベクトルが属するADLを表しています。 AiGroundingFileRefCustom__dlmという名前の特別なDMOには、アップロードされたファイルとそのADLとのマッピングが含まれています。 FileUDMO__dlmの検索インデックスを手動で作成し、異なる設定を使用することが可能です。以下の設定は、ADLのデフォルト検索インデックスに使用されます。
- - ハイブリッド検索
  - チャンク化の強化なし（#ロードマップ チャンク化の強化へのオプトインは、今後ADLで利用できるようになります。）
  - チャンクごとに512トークン
  - E5 Large Multilingual埋め込みモデル
リトリーバーデフォルトFileUDMO_SI：あらゆる検索インデックスと同様に、すべてのインデックス化されたコンテンツから取得する単一のデフォルトリトリーバーが存在します。これは、以下のデフォルト設定で作成されます。
- - 10件の結果を表示
  - 各結果について、次のフィールドを返却：主要な修飾子レコードID、データソース、チャンク、レコードID、データソースオブジェクト、チャンクシーケンス番号、内部組織、およびソースレコードID。（これらのフィールドの詳細内容については、help.salesforce.com ページをご覧ください。）
  - 高度な取得モード（セクション6.3参照）はオフになっています。
- 各ADLごとに、個別のリトリーバーが存在します。このリトリーバーは、グラウンディングソースIDフィールドを使用して事前にフィルタリングされ、対応するADLからのみコンテンツを取得します。次のフィールドを返します：チャンク、ソースレコードID、データソース、データソースオブジェクト。その他のすべての設定は、デフォルトリトリーバーの設定と一致します。
- 手動で作成されたリトリーバー： FileUDMO_SI検索インデックス用にリトリーバーを手動で作成することが可能です。これらは、カスタムプロンプトテンプレートのグラウンディングに使用できます。

ナレッジ記事ベースの検索インデックス

DLO/DMO
- 検索インデックスは、KnowledgeArticleVersion__dlm という名前のDMOにもとづいています。このDMOがまだ存在しない場合は、そのデータストリームおよびマッピングとともに自動的に作成されます。
検索インデックス
- ナレッジ記事用の検索インデックスの名前には、KA_がプレフィックスとして付き、その後にユーザーが指定した名前が続きます。 KA_Agentforce_Default_Libraryや KA_Published_Articlesがこの一例です。 1つの検索インデックスには、同じ識別フィールドを使用して作成された場合に限り、異なるADLのベクトルを含めることができます。識別フィールドはユーザーによって選択され、その後すべてのチャンクにプリペンドされます。つまり、実際にチャンクテキストに追加されます。フィールドのプリペンドに関する詳細は、セクション5.3をご確認ください。コンテンツフィールドは、（識別フィールドがプリペンドされた後で）実際にチャンク化およびベクトル化されるフィールドです。次の例では、ADL 1とADL 2は同じ識別フィールドを持っているため、両方とも同じ検索インデックスに追加されます。 ADL 3には、異なる検索インデックスが作成されます。
- ADL 1
  - 識別フィールド：タイトル、要約
  - コンテンツフィールド：詳細、回答
- ADL 2
  - 識別フィールド：タイトル、要約
  - コンテンツフィールド：詳細、コンテンツ、質問
- ADL 3
  - 識別フィールド：タイトル、カテゴリ
  - コンテンツフィールド：詳細、回答
リトリーバー
- ADLナレッジ設定は、リトリーバー用のクエリテンプレートに変換されます。ナレッジを備えたADLのリトリーバーには事前フィルターがありません。取得の設定はクエリテンプレートで管理されます。これにより、ADLで定義されたフィルターに従って選択されたフィールドが確実に返され、コンテンツが正しいナレッジ記事フィールドから取得されるようになります。リトリーバーのクエリテンプレートはエージェントスタジオで確認できます。次の例は、「FAQ_Internal_Comments_c__c」および「AssignmentNote__c」フィールドから発生したチャンクがどのように取得されるかを示しています。


 
SELECT 
    v.Hybrid_score__c        AS Score, 
    c.Chunk__c               AS Chunk, 
    c.SourceRecordId__c      AS SourceRecordId, 
    c.DataSource__c          AS DataSource, 
    c.DataSourceObject__c    AS DataSourceObject
FROM hybrid_search(
        TABLE(KA_Agentforce_Default_Library_index__dlm), 
        '{!$_SEARCH_STRING}', 
        'Language__c=''{!$_LANGUAGE}'' 
         AND KnowledgePublicationStatus__c=''Online'' 
         AND DataSource__c IN (''FAQ_Internal_Comments_c__c'', ''AssignmentNote__c'')', 
        30
    ) v
INNER JOIN KA_Agentforce_Default_Library_chunk__dlm c 
    ON c.RecordId__c = v.RecordId__c
INNER JOIN ssot__KnowledgeArticleVersion__dlm kav 
    ON c.SourceRecordId__c = kav.ssot__Id__c
ORDER BY Score DESC
LIMIT 10

リトリーバーには、Data 360オブジェクトへの2つのパス（ファイルとナレッジ記事）が存在します。 RAGソリューションスタックの残りのプロセスでは、これらのパスがプロンプトテンプレートとエージェントアクションで収束します。

アンサンブルリトリーバー（#ロードマップ 現時点では、ADLは単一ソースのみ対応） ADLにナレッジ記事とファイルの両方がある場合、ADLにはそれぞれのパスに対応する2つのリトリーバーが存在します。コンテキストでプロンプトを拡張する場合、これらを組み合わせる必要があります。 1つ目の選択肢は、2つのリトリーバーでプロンプトをグラウンディングすることですが、出力には常にナレッジ記事とファイルの結果の両方が追加されるため、最適な選択肢とは言えません。ただし、一部のクエリはナレッジ記事のコンテキスト、あるいはファイルのコンテキストだけで最適に回答できるため、もう一方は不要になる場合もあります。不要なデータでプロンプトを紛らわせると、応答の品質が低下し、不必要なEinsteinリクエストが消費され、遅延が増加します。無駄な入力を過剰にプロンプトに追加してしまうと、LLMのコンテキストウィンドウを超えるリスクがあり、リトリーバーが返す結果セットのサイズを減らす必要が生じます。これらの問題に対処するため、ADLが作成されると、デフォルトでアンサンブルリトリーバーが作成されます。アンサンブルリトリーバーは、2つのリトリーバーを単一のリトリーバーにまとめ、2つの結果セットを1つの結果セットにまとめてから、クエリとの類似性にもとづいて、これらの結果を動的に再ランク付けします。これには、以下のようなメリットがあります。
- - プロンプトテンプレートのグラウンディングに、1つのリトリーバーのみが使用される。
  - もっとも関連性の高いクエリ結果は、データソースに関係なく、このランクの上位に示される。
  - 無関係な結果がプロンプトに追加されることがない。
  - 消費するEinsteinリクエストが少ないため、遅延とコストが削減される。
プロンプトテンプレート
- ADLの作成時に、ナレッジで質問に回答するという名前のプロンプトテンプレートが自動的にインスタンス化されます。このプロンプトテンプレートには、あらかじめ作成されたRAGの指示が含まれており、Agentforce推論エンジンから取得した自由テキストの質問を入力として受け取ります。 {!$EinsteinSearch:sfdc_ai__DynamicRetriever.results}という動的リトリーバーが、実行時にコンテキストでプロンプトを拡張します。 Agentforce推論エンジンは、そのAIエージェントに対して選択されたADLにもとづいて、実行時に正しいリトリーバーを選択します。異なるAIエージェントはこのプロンプトテンプレートを使用でき、各AIエージェントは独自の個別ADLを備えています（1つのAIエージェントにつき1つのADLのみ）。動的リトリーバーは、RAGソリューションに実行時の柔軟性と多様性を追加します。 Salesforceでは、手動で作成したリトリーバーで上書きするのではなく、このプロンプトテンプレートで提供されているデフォルトのリトリーバーを使用することを推奨します。
エージェントアクション
- ADLの作成時に、ナレッジで質問に回答するという名前のプロンプトテンプレートのエージェントアクションが自動的にインスタンス化されます。これは、同じ名前のプロンプトテンプレートに関連付けられています。

3.2 RAG向けの最適なAIエージェントの設計： ADLおよび手動設定、複数のデータソースがある場合

AIエージェントがSalesforce管理ファイルストア内のファイルやSalesforceナレッジ記事のコンテンツにグラウンディングして質問に回答する必要がある場合、ADLが推奨されます。その他のデータソースについては、手動での設定が必要です。

ADLのメリット

効率的なクイックスタートアプローチ。すべての必要なコンポーネントをデフォルト設定で自動的にインスタンス化します。
集約ストレージ。ファイルのための個別のストレージはありません。
#ロードマップ 動的な再ランク付け。アンサンブルリトリーバーは、さまざまなデータソース（ナレッジ記事やファイル）から得た結果を動的に再ランク付けして、RAGの品質を向上させ、コストと遅延を削減します。

ADLの制限

ファイルおよびナレッジ記事のみをサポートします。その他のソースコンテンツには手動設定を使用してください。
カスタマイズのオプションが限定的です。 RAGソリューションコンポーネント全体でデフォルト設定を維持することを推奨します。たとえば、カスタムリトリーバーを作成したり、標準のプロンプトテンプレート内の動的アンサンブルレトリーバーを手動で作成したリトリーバーで上書きしたりして、チェーンを分断することは推奨しません。

手動設定

次のシナリオにおいては、RAGの構成要素を手動で設定する必要があります。

すでに外部のBLOBストアや他のドキュメント共有に保存されているファイルや、ナレッジ記事以外のオブジェクトの長文テキストフィールドなど、さまざまなデータソースが必要となります。
検索インデックス、リトリーバー、プロンプトテンプレート、エージェントアクションの設定可能性に対して、以下のような追加の制御が必要となります。
- コンテンツを取り込むデータストリームを制御することで、検索インデックスを構築する前に、どのナレッジ記事を含めるかをより細かく制御
- 異なるチャンク化戦略
- 異なる検索タイプ（ハイブリッド検索ではなくベクトル検索）
- 異なる埋め込みモデル
- 異なるリトリーバーの事前フィルター

1つの検索インデックスは、1つのデータソースにのみマッピングできます。検索インデックスは単一のDMO/UDMOに対してのみ構築できるため、複数のデータソースがある場合、異なるデータソースは単一のDMO/UDMOにマッピングする必要があります。「ファイル」は、ファイルの数やファイル拡張子の種類に関係なく、1つのデータソースとしてカウントされることにご注意ください。

以下は、RAGグラウンディング用のデータソースのコレクションの例です。

ファイル
ナレッジ記事
ケース（標準Salesforceオブジェクト）
欠陥（カスタムSalesforceオブジェクト、不良品に関する顧客対応の追加情報を保持）

この例では、4つの個別の検索インデックスが必要であり、それぞれに少なくとも1つのリトリーバーが必要です。

RAGベースのソリューションアーキテクチャー設計の選択肢

特定のソリューション内でRAG関連コンポーネントを整理および分配する最適な方法は何でしょうか？4つのリトリーバーすべてを含む1つのプロンプトテンプレート（および対応するエージェントアクション）を作成すべきでしょうか？リトリーバーごとに個別のプロンプトテンプレートを作成すべきでしょうか？あるいは、2つのプロンプトテンプレートを構築し、それぞれに2つのリトリーバーを備えるべきでしょうか？それとも、リトリーバーを3つ備えたプロンプトテンプレートと、リトリーバーを1つ備えたプロンプトテンプレートの2つを作成すべきでしょうか？このような設計上の選択を行う理由とトレードオフについて説明していきます。

アプローチ 1：アンサンブルリトリーバーを使用して、すべてのリトリーバーで1つのプロンプトテンプレートと対応するエージェントアクションを作成

このアプローチでは、以下のコンポーネントを使用します。

1つのプロンプトテンプレートと1つのエージェントアクション
それぞれ異なる検索インデックスと独自の設定（結果の件数や返却フィールドなど）がある複数のリトリーバー

以前は、Agentforce推論エンジンのエージェントアクションが呼び出されると、プロンプト解決時にすべてのリトリーバーが必ず実行され、それぞれの結果ですべてのプロンプトが拡張されていました。これによってプロンプトの肥大化が生じ、LLMのコンテキストウィンドウを超えて失敗の原因になるリスクがありました。

現在、アンサンブルリトリーバーの利用が可能になったことで、このアプローチは複数のデータソースを扱うために大幅に最適化されています。アンサンブルリトリーバーは、さまざまなデータソースからの結果を統合し、再ランク付けして、もっとも関連性の高い情報が上位に表示されるようにします。これは、複数の個別リトリーバーを呼び出す代わりに、1つのアンサンブルリトリーバーを使用してプロンプトをグラウンディングできることを意味します。

このアプローチは、以下の場合に最適です。

あらゆるデータソースが、すべてまたはほとんどの質問に関連している可能性が高いと考えられる場合。
（Agentforceの指示および分類の説明を用いても、）どの種類の質問に対して、どのリトリーバーを使用すべきかを十分に明確に定義することができない場合。

このアプローチにおけるアンサンブルリトリーバーの使用には、以下のようなメリットがあります。

プロンプトテンプレートのグラウンディングに、1つのリトリーバーのみが使用される。
もっとも関連性の高いクエリ結果は、元のデータソースに関係なく上位に表示される。
無関係な結果はプロンプトに追加されないため、LLMのコンテキストウィンドウを超えてしまうのを防止できる。
消費するEinsteinリクエストが減少し、遅延とコストが削減される。

以前の「アプローチ1」を使用していた既存のソリューションでは、プロンプトテンプレート内で複数のリトリーバーを呼び出していた部分を、ただアンサンブルリトリーバーの呼び出しに置き換えるだけで済みます。残りのエージェントソリューション設計は、これ以上変更することなく維持できます。現在、アンサンブルリトリーバーはADLおよびその他の標準機能で利用可能であり、今後、任意のリトリーバーを手動でバンドルできるツールの公開も計画されています。

アプローチ2：リトリーバーごとに個別のプロンプトテンプレートを作成

このアプローチでは、以下のコンポーネントを使用します。

データソースごとに、1つのプロンプトテンプレートと1つのエージェントアクション
データソースごとに異なる検索インデックスおよび設定（結果の件数や返却フィールド）を関連付けたプロンプトテンプレートごとに、1つのリトリーバー

このアプローチでは、Agentforce推論エンジンが複数の対応するエージェントアクションを呼び出す必要があります。

このアプローチは、以下の場合に最適です。

十分明確に（Agentforceの指示および分類の説明を含めて）、どのデータソース（したがって、リトリーバー、プロンプトテンプレート、アクション）がどの種類の質問に使用されるべきかを指定することが可能な場合。
このような単一アクションで、ユーザーの質問に対する完全な応答を生成することが可能な場合。対応する単一データソースから取得された結果は、LLMがこの回答を作成するのに十分であると見込んでいる場合。

たとえば、「欠陥」という名前のデータソースに、商品の欠陥に関するナレッジが含まれているとします。このリソースに対応する指示または分類の説明は、次のようなものになる可能性があります。「お客様が不良品について質問した場合は、必ず『既知の欠陥で回答』アクションを使用してください。」これは、Agentforce推論エンジンが実行時にこのアクションを呼び出すタイミングを判断するためのガイドとなります。他のすべてのアクションについても、同様に明確かつ正確な説明と手順を必ず提供してください。

注意：前述の最初のアプローチの代替として、個別のアクションを個別のプロンプトテンプレートと一緒に使用しないでください。 Agentforce推論エンジンに、次のような複数のアクションを連続して実行するような指示は使用しないでください。「常に4つのアクションを使用してユーザーの質問に回答してください。まず、ファイル用にアクション1を呼び出します。次に、ナレッジ記事用にアクション2を呼び出します」など。このアプローチを避けるべき理由は以下のとおりです。

明確にすべてのアクションを呼び出すよう指示された場合でも、Agentforce推論エンジンは、すべてのアクションが呼び出される前にユーザーのインテントが満たされた（および回答が提供された）と判断することがあります。その結果、実行時にRAGソリューションは、グラウンディングに有用な情報を本来提供するはずのアクションを、想定外かつ予測不能な形でスキップする可能性があります。
コンテンツの解釈方法と応答の生成方法を具体的に定義するLLMの指示は、プロンプトテンプレートのレベルで提供するのが最適です。つまり、AIエージェントレベルでの指示や分類の説明は、主にAgentforce推論エンジンに正しいアクションを実行させ、その出力をどのように活用するかを示すために使用すべきです。これらのアクションがどのように実行されるべきかについて、過度に説明すべきではありません。 RAGでは、エージェント型レベル（こちらはより非決定的）よりも、プロンプトレベルでの検索および応答生成の挙動をより詳細に制御できます。

アプローチ1と2の組み合わせ

ユースケースに該当する場合、同じソリューション内で両方のアプローチを使用することは可能です。たとえば、あるソリューションでは「欠陥」専用の個別アクション（アプローチ2）を用意し、その他の3つのグラウンディングソース（「ファイル」、「ナレッジ記事」、「ケース」）を1つのプロンプトテンプレート（アプローチ1）で組み合わせることができます。

RAGのトピックおよびアクションの説明

RAGを活用したAIエージェント内のトピックおよびアクションには、説明、手順、範囲の明確化が必要です。すべての一般的なベストプラクティスは、トピックはこちらのヘルプページ、アクションはこちらのヘルプページに記載されているとおりに適用されます。 RAGのトピックおよびアクションの指示と範囲の説明は、検索インデックスが回答できる範囲内の質問に対してのみ選択され、呼び出されるように作成します。

RAGアクションが呼び出されると、プロンプトテンプレートのリトリーバーは必ず検索インデックスから結果を取得し、LLMが応答を生成します。検索インデックスに関連するコンテンツが見つからない場合、プロンプトテンプレート内の適切な指示によって、LLMがハルシネーションを避けるよう促すことができます（セクション7を参照）。ただし、最初から範囲外の質問に対してRAGアクションが呼び出されれないようにすることが望ましいです。これにより、ハルシネーションのリスクがさらに低減され、AIエージェントのコストと遅延も削減されます。

チャプター 3 4. ハイブリッド検索

4.1 ハイブリッド検索とは？

RAGソリューションでは、検索インデックスビルダーを使用して検索インデックスを設定すると、ハイブリッド検索に対応できます。ハイブリッド検索は、ベクトル検索とキーワード検索の強みを1つの検索呼び出しに統合します。単一のデータソースから2つの異なる検索操作を行い、その結果を統合して再ランク付けするものと考えてください。これはアンサンブルリトリーバー（セクション3）に類似していますが、ハイブリッド検索は単一のデータソースから結果を導き出すのに対し、アンサンブルリトリーバーは複数のデータソースから結果を導き出す点において異なります。

ハイブリッド検索は、ベクトル検索とキーワード検索の結果を組み合わせてランク付けし、もっともランクが高いチャンクが、意味的および語彙的に類似しているものとなります。

ベクトル検索は、それ自体で意味的な類似性に優れていますが、キーワードが重要な場合にそれを認識できないことがあります。たとえば、ベクトル検索は「自分のアカウントにログインする方法は？」と「どのようにサインオンすればいいですか？」が類似したクエリであることを理解します。しかし、「レーザープリンターTX 400」と「レーザープリンターTX 440」を探している場合、類似していることを理解できない場合があります。キーワード検索とは異なり、ベクトル検索は数値をうまく一致させることができず、また特定のドメイン用語（レーザープリンターなど）を適切に一致することも困難です。

しかし、ベクトル検索とキーワード検索を組み合わせることで、互いに補完し合い、「レーザープリンターTX 400で紙詰まりが発生した場合はどうすればよいですか？」のような質問に対して最適な回答を返すことができます。

出典： help.salesforce.comのハイブリッド検索のページ

4.2 ハイブリッド検索を使用すべき場合とすべきでない場合

ハイブリッド検索を使用することで、意味的な類似性とキーワードの類似性の両方を利用してコンテキストを取得できます。たとえば、商品名、ブランド、特定の用語、専門用語などのキーワードが検索品質の鍵となる場合、ハイブリッド検索が推奨されます。ユーザーの質問および取得可能なすべてのコンテンツが、特定の用語やセマンティック、キーワードを含まない自然言語である場合、ハイブリッド検索の付加価値は小さく、ベクトル検索のみで対応することが可能です。

ただし、カテゴリのキーワード検索エンジンとしてハイブリッド検索を使用しないでください。

RAGソリューションの場合、ベクトル検索は単独で使用できますが、キーワード検索はできません。キーワード検索はベクトル検索結果を強化できますが、辞書式順序検索の単独利用には使用できません。検索インデックスの場合、カテゴリのみを含むフィールド（Salesforceのピックリストなど）をインデックスフィールドとして選択することは推奨されません。

カテゴリは、非常に短いチャンク（1つの単語または数単語）になってしまいます。これらのマイクロチャンクもユーザーのクエリに対して意味的な類似性で一致されますが、単語単位のチャンクによるセマンティック検索は、これらのチャンクが意味的なコンテキストを欠いているため、適切には機能しません。その結果、ハイブリッド検索のベクトル検索部分が不安定になり、最終的なランキングが不正確になってしまいます。代わりに、カテゴリはセクション5.1で説明しているように、プリペンドするフィールドとして使用する方が適しています。

4.3 ハイブリッド検索によるメリットと影響

ハイブリッド検索は、実行時の遅延やData 360クレジット消費の増加というトレードオフと引き換えに、検索結果の精度を向上させます。

ハイブリッド検索機能は、ベクトルとキーワードインデックスの両方でクエリを処理し、結果を再ランク付けするため、Data 360サービスクレジットを約2倍消費します。

4.4. ハイブリッド検索を最適化する方法

再ランク付け中に、ハイブリッド検索はベクトルスコアとキーワードスコアを組み合わせてハイブリッドスコアを生成します。そのハイブリッドスコアにもとづいて最終的なランキングが決定されます。

検索インデックスビルダーには、人気度と最新度という2つの追加のランク付け要素が存在し、最終的なランキングに影響を与える可能性があります。検索インデックスビルダーでは、ユーザーはこれらのドキュメント特性を定義する（関連する）DMO上の2つのフィールドを選択できます。最終ランキングでは、これらの特性を取り入れて、人気が高く、最新のコンテンツが上位にランク付けされます。

詳細および例については、help.salesforce.com の記事をご確認ください。

チャプター 4 5. 検索インデックスの最適化：フィールドの選択、チャンク化、ベクトル化

検索インデックスを設定する際、Data 360はデータをベクトル化する前にチャンク化を実行します。チャンク化は情報をより小さな要素に細分化します。すべてのチャンク（およびベクトル）は、有意義なファクトイドまたはファクトイドの集合を表します。 1つのベクトルがドキュメント内のすべてのコンテンツの意味的な表現にはなり得ないため、1つのベクトルで冗長なドキュメント全体を表現することは現実的ではありません。

5.1 RAGソリューションにおける重要なフィールド

RAGソリューションにおいてフィールドが担う、以下の4つのロールを検討しましょう。

インデックスフィールド（DMOインデックスのみ）
インデックスフィールドのテキストコンテンツはチャンク化およびベクトル化され、セマンティック検索の際に使用されます。注： UDMOインデックスでは、インデックスフィールドの選択はありません。選択したファイルタイプのすべての未加工のコンテンツがインデックス化されます。
フィールドのプリペンド（DMOインデックスのみ）
これらのフィールドの値は、すべてのチャンクにプリペンドされます（「タイトル」や「商品名」など）。プリペンドによって、これらのフィールド値がチャンクの一部となり、プロンプト拡張やData 360クエリエディタで表示されるようになります。プリペンドは、主要な識別フィールドがすべてのチャンクに含まれるようにすることで、チャンクを強化し、検索精度を向上させる強力な仕組みです。
フィルターフィールド（UDMO/DMOインデックス）
フィルターフィールドは、ベクトルを含むインデックスDMOのスキーマの一部としてインデックスに追加されますが、ベクトル化はされません。これらは検索中の意味的な類似性の評価には使用されません。代わりに、セマンティック検索を絞り込むために使用されます。フィルターはリトリーバーで定義され、動的に設定することも可能です（セクション6.2を参照）。
返却フィールド（UDMO/DMOインデックス）
返却フィールドは、インデックスフィールドまたは非インデックスフィールドのいずれかとなります。これらのフィールドは、検索インデックスを作成する際に選択する必要はありません。返却フィールドは、リトリーバーを構築する際に指定されます。ベクトルを保存するDMO、または関連するDMOから取得できます。

以下の例は、これら4つのフィールドがどのような役割を担っているのかを示しています。このユースケースでは、ケースオブジェクトがユーザーの質問に回答するために使用されます。プロンプトは、説明がユーザーの質問と一致する、完了したケースの解決結果の内容で拡張されます。これを達成するには以下を必要とします。

ケースの説明は、プリペンドされたタイトルおよび要約フィールドとともにインデックス化されていること。
ケースステータスは、リトリーバー上の固定された事前フィルターとして機能すること。
ケース製品ファミリーは、リトリーバー上で動的な事前フィルターとして機能すること。
ケースの解決結果およびまとめは、リトリーバーの出力フィールドとして利用可能なこと。この例では、解決結果はプロンプトを拡張するフィールドです。

ユースケースの図：過去のケースの解決結果を使用した顧客への返信。

5.2. 検索インデックス用のフィールド選択

検索インデックスを構築する際は、ステップ2のチャンク化でインデックスフィールドを選択します。「フィールドを管理」ボタンをクリックします。検索インデックスの作成時に、インデックスフィールドはチャンク化およびベクトル化されてから、検索プロセス中にクエリとの意味的な類似性を評価するために使用されます。

インデックスフィールドとして選択できるのはテキストフィールドのみです。カテゴリやカテゴリデータではなく、長い自由テキストコンテンツのあるテキストフィールドのみを選択してください。カテゴリフィールドは選択しないでください。複数のフィールドをインデックス化のために選択できます。たとえば、「説明」、「要約」、「コンテンツ」、「解決結果」が選択されている場合、すべての対応するベクトルは同じ検索インデックスにまとめて保存されます。ベクトルのDMO上のDataSource__c というフィールドにもとづいて、ベクトルを分離することが可能です。 DataSource__c には元のフィールド名が含まれています。このフィールドはインデックスDMOにあるため、リトリーバーの事前フィルターで使用することが可能です。たとえば、リトリーバーは特定のフィールド（「解決結果」ではなく「説明」など）に対してのみクエリの意味的な類似性を評価できます。

注意： カテゴリ列をインデックスフィールドとして選択しないでください。カテゴリデータは、Salesforceのピックリストにマッピングされる1語または2語の記述子です。優れた結果を得るためには、セマンティック検索には長いテキスト範囲と多くのコンテキストが必要です。ハイブリッド検索は、キーワード検索によってセマンティック検索を補完することを思い出してください。検索インデックスはキーワード検索エンジンではありません。カテゴリフィールドのみをインデックス化するのではなく、それらを、長い自由テキストコンテンツを含むテキスト列にプリペンドする必要があります。

注意： 類似したフィールドを選択しすぎないようにしてください。選択項目は少ない方が効果的です。すべてのテキストフィールドを選択しないように注意し、「要約」、「タイトル」、「説明」などの重複する可能性のあるフィールドを選択しないようにします。こうすることで、DataSource__cに事前フィルタリングを使用せずに検索インデックスを利用した場合、再呼び出し率が低下する可能性があります。これらのフィールドは、すべて同じ、または非常に類似した情報を含んでいる可能性が高いため、特定のクエリに対して、同じドキュメントから少なくとも3つのチャンクがランクの上位に表示されることがあります（フィールドごとに1つずつ）。これらは同じ情報をLLMにもたらします。たとえば、リトリーバーが9件の結果を取得するように設定されている場合でも、結果リストには3つのドキュメントのみが表示されます。これによりばらつきが減少する一方、ドキュメントが見逃される場合があります。

2つ以上のフィールドが同じ内容を異なる形式で表している場合、前述の例の「説明」のように、もっとも圧縮されていない形式のフィールドを選択することが推奨されます。このフィールド（セクション5.3を参照）には、前の例の「タイトル」のような、短くて簡潔なバージョンをプリペンドすることを検討してください。

5.3 チャンク化戦略を最適化する方法

検索エンジンビルダーでは、インデックス化するフィールドを選択する際（DMOケース）や、インデックスに含めるファイルタイプを選択する際（UDMOケース）に、ユーザーはチャンク化戦略を構成できます。詳細はhelp.salesforce.comのこのトピックをご参照ください。

フィールドのプリペンド

フィールドのプリペンドを使用して、チャンクにコンテキストを追加し、識別しやすくします。たとえば、トラブルシューティング手順のシーケンスを含むチャンクがあるとします。そのチャンクの前に「デバイス123が動作xyzを示す場合の対処方法」というテキストを付け加えることで、そのコンテンツがユーザーの質問に関連していることを識別しやすくなります。

注：フィールドのプリペンドは、DMOベースのインデックスでは利用可能ですが、UDMOベースのインデックスでは利用できません。

RAG実装をデザインする際には、フィールドのプリペンドが環境内のメタデータからどのようなメリットを得られるかを慎重に検討してください。

検索インデックスビルダーのチャンク化戦略で、フィールドのプリペンドを設定します。インデックス化するフィールドを選択した後、チャンク化設定のダイアログを開き、「フィールドをプリペンドする」のトグルをオンにします。

サイズ

チャンク化を最適化するもう一つの方法として、検索インデックス設定でソリューションに合わせてチャンクサイズを調整することがあります。

検索インデックスの作成中、プラットフォームは、ヘルプで説明されている意味ベースの文章抽出マーカーを使用して、可能な限りコンテンツを分割し始めます。その後、プラットフォームは指定されたチャンクサイズに達するまで、細かく分割されたチャンクを再びまとめます。現在設定可能な最大のチャンクサイズは512トークンであり、これはラテン系言語で約400～500語に相当します。

最適なチャンクサイズはソリューションごとに異なります。これは、特定のソリューションの目標にもっとも適した最適化戦略に一部依存します。

検索用に最適化

検索向けにチャンクサイズを最適化する際は、コンテンツの情報密度と組織構造を考慮します。 1つのチャンクが1つのベクトルになることを忘れないようにしてください。このチャンク全体のコンテンツは、この1つのベクトルで表されます。チャンクの意味を十分に理解するには、いくつの単語が必要でしょうか？400～500語でしょうか？少ない語数でもフィールドのプリペンドやチャンク強化によって補強された場合に、自己完結型で識別可能なファクトイド情報を十分に表現できるでしょうか？

拡張のために最適化

拡張の観点からチャンク化を検討します。 LLMが十分に実践的な応答を生成するためには何が必要でしょうか？小さな個々のファクトイドだけで十分でしょうか、それとも、さらなるコンテキストが必要でしょうか？

UDMOベースの検索インデックスの場合、コンテンツの拡張は通常、チャンクサイズに依存します。このケースでは、追加のコンテキストを含めるためにチャンクを大きくする必要があります。
DMOベースのインデックスの場合、追加フィールドを拡張に利用できるため、オプションが増えます。プロンプトを拡張する際、単なるチャンクだけでなく、元のドキュメント（ナレッジ記事など）全体を使用することも可能です。これによりプロンプトの解像度が向上するため、選択した結果の件数とLLMのコンテキストウィンドウとの関係性を考慮しましょう。また、このようなプロンプトは応答生成のコストを増加させます（プロンプトサイズと応答サイズの増加により、より多くのEinsteinリクエストが消費されます）。

5.4 インデックス化の強化について＆使用すべきタイミング #ロードマップ

インデックス化の強化（近日公開）は、検索のリコールと精度を向上させるために、インデックス化の際に追加の（または強化された）チャンクが生成されるプロセスを指します。

インデックス化の強化が有効になっている場合、元のチャンクに対して、「PLAIN」「QUESTION」「METADATA」の3種類のチャンクが生成されます。

「PLAIN」「QUESTION」「METADATA」チャンク

チャンクの種類	説明
PLAIN	元のチャンクテキストを含みます。元のドキュメントからの未加工のコンテンツチャンクです。
QUESTION	チャンクが回答できる質問が含まれています。 LLM生成の質問のセットを含みます。関連する元のチャンクは、これらの質問への回答を提供します。すべての生成された質問は、ベクトル化の前に1つのチャンクにまとめられます。これは、会話からのユーザーの意図（質問として表現）と、元のチャンクに保存されたコンテキスト（回答として表現）との間で発生し得る意味的な不一致を最小限に抑えます。質問チャンクは、特にQ&A関連のAIエージェントシナリオにおいて、検索のリコールと精度を向上させます。質問チャンクに属するベクトルは取得されますが、プロンプト拡張は対応する元のチャンクを使用して自動的に行われます。したがって、質問自体がプロンプトに拡張されることは決してありません。
METADATA	元のチャンクにもとづいてLLMが生成したメタデータのセットを含みます。以下は、インデックス化中に生成されるメタデータです。 - キーワード（最大10件） - エンティティ（チャンクのコンテンツに出現する主要なエンティティ） - トピック（最大5つの主要なトピック） - センチメント（ポジティブ/ネガティブ/ニュートラルをチャンクで指定済み） - タイトル（簡潔で情報量の多いタイトル） - 概要（通常100～250語の概要）

インデックス化の強化は、特にフィールドのプリペンドができないケース（UDMOパス）や、Q&Aエージェントアクションにおいて、検索の精度を大幅に向上させます。チャンクの強化は、LLM生成コンテンツが適切なチャンクの特定を向上させるため、集中的なコンテンツキュレーションの代替手段を提供します。トレードオフとして、チャンクの強化により、取得処理に含まれるチャンク数が増えるため、コストと遅延が増加します。

5.5 使用すべき埋め込みモデル

プラットフォームは3つの埋め込みモデルをサポートしています。

E5-Large V2（オープンソース）

コンテンツが英語以外の言語である場合は、この埋め込みモデルを使用してください。このモデルは、言語間での意味的な類似性をも保持します。たとえば、フランス語でのクエリがドイツ語で書かれた関連記事を取得できます。この埋め込みモデルは100の言語に対応しています。次の表は、対応しているすべての言語と、モデルが各言語で学習したトークン数を示しています。 5億トークン未満で学習された言語については、結果の品質を十分に評価する必要があるため、慎重に扱うことを推奨します。

出典： Unsupervised Cross-Lingual Representation Learning at Scale（英語）

Multilingual E5-Large（オープンソース）

出典： Unsupervised Cross-Lingual Representation Learning at Scale（英語）

Open AI Ada 002 #ロードマップ

この埋め込みモデルは、チャンクの強化が有効になっている場合にデフォルトで使用されます。 E5モデルと組み合わせてチャンクの強化を実行することはできません。チャンクの強化が有効になっていない場合、このモデルを使用できます。 Ada 002も多言語に対応していますが、本ガイド執筆時点では、OpenAIは対応言語の確定リストを公開していません。一般的でない言語については、追加のテストおよびモニタリングが推奨されます。

5.6 1つのレコードに属するドキュメント上のRAG

多くの場合、RAGは特定のレコードのコンテキスト内で実行される必要があります。例として、特定のケースのタスク内を検索することや、特定のアカウントの契約内を検索することが挙げられます。これは、ドキュメントをSalesforceレコードに関連ファイルとしてアップロードすることで可能です。このアカウントの例を用いて、このような（ノーコード）ソリューションを設定するには、以下の手順が必要です。

まだ設定していない場合は、ContentDocument、ContentDocumentLink、ContentDocumentVersionのデータストリームを設定します。対応するDLOを必ずSSOT DMOにマッピングします。 ContentDocumentLinkに、元のDMO（このケースでは SSOTアカウント）への関連付けを必ず作成します。
アカウントDMOのために検索インデックスを作成し、説明または他の関連する長文テキストフィールドをインデックス化します。
検索インデックス設定（詳細設定モード）のステップ2で、「添付ファイルを含める」を選択します。ここでチャンク設定が定義されます。その後、アカウントオブジェクトからの関連ファイルがすべてインデックス化されます。これらはアカウントフィールドのチャンクとともに1つのインデックスにまとめられます。これらをフィルタリングするには、アカウントIDなどの検索インデックスに事前フィルターを追加します。
Account_ID = $placeholder（セクション6.2参照）などの動的な事前フィルターを使用して、カスタムリトリーバーを作成します。
アカウントを入力として使用し、プロンプトビルダーで$placeholderをプロンプト入力のアカウントIDにマッピングするフレックスRAGプロンプトテンプレートを作成します（セクション6.2およびセクション7を参照）。
その内容を中心に、アカウントとユーザーの質問をフレックスプロンプトテンプレートに引き渡すエージェントアクションを作成します。

チャプター 5 6. リトリーバーの設定

リトリーバーは、検索インデックスと、それにコンテキストを追加するプロンプトの橋渡し役として機能します。 ADLを設定する際、リトリーバーは自動的に作成されます。取得および拡張プロセスをより詳細に制御するために、エージェントスタジオでは、リトリーバーを手動で作成およびカスタマイズできます。これには、ADLを使用して作成された検索インデックス用のリトリーバーも含まれます。

6.1 プロンプトをリトリーバー/インデックス外のデータでグラウンディングする方法

リトリーバーは、取得したチャンクに追加のフィールドを返すことができます。これらは、チャンクDMOまたは元のDMOから来る場合があります。検索インデックスがUDMO（ファイルなどの非構造化データ）に対して作成されている場合、通常は関連するメタデータをほとんど利用できません。これは、非構造化ファイルを関連ファイルとしてSalesforceのレコードにアップロードすることで解決できます。 ContentDocumentコネクターを使用することで、これらを添付ファイルとして検索インデックスに取り込むことができます。検索インデックスには、これらの添付ファイルおよび選択されたインデックスフィールドから生成されたチャンクが含まれるようになります。この検索インデックスに対して、ソースDMOから任意のフィールドを返すようにリトリーバーを設定できます。

6.2 結果にフィルターを適用する方法＆動的事前フィルタリングについて

カスタムリトリーバーの場合、すべての取得結果に特定の条件（特定の言語で書かれていることや、特定のカテゴリに属していることなど）を適用するために、事前検索フィルター（または単に事前フィルター）を設定できます。事前フィルタリングにより、要求した件数の結果が返され、すべての結果がフィルターの条件を満たすことが保証されます。フィルターは、検索インデックス作成時に検索インデックスビルダーで定義されたフィールドにもとづき、リトリーバーの設定エクスペリエンスで定義されます。これらのフィールドは、インデックスDMO（ベクトルを含む）のスキーマの一部となります。

注：現在、既存の検索インデックスに事前フィルタリング項目を追加することはできません。

事前検索フィルターおよび事後検索フィルター

事前フィルターによって、結果セットのサイズを制限し、クエリに関連しない余分なコンテンツを除外することで、関連性に結果の重点を置くことができます。リトリーバーが10件の結果を返すように設定されている場合、検索インデックスで見つかった最大10件の結果を返します。結果には、フィルター条件が「True」と評価されたコンテンツのみが含まれます。

対照的に、事後検索フィルタリングは最初に10件の結果を取得して、それからフィルターを適用します。これにより、結果セットのサイズが縮小される可能性が高く、フィルター条件を満たす結果がない場合は、結果セットが0になることもあります。現在、事後フィルターはリトリーバーに対応していません。ただし、Apexを使用したプロコードソリューションで定式化することができます（セクション9を参照）。事後検索フィルターを使用するメリットは、あらゆるアクセス可能な関連フィールドを使用できる点です。一方、事前フィルターはフィルタリングのために検索インデックスに追加されたフィールドを必要とします。

動的事前フィルター

動的事前フィルターでは、フィルター条件の値が実行時に提供されます。フィルター条件は、プロンプト解決時に設定される値のプレースホルダー構文を使用して、設計時にリトリーバーに指定されます。たとえば、Account = $placeholderのようにフィルターを設定できます。次に、プロンプトビルダーのプロンプトエンジニアによって、プロンプトテンプレートの入力から$placeholderが適切な値にマッピングされます。たとえば、アカウントフィールドのフィールド補完テンプレートや、アカウントを入力フィールドとするフレックステンプレートでは、プロンプトエンジニアはそのプレースホルダーをアカウント名やID、または検索インデックスの識別用事前フィルターとして追加された任意のフィールドにマッピングできます。この方法により、リトリーバーはその特定のアカウントでタグ付けされた結果のみを返却します。

（デモリンク、現在はSalesforce内部のみ）

6.3 詳細検索モードについて＆使用すべきタイミング

#ロードマップ

詳細検索モードは、クエリの書き換えと反復的な検索を組み合わせたリトリーバー機能です。詳細検索モードを使用すると、特にユーザーのクエリが適切に構成されていない場合や、ユーザーが質問を把握していない場合、または、検索インデックスが何に応答できるかを把握していない場合に、検索の品質を最適化できます。具体的なステップは以下のとおりです。

元のユーザークエリを使用して最初の検索を実行します。
ステップ1の結果を要約します。
元のユーザークエリとステップ2の要約結果を入力として受け取るプロンプトを使用する、LLMベースのクエリ書き換えが行われます。
（ステップ3で）書き換えられたクエリを使用して、2回目の検索を実行します。

RAGは通常通り実行されます。ステップ4の結果でプロンプトを拡張し、解決したプロンプトを選択したLLMに送信して、最終的な応答を生成します。

チャプター 6 7. RAGとプロンプトエンジニアリング

7.1: 優れたRAGプロンプトテンプレートとは

プロンプトテンプレートの指示は、LLM生成結果の成功に不可欠です。

基本的なプロンプトテンプレートの例


 
please answer this question:
{!$Input:question}

using this information:
{!$EinsteinSearch:ArticleRetriever_1Cx_Q8Qa1857028.results}

上記の例には、2つの差し込み項目があります。

{!$Input:question} は、プロンプトテンプレートの自由テキスト入力から取得されます（すべてのプロンプトテンプレートタイプで利用可能）。
{!$EinsteinSearch:ArticleRetriever_1Cx_Q8Qa1857028.results} は、取得したコンテキストを使用するようにLLMに指示するリトリーバーの挿入です。 LLMがコンテキストをどのように使用すべきかを指定していないため、指示は最小限かつ限定的です。

過度に単純化された指示は、さまざまな理由によりLLMのハルシネーションを引き起こすリスクがあります。

LLMは、提供されたコンテキストよりも関連性が高いと判断した場合、内部のナレッジの一部を使用することを選択できます。このような内部ナレッジは、古くなっている場合や、関連性が低い場合があります。
場合によっては、LLMは内部のナレッジをまったく使用することなく、回答を作り上げてしまうこともあります。その理由として、「この情報を使用する」よりも「この質問に答える」という指示を重要視してしまうことが挙げられます。 LLMは提供されたコンテキストにもとづいてどのように回答すべきか確信が持てない場合でも、ユーザーのインテントに最適な回答を考え出そうと最善を尽くします。
さらに、プロンプトには、期待される出力や、与えられたコンテキストに対してLLMが行うべき推論のレベルに関する指示が一切含まれていません。

これは、12歳の子供に地理の本を渡して、「試験のために勉強しましょう」と言うようなものです。一部の生徒は試験準備を進められますが、生徒の多くはどのように勉強すればよいか、また、本をどのように活用すればよいかについてのさらなる指導を必要とします。

ナレッジで質問に答えるプロンプトテンプレート

「ナレッジで質問に答える」という標準の、すぐに使えるプロンプトテンプレートは、一般的なプロンプト設計の原則に従って、より詳細な指示を提供します。前述の基本プロンプトテンプレートで指定されている内容に加えて、このテンプレートは以下を提供します。

ユーザーの質問を理解することを奨励。
そのコンテンツ内で関連性のある情報を探すことを推奨し、提供されたコンテンツにもとづいてLLMの応答を作成するよう明確に指示。
指定されたソースコンテンツに情報が存在しない場合の対応方法。
応答を作成する方法に関する手順。

以下は、既製のプロンプトテンプレート内の指示です。これは標準アクションに属します。 動的リトリーバーを使用します。


###
指示

 1. クエリを分析する： 質問セクションからユーザーの質問や問題を注意深く読み、理解してください。
 2. ナレッジを検索する： 提供された会社のナレッジを確認して、関連情報を見つけてください。
 3. 情報を評価する： ナレッジセクションにある利用可能な情報が質問に答えるのに十分かどうかを判断してください。
 4. 応答を作成する： ユーザーへの返信

<generated_response> を生成するには、これらのルールに従う必要があります
 a.
 ユーザーの問い合わせにもっとも関連性の高い記事チャンクを見つけ、その記事のIDをそのまま抽出して、レスポンスJSONの

<source_id>フィールドに設定します。
 該当する記事が見つからない場合は、

<source_id> を「なし」に設定してください。
 b. 関連する記事チャンクを使用して、ユーザーの質問に正確に回答する応答を生成し、

<generated response>フィールドに設定します。
 c. ユーザーのリクエストが提供されたナレッジで回答できない場合、

<source_id> を 「なし」に設定し、

<generated_response> を「申し訳ありませんが、利用可能な記事にもとづいて回答を見つけることができません」に設定してください。
 5. 改善し、提供する： 回答が丁寧かつ専門的、簡潔で、{language}のみであることを徹底してください。
 6. 返信を見直す： 上記のすべての指示に従っていることを確認し、希望する出力形式で回答し、ナレッジのみに厳密にもとづいて回答を作成してください。

 ###
ナレッジ：
{!$EinsteinSearch:sfdc_ai__DynamicRetriever.results}

 ###
質問：
{!$Input:Query}




 






























    
    
        
            

    

    
    
        
    ユーザーはこのテンプレートの精度が高いと報告しています。 特定のシナリオにおいて、追加の指示を加えることで応答の品質を向上させることができます。
たとえば、次のプロンプトテンプレートは以下の点において異なる構造になっています。

コンテキストをどのように解釈するかについての事前指示を提供
コンテキストと質問がマージされた形で提供
最後に、応答の構成方法について説明

提供されたコンテキストについて深く考え、質問を複数の視点から検討するように促す指示に留意してください。






 
以下のコンテキストから論理的に導き出される根拠のみにもとづき、ユーザーのクエリに対して明確かつ直接的に回答してください。 
その後、ユーザーのクエリに対して、コンテキストにもとづき異なる視点を強調しつつ、詳細で慎重な推論をもって、論理的かつ体系的、思慮深く、多角的な視点から綿密に応答してください。 
回答には、整理された構成で詳細を提供してください。 現在の推論の道筋に異議を唱える可能性のある別の視点やアプローチを検討してください。 
質問に回答するための十分な情報が見つからない場合、または質問への回答方法がわからない場合は、「申し訳ありませんが、ご質問にお答えするための十分な情報が見つかりませんでした」と回答してください。
推論を裏付ける証拠やデータを評価し、不足や矛盾がないか特定してください。 
最後に、ユーザーのインテントを明確にするために質問をしつつ、ユーザーのクエリについて批判的思考と自己発見を促してください。 
事実と、意見または信念の違いを、詳細を交えて明確に説明してください。 
答えがわからない場合は、ユーザーのインテントを明確にするために質問してください。 
ユーザーのクエリで言及されているエンティティに注意し、そのエンティティに関する情報がコンテキストに含まれていることを確認してください。 

コンテキスト：
{!$EinsteinSearch:ArticleRetriever_1Cx_Q8Qa1857028.results}

クエリ：
{!$Input:question}

指示の形式を設定する： 
以下のマークダウン構造で回答の形式を設定してください。 
トピックの概要から始めてください。  
主なポイントをリスト形式で挙げ、重要な用語は太字で強調してください。 
以降のセクションでは、サブクエリを暗黙的に組み込んだ見出しおよび小見出しを作成してください。 
手順や連続したデータがある場合は、順序付きリストで提示してください。 
結論で締めくくってください。





































    
    
        
            


    
    
    


    
        
        チャプター 7 
        8. 引用 #ロードマップ




 






























    
    
        
            


    
    
    
    


    
        8.1 検証可能な応答で信頼を構築




 






























    
    
        
            

    

    
    
        
    信頼こそがAI導入における基盤です。 AIエージェントが応答を生成する際、ユーザーはその情報が正確であり、現実にグラウンディングされていて、ハルシネーションではないことを知る必要があります。 引用は、AIが生成した応答をその作成元となったグラウンディングソースへ直接リンクすることで、この信頼の基盤を提供します。
Agentforce導入において、引用は以下の3つの主要な戦略的目的を果たします。

検証可能性： ユーザーは、ソーステキストと比較することで、応答の正確性を監査できます。
信頼： 特定の企業データから導き出された回答であることを視覚的に示すことで、ユーザーのシステムへの信頼が高まります。
より詳細なインサイト： 引用は橋渡しの役割を果たし、ユーザーがクリックで元のドキュメント（例：PDF、ナレッジ記事、ウェブページ）にアクセスできるようにします。これにより、チャットで要約された内容より、さらに詳細なコンテキストを確認できます。




 






























    
    
        
            


    
    
    
    


    
        8.2 プラットフォーム管理型の引用と 指示ベースの引用の違い




 






























    
    
        
            

    

    
    
        
    Agentforceで引用を実装するには、以下の2つの異なるアーキテクチャアプローチがあります。 適切なアプローチを選択するには、求められる制御のレベルと、すぐに使える一貫性を重視するかどうかを比較検討する必要があります。
プラットフォーム管理型の引用（推奨）
これは、引用の形式設定、表示、リンクを自動的に行う専用プラットフォームサービスです。 複雑なプロンプトエンジニアリングを必要とせず、エージェントインターフェース全体で一貫したユーザー体験を実現します。

最適なドキュメント： 一貫性と設定の容易さが優先される、ほとんどの標準的なユースケース。
動作： 引用は、回答の最後にある構造化された「出典」セクションに表示されます。 標準アクション（「ナレッジで質問に回答」など）では、インライン引用（テキスト内の番号付きリンク）がサポートされています。
制約： 2025年5月26日以降に作成されたAIエージェントでは、プラットフォーム管理型の引用が利用できます。

指示ベースの引用
このアプローチは、プロンプトエンジニアがプロンプトテンプレート内でカスタム指示を提供し、引用を生成することに依存しています（例：「常に出典タイトルの形式で出典を引用してください」）。

最適なドキュメント： 極めて特殊な書式設定要件。
トレードオフ： この方法は、特定の指示をプロンプトに含める必要があるため、より多くのコンテキストウィンドウを消費します。 また、LLMが書式設定指示に従っていることを確認するために、より厳格なテストも必要です。




 






























    
    
        
            


    
    
    
    


    
        8.3 リトリーバーにおける引用の設定




 






























    
    
        
            

    

    
    
        
    プラットフォーム管理型の引用が機能するためには、データはソースであるリトリーバー側で準備されている必要があります。 エージェントスタジオで引用機能を有効にすると、リトリーバーがメタデータをプロンプトテンプレートやAIエージェントなどのダウンストリームコンポーネントに引き渡すことができます。
エージェントスタジオでリトリーバーを設定する際、引用の構築方法を定義するために、以下の2つのオプションがあります。
標準引用
システムは、基盤となるデータモデルオブジェクト（DMO）のデフォルトのソースURLと見出しテキストフィールドを使用して、自動的に引用を生成します。 これは標準ナレッジ実装向けの最短の設定方法です。
カスタム引用
より複雑なデータモデルの場合、特定のフィールドを手動でマッピングして引用を構築できます。 以下の内容を定義します（agentforce.comは例として使用されているドメインです。ここにご自身のドメインを指定してください）。

ベース https://www.agentforce.com/search?q=URL: コンテンツのルートドメイン。
https://www.agentforce.com/search?q=URL パス： 特定のパスは、多くの場合、レコードIDによって動的に入力されます。
ラベル： 引用リンクに表示されるユーザー向けテキスト。

ベストプラクティス： https://www.agentforce.com/search?q=URLs に選択されたフィールドに、エンドユーザーが確実にアクセスできるようにします。 引用リンクは、ユーザーが対象ドキュメントを表示する権限を持っている場合にのみ有用です。




 






























    
    
        
            


    
    
    
    


    
        8.4 プロンプトテンプレートで引用を有効化する




 






























    
    
        
            

    

    
    
        
    引用をサポートするようにリトリーバーを設定したら、そのリトリーバーを呼び出すプロンプトテンプレート内でこの機能を有効化する必要があります。
プロンプトビルダーで、{!$EinsteinSearch...} リソースを設定する場合は、以下の手順に従ってください。

希望するリトリーバーを選択します。
テンプレート設定の応答セクションで、引用を有効にするに切り替えます。

このプロンプトテンプレートが呼び出されると、LLMの応答には、使用されたドキュメントのクリック可能なリストを含む「出典」セクションが表示されます。
カスタムアクションに関する注意： プロンプトテンプレートにもとづくカスタムアクションは、応答の下部にある「出典」リストには対応していますが、標準の「ナレッジで質問に回答する」アクションと同様に、インライン引用（例：「保証期間は2年間です [1]」）には現在対応していません。




 






























    
    
        
            

    

    
    
        
    引用はテキストに限定されません。Agentforceは、ドキュメント内に含まれるチャート、グラフ、図などのビジュアルデータにグラウンディングして応答を生成できるようになりました。
ユースケース： ファイナンシャルプランニング
ファイナンシャルプランナーがAIエージェントに顧客のポートフォリオ配分について質問する場面を想像してみてください。 ソースドキュメントにポートフォリオの円グラフが含まれている場合、RAGプロセスは、その画像の構造化された説明を取得できます。
実装の手順は以下のとおりです。

取り込み： 画像を含むドキュメント（例：PDF）を接続します。
インデックス： Data Cloud検索で詳細設定を使用します。 画像処理を有効化し、互換性のある埋め込みモデルを選択します。 現在、画像ファイルはインデックス化の強化には対応していないのでご注意ください。
検索： LLMは画像の説明を使用して質問に回答し、プラットフォームは画像ソースに直接リンクする引用を生成します。

エージェントインターフェースでは、これらは外部リンクとして表示され、ユーザーは回答をグラウンディングした特定のチャートやグラフをポップアップ画面で開くことができます。





































    
    
        
            


    
    
    


    
        
        チャプター 8 
        9. リトリーバーなしのプロコードRAG




 






























    
    
        
            

    

    
    
        
    リトリーバーは、プロンプトテンプレートと検索インデックスを結びつけます。 これにより、ユーザーは、指定された検索文字列（ユーザーのクエリまたは質問）に、もとづいて検索インデックスから取得するコンテンツを指定する、再利用可能かつバージョン管理可能な、ノーコードのクエリテンプレートを設定できるようになります。 リトリーバーを使用すると、ユーザーは以下を指定できます。

結果の件数。 プロンプトビルダーで設定された結果の件数は、リトリーバーで設定したデフォルト値を上書きします。 数値は低くなる場合も高くなる場合もあります。
返却フィールド（インデックスDMOまたは関連するDMOから直接）
事前フィルター




 






























    
    
        
            


    
    
    
    


    
        9.1（ノーコード）リトリーバーの制限事項




 






























    
    
        
            

    

    
    
        
    ノーコードリトリーバーは以下をサポートします。

50件の結果（最大）
以下の事前フィルターのみサポートします。
テキストフィールドの演算子：等しい/等しくない
数値フィールドの演算子：等しい/より大きい/より小さい
すべてのフィルター条件に論理「AND」または論理「OR」のいずれかを適用（ネストされた条件は不可）


検索後フィルター定義なし

一部のユースケースでは、クエリが検索インデックスに対してより複雑な表現を必要とします。 以下のような追加の制御が必要となります。

テキストフィールドの「含む」演算子など、さまざまな事前フィルター演算子
フィルター条件全体にわたる論理「AND」と論理「OR」の混在を含むネストされた事前フィルター条件
検索インデックスに含まれていないフィールドに対してフィルタリングを提供する、結果取得後に評価される事後フィルター定義




 






























    
    
        
            


    
    
    
    


    
        9.2 リトリーバーを使用せずにRAGを実行する方法




 






























    
    
        
            

    

    
    
        
    リトリーバーは、RAGの実装用に迅速かつ簡単（ノーコード）なアプローチを提供します。 リトリーバーは、検索インデックスクエリに加えて、アンサンブルリトリーバーや（#ロードマップ）詳細検索モードなどの追加機能を提供します。 Headless 360 platform上のすべてのノーコードアーキテクチャと同様に、一部のユースケースはプロコードを使って解決する方が最適です
実行時に、リトリーバーはユーザー設定をData 360 SQLクエリに変換し、ベクトル検索またはハイブリッド検索関数を呼び出すために使用します。 これらの関数は、Apexクラス内からData 360 Connect APIを使用して呼び出すこともできます。 Apexユーザーは、クエリの表現を直接記述する柔軟性と能力を持ち合わせています。
このハイブリッド検索に関するヘルプトピック
を参照して、クエリの表現の例や、ノーコードリトリーバーが対応していない事前フィルター表現の例をご確認ください。 事前フィルター（このページには記載されていません）は、SQL式のWHERE句によってサポートされています。
ユーザーは、Apexクラスを使用してプロンプトをグラウンディングでき、ノーコードリトリーバーが現在利用できないケースにおいてプロコードの代替手段を提供します。
注： Apexクラスまたはフローがコンテンツウィンドウを超えるコンテンツを返した場合、そのコンテンツは自動的に要約されます。 その場合、元のレコード/チャンクデータは返却されず、要約バージョンが提供されます。
Apexクラスとプロンプトテンプレートの使用方法については、Salesforceヘルプの「Apex差し込み項目をフレックスプロンプトテンプレートに追加する
」を参照してください。 そのページの例では、public static Listメソッドには、Data 360 Connect APIへの呼び出しは含まれていません。 ただし、このページではApexクラスの構造が示されています。
次の例では、Connect APIへの接続とクエリ表現を作成します。 このコードでは、取得したコンテンツへのユーザーアクセスのためにプロシージャルフィルター（クエリ表現の外側）を適用しますが、これは現在ノーコードリトリーバーでは利用できません。








public static List
<Response> searchSimilarCases(List
<Request> requests) {
List
<Response> responses = new List
<Response>();
Response response = new Response();

String caseDescription = requests[0].RelatedEntity.Description;

ConnectApi.CdpQueryInput input = new ConnectApi.CdpQueryInput();
input.sql = 'SELECT DISTINCT v.score__cScore__c, c.ssot__Id__cId__c, c.ssot__Subject__c
Subject__c"+
'FROM vector_search(\case_chunk_vector__dlm\;\" + caseDescription + '\', \'\', 200) v ' +
'JOIN Case_Chunks__dlm cc ON v.chunk_id__c = cc.chunkid__c ' +
'JOIN ssot__Case__dlm c ON cc.parentid__c = c.ssot__Id__c ' +
WHERE cc.column__c != \'ssot__Subject__c\' AND c.ssot__DataSourceId__c = \'CRM\' ' +
'LIMIT 10';

ConnectApi.CdpQueryOutput output = ConnectApi.CdpQuery.queryANSISql(input);

List Object> data = output.data;
String scs = '';
for (Object searchRecord : data) {

Map
<String, Object>myMap = (Map
<String, Object>) JSON.deserializeUntyped(JSON.serialize(searchRecord));
// check for access of case record for the current user
if (SimilarCasesSearch.getUserRecordAccess((String) myMap.get('Id__c'))) {
Map<String, String> sc = new Map
<String, String>();
sc.put('Id', (String) myMap.get('Id__c'));
sc.put('Similar_Case__c', (String) myMap.get('Id__c'));
sc.put('Name', (String) myMap.get('Subject__c'));
sc.put('Score__c', String.valueOf(myMap.get('Score__c')));
scs = scs + JSON.serialize(sc);
}
}
response.Prompt = scs;
responses.add(response);
return responses;
}





































    
    
        
            


    
    
    


    
        
        チャプター 9 
        10. RAGに適したLLMの選定




 






























    
    
        
            


    
    
    
    


    
        10.1 RAGに最適なLLMと LLMの重要なパラメーター




 






























    
    
        
            

    

    
    
        
    ユースケースによっては、特定の要因により、あるLLMが他のLLMよりも適している場合があります。




 






























    
    
        
            

    
        
            


    
        コンテキストウィンドウサイズ
    



        
    

    
    
        
    解決したRAGプロンプトのサイズに対応できる、十分なコンテキストウィンドウサイズを備えたLLMを選択することが重要です。 1トークンはおおよそ3/4語に相当することを考慮してください。 たとえば、100トークンは約75語に相当します。

OpenAIのGPT 4oおよびGPT 4 Turboモデルは、コンテキストウィンドウが12万8,000トークンあり、これはRAGユースケースには十分なレベルです。 ただし、GPT 4 Turbo 32,000では、3万2,000トークンのコンテキストウィンドウとなっています。
OpenAIのGPT 3.5および3.5 turboモデルは、1万6,385トークンの小規模なコンテキストウィンドウになっており、大規模なプロンプト拡張には不十分です。
Claude 3 Haikuのコンテキストウィンドは、20万トークンとなっています。




 






























    
    
        
            

    
        
            


    
        推論機能
    



        
    

    
    
        
    モデルが強力であるほど、与えられたコンテキストに対してより優れた推論が可能になります。 特定のユースケースにおける推論タスクの難易度を慎重に評価してください。 提供されたコンテキストに重要な情報はほぼすべて含まれているでしょうか？一般的に、RAGソリューションにおける最大の複雑性は、最終的なLLM生成よりも、検索と拡張で多く発生します。 このような場合、生成を実行するLLMへの負担はそこまで大きくならないため、コンテキストウィンドウがユースケースに十分な大きさであれば、小規模なモデル（GPT 3.5など）でも対応することができるようになります。
生成を実行するLLMがコンテンツについてさらに深く推論する必要がある場合（複数の結果を組み合わせたり、入力を変換したり、結論を導き出したりする場合など）のような、さらに複雑なユースケースにおいては、GPT 4（Turbo）など、より強力なモデルが推奨されます。





































    
    
        
            


    
    
    


    
        
        チャプター 10 
        11. Flow内のRAG




 






























    
    
        
            

    

    
    
        
    プロンプトテンプレートでプロンプトのグラウンディングにもっとも一般的に使用されるのが、リトリーバーです。 リトリーバーは、RAGのフローでも使用されます。 さらに、フロー内では、その出力を他の方法で使用することができます。たとえば、自動化のシナリオで出力を既存の類似コンテンツの確認に使用したり、分類タグ付け（セクション13.2で説明）に利用したりすることが可能です。
RAGソリューションは、フロー内で実装できます。 このアプローチでは、フローがリトリーバーを呼び出してグラウンディング結果を取得し、その結果を後続で呼び出すプロンプトテンプレートに引き渡します。 このアプローチにより、ユーザーはRAGプロセス全体をより細かく制御できるようになります。 ユーザーは、連鎖したプロンプトテンプレート、リトリーバー、および変換のパイプライン全体を設定できます。 プロンプトテンプレートを使用してプロセスを推進する代わりに（フローの呼び出しを含む）、フローがオーケストレーション層およびプロセスへの窓口として機能します。 このフロー主導のアプローチは、取得した結果に対して、特定のユーザーアクセス権やその他のプロコードフィルターの確認など、より詳細な事後フィルタリングを提供します。




 






























    
    
        
            


    
    
    
    


    
        11.1 Flowにおけるリトリーバーの使用方法と RAGにおけるFlowの意味




 






























    
    
        
            

    

    
    
        
    Flowでリトリーバーを呼び出すには、Flowにアクション要素を追加します。 利用可能なアクションのリストからリトリーバーのリトリーバー名を検索します。 Flow変数（検索文字列など）は、リトリーバーへの入力として利用できます。 実行時には、数値はSalesforceレコード、Flow画面の要素、その他の任意のFlow変数から取得できます。
Flow内でリトリーバーを呼び出す際も、動的事前フィルターがサポートされています。 動的フィルターの数式では、等式の右辺をFlow変数にマッピングします。 実行時に、Flowのコンテキスト（国、言語、カテゴリなど）を使用して、動的フィルターでリトリーバーの結果をフィルタリングします。
以下の標準Flowアクションを使用すると、Flowで高度なRAGパイプラインを構築できます。




 






























 
    
        
                
                    
                        


    
        標準Flowアクション
    



                    
                    
                
                
                    
                    
                    
                        
                    
                    
                    
                        
                    
                        
                    
                    
                    








    
        
        
            
                
            
            
                
                    
                        
                            
                            
Flowアクション


                        
                            
                            
説明


                        
                    
                
            
        
        
            
                
                
            
            
                
                    
                        
                        
                            
言語を検出


                        
                    
                        
                        
                            
クエリの言語を検出し、その言語をフィルター値としてリトリーバーノードに引き渡すことで、動的なフィルタリング（言語別）が可能になります。


                        
                    
                
            
                
                    
                        
                        
                            
{ケース/メール/会話}のクエリを変換


                        
                    
                        
                        
                            
これらの3つのノードはそれぞれ、ケース、メール、会話を検索向けに最適化されたクエリへと変換するLLM変換を呼び出します。 これにより、リトリーバーが検索インデックスに引き渡すクエリが改善されます。 たとえば、会話からクエリへのアクションは、「ご用件をお伺いします」や「お世話になっております」のような関連性のないメッセージで検索インデックスをクエリすることを回避します。 同様に、ケースからクエリおよびメールからクエリは、テキストから関連情報を抽出し、挨拶や検索に使用すべきでないその他のテキストを除去します。

Flowアクション	説明
言語を検出	クエリの言語を検出し、その言語をフィルター値としてリトリーバーノードに引き渡すことで、動的なフィルタリング（言語別）が可能になります。
{ケース/メール/会話}のクエリを変換	これらの3つのノードはそれぞれ、ケース、メール、会話を検索向けに最適化されたクエリへと変換するLLM変換を呼び出します。これにより、リトリーバーが検索インデックスに引き渡すクエリが改善されます。たとえば、会話からクエリへのアクションは、「ご用件をお伺いします」や「お世話になっております」のような関連性のないメッセージで検索インデックスをクエリすることを回避します。同様に、ケースからクエリおよびメールからクエリは、テキストから関連情報を抽出し、挨拶や検索に使用すべきでないその他のテキストを除去します。




 






























    
    
        
            

    

    
    
        
    リトリーバーの出力は、JSON配列として書式設定されていますが、この書式はFlowではサポートされていません。 したがって、その後Flowで結果を使用するには、処理アクションによってリトリーバーの出力をフラット化された文字列などのFlowがサポートする書式に変換する必要があります。 プロセッサーFlowノードは、以下の例のようにApexクラスを使用して実装できます。







 global with sharing class RetrieverProcessor {

 
    @InvocableMethod
    class public static List
<String> GetWebProduct(List
<Requests> queryResults)
       {
            List
<String> resultsList = new List
<String>()
            for (Requests queryResult : queryResults) {
                List<String> segments = new List
<String>();
               for (ConnectApi.MlRetrieverQueryResultDocumentRepresentation document: queryResult.queryResult.searchResults) {
               for (ConnectApi.MlRetrieverQueryResultDocumentContentRepresentation content: document.result) {
                    if (content.fieldName.equals('Chunk')) {
                        segments.add(content.value.toString());
                   }
                }}
              if

 if (segments.size() == 0) {
                    resultsList.add('No results');
                } else {
                    resultsList.add(String.join(segments, ','));
                }  
    }
return resultsList;
       }      
    global class Requests {
        @InvocableVariable
        global ConnectApi.MlRetrieverQueryResultRepresentation queryResult;
        
    }
}




 






























    
    
        
            

    

    
    
        
    この例では、GetWebProductメソッドがリトリーバーの出力要素をループし、「チャンク」という名前の返却フィールドのコンテンツを文字列のリストに追加します。 このFlowは、このリストをダウンストリームで繰り返し処理することも、グラウンディングの入力としてプロンプトテンプレートノードに引き渡すことも可能です。





































    
    
        
            


    
    
    


    
        
        チャプター 11 
        12. RAGを活用したAIエージェントのデバッグとトラブルシューティング




 






























    
    
        
            

    

    
    
        
    AIエージェントがRAGを使用して質問に回答した際、その回答が不十分であった場合、RAGに関連するさまざまな要因を考慮する必要があります。 ユーザーにとっては、AIエージェントが単に誤った回答や不十分な回答をしたか、まったく回答しなかったように見えます。 パフォーマンスが低下しているRAG強化型のAIエージェントのトラブルシューティングでは、これらのさまざまな失敗の要因を1つずつ調査し、原因を特定していきます。
これらの失敗は、以下の原因によって発生する可能性があります。

AIエージェント/RAGチェーンのどこかで不具合が発生しているソリューションコンポーネントまたは統合の問題
すべてのソリューションの構成要素は正しく連携および呼び出されているものの、応答の品質レベルが期待値に達していない質的な問題

このセクションでは以下のことを説明します。

チェーンが正常であるかどうかを判断するための段階的なトラブルシューティングのレコメンデーション（12.1）
RAG評価指標を使用して、より質的な問題を特定するためのガイドライン（12.2）

RAGソリューションでADLを使用する場合は、こちらのトラブルシューティングガイド
を参照してください。




 






























    
    
        
            


    
    
    
    


    
        12.1 ソリューション層のトラブルシューティング




 






























    
    
        
            

    
        
            


    
        ステップ 1. エージェント層： エージェントトピックとエージェントアクションは呼び出されているか？
    



        
    

    
    
        
    Agentforceの推論エンジンによって、正しいトピック内で正しいアクションが実行されているかどうかを判断します。 Agentforce Agentforce Builderまたはテスティングセンターを使用して調査と診断を行います。
正しいトピックが選択されていない場合、または正しいトピックが選択されていても正しいアクションが実行されていない場合、問題は指示および分類説明のAIエージェント設定で発生している可能性が高いです。 これはAIエージェントの問題であり、RAGの問題ではないため、本ホワイトペーパーでは取り扱いません。 この詳細については、以下のページを参照してください。

help.salesforce.comの「優れたトピックの指示の作成方法」

help.salesforce.comの「優れたアクションの指示の作成方法




 






























    
    
        
            

    
        
            


    
        ステップ 2. エージェント層（ADLのみ）： アクションに正しいリトリーバーが引き渡されているか？
    



        
    

    
    
        
    Agentforce Builderは、推論エンジンの推論パスおよびその中間の結果を示します。 ADLと標準アクションを使用する際は、推論パスにしたがって、正しいリトリーバーやグラウンディングソースがプロンプトテンプレートに引き渡されているかを確認してください。 正しいリトリーバーが引き渡されていない場合は、正しいリトリーバーが引き渡されるようにAIエージェントの設定を修正してください。
注： このアプローチは、カスタムプロンプトテンプレートを使用するカスタムエージェントアクションには適用されません。 これは、リトリーバーの呼び出しが完全にプロンプトテンプレート内で行われ、推論エンジンによって引き渡されるものではないためです。




 






























    
    
        
            

    
        
            


    
        ステップ 3. 検索インデックス層： 検索インデックスにベクトルは含まれているか？
    



        
    

    
    
        
    以下の方法で、検索インデックスにコンテンツが正しく入力されているかどうかを判断できます。

Data 360クエリエディタで、インデックスDMOに対して「クエリを選択する*」を 実行します。 必ずLIMIT 10または同様の文を使用してください。
データエクスプローラーで、DMOのレコードが存在することを確認します。
CRM Analytics（組織で利用可能な場合）で、チャンクを調査します。 DMOのトップページで「分析で確認する」ボタンをクリックします。
すべてのDMOレコードがインデックス化されているか、または検索インデックスの増分更新が失敗しているかどうかを確認します。 次の例のようなクエリを使用して、レコード数の結果を比較します。






SELECT 'INDEX' AS Location, COUNT(DISTINCT rc.SourceRecordId__c) AS ArticleCount, now() AS Timestamp 
FROM 
<chunk DMO of the Search Index> rc
UNION
SELECT 'DMO' AS Location, COUNT(DISTINCT  kav.Id__c)  AS ArticleCount, now() AS Timestamp 
FROM 
<DMO that was indexed, e.g. Knowledge Article Version> kav
ORDER BY Location;




 






























    
    
        
            

    
        
            


    
        ステップ 4. リトリーバー層： リトリーバーはコンテンツでプロンプトを拡張しているか？
    



        
    

    
    
        
    プロンプトビルダーで、次のいずれかを判断します。

正しいリトリーバーバージョンがプロンプトテンプレートに追加されているか
正しい結果フィールドが有効化されているか
プロンプトの解決結果にコンテンツが含まれているか




 






























    
    
        
            


    
    
    
    


    
        12.2 RAG評価指標の解釈




 






























    
    
        
            

    

    
    
        
    RAGパイプラインのすべての構成要素が正しく結びついていることを確認したら、質的な問題が回答の誤り、不完全さ、ハルシネーション、またはこれらの症状の組み合わせを引き起こしているかどうかを判断します。 質的な懸念は、根本原因が多岐にわたるため、トラブルシューティングがさらに困難になる場合があります。 検索、埋め込み、拡張、応答生成、さらには元のナレッジソースにおいても、品質の問題が発生する可能性があります。 （該当するコンテンツは実際に検索インデックス内に存在しますか？） この図は、RAGパイプライン内で品質の問題が発生する可能性のある領域と、それらの関連項目を示しています。




 






























    
    
        
            

    

    
    
        
    RAGの評価品質指標によって、RAGパイプラインで改善すべき領域を判断することができます。 ダッシュボードには、3つの評価指標が計算され、表示されます。 このダッシュボードでは、リトリーバーレベルまで詳細を確認することができます。 指標については以下で説明します。その後、これらを総合的に検討した際に浮き彫りになる点について詳しく見ていきます。




 






























 
    
        
                
                    
                        


    
        指標
    



                    
                    
                
                
                    
                    
                    
                    
                    
                        
                    
                        
                    
                        
                    
                        
                    
                    
                    








    
        
        
            
            
        
        
            
                
                
            
            
                
                    
                        
                        
                            
指標


                        
                    
                        
                        
                            
回答


                        
                    
                        
                        
                            
定義


                        
                    
                        
                        
                            
できること


                        
                    
                
            
                
                    
                        
                        
                            
コンテキストの関連性


                        
                    
                        
                        
                            
取得されたコンテンツはクエリにどの程度関連しているか？


                        
                    
                        
                        
                            
LLMベースの評価


                        
                    
                        
                        
                            
検索の問題を切り離す


                        
                    
                
            
                
                    
                        
                        
                            
忠実性


                        
                    
                        
                        
                            
取得したコンテンツに対して、応答はどれほどグラウンディングされているか？


                        
                    
                        
                        
                            
LLMベースの評価


                        
                    
                        
                        
                            
LLM生成問題を切り離す


                        
                    
                
            
                
                    
                        
                        
                            
回答の関連性


                        
                    
                        
                        
                            
この回答はクエリにどの程度関連しているか？


                        
                    
                        
                        
                            
LLMベースの評価


                        
                    
                        
                        
                            
回答に関する全体的な応答指標。 コンテキストの関連性および忠実性と組み合わせて使用するとさらに有用。

指標	回答	定義	できること
コンテキストの関連性	取得されたコンテンツはクエリにどの程度関連しているか？	LLMベースの評価	検索の問題を切り離す
忠実性	取得したコンテンツに対して、応答はどれほどグラウンディングされているか？	LLMベースの評価	LLM生成問題を切り離す
回答の関連性	この回答はクエリにどの程度関連しているか？	LLMベースの評価	回答に関する全体的な応答指標。コンテキストの関連性および忠実性と組み合わせて使用するとさらに有用。




 






























    
    
        
            

    

    
    
        
    品質指標の一般的なパターン




 






























    
    
        
            

    
        
            


    
        高い忠実度、低いコンテキスト関連性
    



        
    

    
    
        
    回答は、取得したコンテキストにグラウンディングされていますが、コンテキストはクエリに関連していません。 その結果、回答の関連性も低くなる可能性があります。 この症状は、取得時に問題が発生している可能性を示しています。
実施可能な修正方法は以下のとおりです。

コンテンツは実際にデータ内に存在しているか？
結果の件数は十分か？正しい結果フィールドが選択されているか？
検索文字列は正しく設定されているか？
非英語コンテンツに対して多言語埋め込みモデルが設定されているか？




 






























    
    
        
            

    
        
            


    
        低い忠実度、高いコンテキスト関連性
    



        
    

    
    
        
    回答は、コンテキストがクエリに関連していますが、コンテキストにグラウンディングされていません。 回答の関連性も低くなる可能性があります。 この症状は、LLM生成に問題があることを示している可能性があります。 LLMが与えられたコンテキストに従うための十分に明確な指示を出せなかったことなど、プロンプトエンジニアリングの不備が原因である可能性があります。
実施可能な修正方法は以下のとおりです。

プロンプトテンプレートは適切に作成されているか？プロンプトテンプレートは、セクション7に記載されているガイダンスに従っているか？
LLMは、必要な推論タスクを実行するための十分な能力を備えているか？LLMが能力不足の場合は、アップグレードを要検討。




 






























    
    
        
            

    
        
            


    
        高い忠実度および高いコンテキスト関連性、低い回答関連性
    



        
    

    
    
        
    回答はコンテキストにグラウンディングされており、そのコンテキストは実際にクエリに関連していますが、回答の関連性は依然として低い状態です。 この症状は、クエリに完全に回答するための十分なコンテキストが取得されなかったことを示している可能性があります。 問題はおそらく検索、特に検索のリコールにあると考えられます。
実施可能な修正方法は以下のとおりです。

コンテンツは実際にデータ内に存在しているか？
結果の件数は十分か？正しい結果フィールドが選択されているか？





































    
    
        
            


    
    
    


    
        
        チャプター 12 
        13. さらなるインサイト： RAGの最適化と非生成的ユースケース




 






























    
    
        
            


    
    
    
    


    
        13.1 LLM応答を生成することなく解決




 






























    
    
        
            

    

    
    
        
    RAGパイプラインを設定する際、管理者や開発者は、LLMに回答を生成させずにプロンプトを解決したいと考える場合が多くあります。 これにより、インデックス化や検索パイプラインの分析と最適化が可能になります。 目標は、リトリーバーによって取得されたコンテンツを観察することにあります。 LLM応答を生成する必要はありません。
プロンプトビルダーで、プロンプトテンプレートのURLに&c__debug=1を追加します。 これにより、管理者は「解決結果のみ」、「応答のみ」（応答用の画面スペースが広くなります）、または標準の「解決結果および応答」を切り替えることができるトグルが表示されます。




 






























    
    
        
            


    
    
    
    


    
        13.2 リトリーバーを使用した非RAGユースケース： ドキュメント識別




 






























    
    
        
            

    

    
    
        
    リトリーバーはRAGのユースケース以外でも使用されます。 必ずしも応答が必要とは限りません。 いくつかの要件は、検索インデックスから意味的に類似したコンテンツを取得することで満たされます。 たとえば、サービスのコンテキストでケースが作成される場合を考えてみましょう。 RAGパイプライン全体を実行せずに、ケース調査を担うサービスエージェントにサポート目的で類似ケースを表示するだけでも、非常に大きな価値を提供できます。
このような自動化を設定するには、フローが実行される際にリトリーバーを呼び出すフローにもとづいたソリューションが推奨されます。 クエリと類似した結果セットを生成することから、ケースや記事など、結果の出典をユーザーに提示することができます。




 






























    
    
        
            


    
    
    
    


    
        13.3 検索インデックスを使用した非RAGケース： 分類




 






























    
    
        
            

    

    
    
        
    検索インデックスを使用して、インテント検出、トピック注釈、またはケース分類などのテキスト分類を実施します。 分類のユースケースは、多くの場合、学習データセット（入力とクラスラベル）を使用して解決されます。 このデータセットでテキスト分類機能を学習させる代わりに、テキストをベクトル化することができます。 これらの入力をData 360にDMOのレコードとして保存し、検索インデックスに埋め込めるようにします。 検索操作は、クエリと埋め込み入力との間の意味的な類似性にもとづいて行われます。 しかし、「学習」入力のチャンクを返す代わりに、検索は元のクラスラベルを返します。 十分な結果の件数がある場合（50件や100件など）、「多数決」を行い、その結果セット内でどのクラスラベルがもっとも頻繁に出現するかどうかを確認することが可能です。 結果セット内のクラスラベルをその出現頻度で並び替えることで、分類の提案を提供します。 もっとも頻繁に出現するクラスラベルを選択するか、あるいはユーザーに対して上位3つのクラスラベルを選択します。
このシナリオでは、リトリーバーが使用されているSQLクエリ（COUNTにもとづく）をサポートしていないため、補足的なApexコードが必要です。 このコード例では、クエリを使用して上位50件の結果に出現する各クラスラベルの頻度をカウントし、そのカウント値で並べ替え、もっとも頻度の高いクラスラベルを結果として選択しています。






ConnectApi.CdpQueryInput input = new ConnectApi.CdpQueryInput();
input.sql = 'SELECT r.Label_c__c Label, COUNT(r.Label_c__c) AS counter FROM vector_search(table(Intent_Training_index__dlm), topic,'' , 50) v JOIN Intent_Training_chunk__dlm c ON v.RecordId__c = c.RecordId__c JOIN Intent_Training__dlm r ON r.Id__c = c.SourceRecordId__c GROUP BY r.Label_c__c ORDER BY counter DESC LIMIT 1;
                
ConnectApi.CdpQueryOutput output = ConnectApi.CdpQuery.queryANSISql(input);




 






























    
    
        
            

    
        
            


    
        本ガイドで紹介したベストプラクティスの概要
    



        
    

    
    
        
    
構造化コンテンツはUDMOではなくDMOに取り込みます。 長文テキスト列をチャンク化およびベクトル化し、他の列（メタデータ）はフィールドのプリペンド、事前フィルタリング、返却フィールドに使用します。 （セクション2.1）
インデックス化の前にコンテンツをキュレーションします。 （セクション2.2）
きめ細やかな説明とともに十分な詳細を使用する。
実際の事例を提供する。
論理的につながった文や段落、見出しで記事を構成する。
ナレッジ記事など、Salesforceオブジェクトのフィールドに構造化されたコンテンツを分散させる。
メディアに注釈を付ける。
コンテンツは焦点を明確にし、ユーザーの質問に沿ったものにする。
タイトル、見出し、小見出しを使用する。
ナレッジ監査を実施し、ガバナンスを適用する。
複雑なテーブルをJSONまたはHTMLに変換し、長いテーブルを分割する。


多言語コンテンツには多言語埋め込みモデルを使用します。 これにより、言語間で意味的な類似性を維持できます。 RAGのインデックス化および検索は、プロンプト応答生成よりも多くの言語に対応しています。 LLMはこれらすべての入力言語を理解しますが、応答生成、Trust Layer、AIエージェントの会話については、対応している言語は限られています。 （セクション2.3）
ADLは、ユースケースに正確に一致する場合にのみ使用します。 ADLは、RAGを活用したAIエージェントを構築する迅速な手段ですが、設定の柔軟性やコンテンツ対応には制限があります。 または、RAGソリューションを手動で設定します。 （セクション3.1）
すべてのリトリーバーがあらゆるユーザーのクエリに関連している場合、複数のリトリーバーを1つのプロンプトテンプレートに組み合わせます。 それ以外の場合は、複数のプロンプトテンプレートとそれに対応するエージェントアクションにリトリーバーを分割します。 エージェントアクションに適切な指示を提供し、正しいアクションが呼び出されるようにします。 （セクション3.2）
適切な説明、指示、および範囲を記載することで、範囲外の質問においてRAGアクションを呼び出すことを避けます。 これにより、ハルシネーションのリスクが低減され、AIエージェントのコストと遅延が削減されます。 （セクション3.2）
キーワード検索でセマンティック類似性検索を強化する必要がある場合は、ハイブリッド検索を使用します。 ハイブリッド検索は、商品名、企業用語、専門用語などのキーワードの類似性によって、セマンティック検索を強化します。 （セクション4.2）
カテゴリのために、ハイブリッド検索を単独のキーワード検索エンジンとして使用しないでください。 並列で実行されるベクトル検索は、意味的なコンテキストの欠如により結果を歪めます。 （セクション4.2）
ハイブリッド検索の必要性を検討します。 ハイブリッド検索は、実行時の遅延やコストの増加というトレードオフと引き換えに、検索結果の精度を向上させます。 （セクション4.3）
ランク付け要素である「最新性」と「人気度」を使用して、検索結果をさらに向上させます。 （セクション4.4）
意味的に一貫した完全な文が少なくとも1つ含まれている長文テキストのインデックスフィールドのみを使用します。 他のフィールドを、プリペンドされたフィールド、事前フィルターフィールド、返却フィールドとして使用します。 （セクション5.1）
インデックス化するフィールドは最小限に抑えます。 複数のフィールドに類似したコンテンツが含まれている場合は、もっとも詳細なもののみを選択します。 （セクション5.2）
より正確な検索のために、メタデータや質問を含む注釈の生成を必要とする、より複雑なコンテンツには「インデックス化の強化」を使用します。 （セクション5.4）
コンテンツが多言語でない限り、デフォルトの埋め込みモデルである、E5-Large-V2を使用します。 （セクション5.5）
追加の返却フィールドを使用してプロンプト拡張を改善します。 （セクション6.1）
（動的）事前フィルターを使用して、検索精度を向上させ、特定のレコードにコンテンツを集中させます。 （セクション6.2）
ユーザーが不正確または高度な検索クエリを入力した場合は、詳細検索モードを使用します。 （セクション6.3）
プロンプトエンジニアリングの手法を使用して、生成される応答の品質を向上させます。 拡張されたコンテンツにのみ従うこと、そのコンテンツにもとづいて推論すること、ならびに出力フォーマットに関する指示は、応答品質に大きな影響を与えます。 （セクション7.1）
ユーザーの質問を理解することを奨励。
そのコンテンツ内で関連性のある情報を探すことを推奨し、提供されたコンテンツにもとづいてLLMの応答を作成するよう明確に指示。
指定されたソースコンテンツに情報が存在しない場合の対応方法。
応答を作成する方法に関する手順。


ネストされた事後フィルターが必要な場合や、ネストされた事前フィルター、またはサポートされていないフィールドタイプや演算子を含む事前フィルターが必要な場合は、（ノーコードリトリーバーの代わり）にApexおよび/またはFlowによるプロンプト拡張を使用します。 （セクション9.1）
RAGの操作には、1) コンテキストウィンドウと 2) 推論能力にもとづいて、適切なLLMを選択します。 （セクション10.1）
リトリーバーやプロンプトテンプレートの呼び出しなどのアクションを活用することで、Flowでより複雑なRAGパイプラインを構築します。 Flowは、プロンプトテンプレートの代わりにRAGパイプラインのオーケストレータとなります。 （セクション11.1）
RAGソリューションのトラブルシューティングの際は、RAGの構成要素のチェーンに体系的に従います。 （セクション12.1）
エージェント層
ADL層
検索インデックス層
リトリーバー層


品質の問題が発生した場合は、RAG指標を使用して改善すべき領域を特定します。 （セクション12.2）
検索の問題に対するコンテキストの関連性
拡張およびプロンプト問題に対する忠実性
一般的なRAG問題に対する回答の関連性


RAGソリューションのデバッグ時に応答生成が不要な場合は、プロンプトビルダーで解決結果のみモードを使用します。 これにより、時間、コスト、労力を節約できます。 （セクション13.1）
以前に分類された例をインデックス化することで、テキスト分類のユースケースに検索インデックスを使用します。 新しいテキストを、もっとも類似した検索結果の上位50件または100件のクラスラベルにもとづいて分類します。 （セクション13.3）




 






























    
    
        
            

    
        
            


    
        謝辞
    



        
    

    
    
        
    Reinier van Leukenは、本ホワイトペーパーの内容をまとめるにあたり、多大なご協力をいただいた次の校正者の皆様に感謝の意を表します。 Eric Ivory-Chambers、Robin de Bondt、Jan van den Broeck、Alejandro Raigon、Vahe Ayvazyan、Giuseppe Cardace、Praveen Gonugunta、Kathryn Baker Parks、Debbie Symanovich。




 







































































































































    
        
            
                
                
                    
                    


    
        AIエージェントの詳細と、AIエージェントがビジネスにどのように役立つかをご覧ください。
    



                    
                
                
                
    
    
    
        
            
            
                
                    
                    
                        
    
    
    
        





    
    
        
        
    
        
            
            
            
            
            
            
            
            

            

            

            
                
            

            
                
            

            





    
        
        

    
    
    
    
    
        
    
    
    


    


        
    
        
    

        
    


    
        
            Guide
        
        


    
        
    
        
            
            
            
            
            
            
            
            

            

            

            

            

            



    



    
        
        

    推論、サブAIエージェント、指示、アクションに関するAgentforceガイド
    


    


        
    
        
    

    



        
        
    
    
    
        
    
        
            
            
            
            
            
            
            
            

            

            

            

            

            



    



    
        

        

    ガイドを読む
    
    
    
    
        
            
        
    
    

    



    

    
 

        
    
        
    

    
    


    

                    
                
            
        
            
            
                
                    
                    
                        
    
    
    
        





    
    
        
        
    
        
            
            
            
            
            
            
            
            

            

            

            
                
            

            
                
            

            





    
        
        

    
    
    
    
    
        
    
    
    


    


        
    
        
    

        
    


    
        
            Article
        
        


    
        
    
        
            
            
            
            
            
            
            
            

            

            

            

            

            



    



    
        
        

    エージェント型AIとは？
    


    


        
    
        
    

    



        
        
    
    
    
        
    
        
            
            
            
            
            
            
            
            

            

            

            

            

            



    



    
        

        

    記事を読む
    
    
    
    
        
            
        
    
    

    



    

    
 

        
    
        
    

    
    


    

                    
                
            
        
            
            
                
                    
                    
                        
    
    
    
        





    
    
        
        
    
        
            
            
            
            
            
            
            
            

            

            

            
                
            

            
                
            

            





    
        
        

    
    
    
    
    
        
    
    
    


    


        
    
        
    

        
    


    
        
            Article
        
        


    
        
    
        
            
            
            
            
            
            
            
            

            

            

            

            

            



    



    
        
        

    AIエージェントの構築方法
    


    


        
    
        
    

    



        
        
    
    
    
        
    
        
            
            
            
            
            
            
            
            

            

            

            

            

            



    



    
        

        

    記事を読む
    
    
    
    
        
            
        
    
    

    



    

    
 

        
    
        
    

    
    


    

                    
                
            
        
            
            
                
                    
                    
                        
    
    
    
        





    
    
        
        
    
        
            
            
            
            
            
            
            
            

            

            

            
                
            

            
                
            

            





    
        
        

    
    
    
    
    
        
    
    
    


    


        
    
        
    

        
    


    
        
            Blog
        
        


    
        
    
        
            
            
            
            
            
            
            
            

            

            

            

            

            



    



    
        
        

    LLMとCopilotだけでは救えない：エンタープライズAIで失敗している理由
    


    


        
    
        
    

    



        
        
    
    
    
        
    
        
            
            
            
            
            
            
            
            

            

            

            

            

            



    



    
        

        

    ブログを読む




 





































































































































    
        
            
                
                
                    
                    


    
        Agentforceで次のステップの準備を
    



                    
                
                
                
    
        
            
                
                    
                        


    
    
        
        
    
    
    


    
        


    
        AIエージェントをスピーディに構築
    



        
            
    エージェント構築の仕組みをライブラリで詳しくご紹介します。


        
    
    
        
              
    
        
            
            
            
            
            
            
            
            

            

            

            

            

            



    



    
        

        

    デモを見る
    
    
    
    
        
            
                
            
        
    
    

    



    

    
 

        
    
        
    

        
    


                    
                
            
        
            
                
                    
                        


    
    
        
        
    
    
    


    
        


    
        エキスパートのガイダンスを受ける
    



        
            
    迅速かつ安心して導入でき、ROIを確認できる形でAgentforceを始めましょう。


        
    
    
        
              
    
        
            
            
            
            
            
            
            
            

            

            

            

            

            



    



    
        

        

    詳細を見る
    
    
    
    
        
            
        
    
    
        
    

    



    

    
 

        
    
        
    

        
    


                    
                
            
        
            
                
                    
                        


    
    
        
        
    
    
    


    
        


    
        担当者にご相談ください
    



        
            
    お客様のビジネスニーズをお聞かせください。その答えを見つけるお手伝いをいたします。


        
    
    
        
              
    
        
            
            
            
            
            
            
            
            

            

            

            

            

            



    



    
        

        

    お問い合わせ

Agentforce 360

Agentforce

中小企業向け

Data 360

Agent 360 Platform

Slack

アナリティクス

カスタマーサクセス

Salesforceのパートナー

世界No.1のAI搭載CRM

世界No.1のAI搭載CRM

業種に特化したSalesforceのソリューション

業種に特化したSalesforceのソリューション

お客様事例

Trailblazer Stories

成功事例をご覧ください

成功事例をご覧ください

Agentforce World Tour Tokyo

Salesforce+でイベントを視聴（英語）

イベント情報

イベント情報

Trailhead で学ぶ

無料トライアルのご案内

はじめての方へ

サクセスナビ

関連リソース

Trailblazerになろう！

Trailblazerになろう！

コミュニティ

カスタマーサクセス

サポート情報

サポート情報

Salesforceのストーリー

企業理念

社会へのインパクト

Salesforceのストーリー

Salesforceのストーリー

国または地域を選択

Americas

Europe, Middle East, and Africa

Asia Pacific

国または地域を選択

Americas

Europe, Middle East, and Africa

Asia Pacific

国または地域を選択

Americas

Europe, Middle East, and Africa

Asia Pacific

チャプター 1

2. RAG向けコンテンツのキュレーション

チャプター 2

3. RAGを活用したAIエージェントの設計

チャプター 3

4. ハイブリッド検索

チャプター 4

5. 検索インデックスの最適化： フィールドの選択、チャンク化、ベクトル化

チャプター 5

6. リトリーバーの設定

チャプター 6

7. RAGとプロンプトエンジニアリング

チャプター 7

8. 引用 #ロードマップ

チャプター 8

9. リトリーバーなしのプロコードRAG

チャプター 9

10. RAGに適したLLMの選定

チャプター 10

11. Flow内のRAG

チャプター 11

12. RAGを活用したAIエージェントのデバッグとトラブルシューティング

チャプター 12

13. さらなるインサイト： RAGの最適化と非生成的ユースケース

チャプター 13

付録

5. 検索インデックスの最適化：フィールドの選択、チャンク化、ベクトル化