Einsteinが質問の答えをサポートしているチャットウィンドウが表示されたサービスコンソール

Agentforceの頭脳「Atlas推論エンジン」の仕組み

Agentforceの中心的な役割を担うのが、自律的でプロアクティブなAIエージェントです。AIエージェントはどのように機能するのでしょうか?詳しく解説します。

Shipra Gupta

AI、特に生成AIの世界では、猛烈なペースでイノベーションが起きています。業界は既存技術を洗練させることにより、会話支援型の自動化から、ロールベースの自動化へと急速に進化しており、労働力を増強しています。人工知能(AI)に人間レベルのパフォーマンスを発揮させるためには、仕事を的確にこなすために人間が持っている能力、すなわち主体性とは何かを理解することが重要です。人間はデータを解釈し、さまざまな選択肢を推論し、その上で行動することができます。このような自主性をAIに持たせるには、非常に高いレベルの知能と意思決定能力が必要です。

Salesforceでは、大規模言語モデル(LLM)と推論手法の最新技術を活用したAgentforceをリリースしました。Agentforceは、すぐに使えるAIエージェントのスイートです。専門的なタスクを実行するように設計され、自律的に行動するプロアクティブなアプリケーションであり、AIエージェントの構築とカスタマイズを行うためのツールを備えています。これらの自律型AIエージェントは、高度なレベルの思考、推論、計画、調整を行う能力を持っています。カスタマーサービス営業マーケティングコマースなどの分野で、AI自動化における飛躍的な進歩をもたらすのがAgentforceです。

Agentforceの頭脳に相当するAtlas推論エンジンには、さまざまなイノベーションが積み重ねられており、インテリジェントかつ自律的にアクションを調整してエンタープライズグレードの高度なAIエージェントソリューションを提供します。この記事では、Salesforce AI Research(英語)新しいウィンドウで開くで誕生したこのAtlas推論エンジンに使われているイノベーションについて解説します。

AgentforceのROIを試算

AIエージェントが自社の従業員と協力して働くことで、コストと時間をどれだけ節約できるかご覧ください。4つの簡単な質問に答えるだけで、Agentforceの効果を確認することができます。

Einstein CopilotからAgentforceへの進化

今年の初めにリリースされたEinstein Copilotは、現在では顧客管理(CRM)向けのAgentforceエージェントに進化しています。Einstein CopilotはChain-of-Thought reasoning(CoT)(英語)新しいウィンドウで開くと呼ばれるメカニズムでインテリジェンスを導き出す、生成AI搭載の会話アシスタントでした。このメカニズムにおけるAIシステムは、目標を達成するための一連のステップを含む計画を生成することにより、人間のようなの意思決定を可能にします。

CoTベースの推論を実行することでEinstein Copilotはワークフロー内で共同作成や共同作業を行うことができます。これによって従来のボットに比べてかなり進化しましたが、人間のような知能レベルには達していませんでした。CoTベースの推論ではタスクに応じた一連のアクションを含むプランを生成し、それらのアクションを1つずつ実行します。しかし、計画に誤りがある場合はユーザーにリダイレクトを依頼する方法が用意されていませんでした。会話が進んでもユーザーは新しく有用な情報を入力できないため、適応性がないAIエクスペリエンスとなっていました。

当社の営業組織(Org 62)に属する数千人もの営業担当者を対象にEinstein Copilotの厳格なテストを実施したところ、いくつかのパターンが浮かび上がってきました。

  • Copilotとの自然言語による会話体験は、予想どおり従来のボットよりもはるかに優れていましたが、真の人間らしさを実現するという究極の目標はまだ達成できていませんでした。もっと会話能力を充実させる必要がありました。
  • Copilotは、設定されたアクションでユーザーの目標を達成する点では優れていますが、会話の中で明らかになった情報に関するフォローアップの問い合わせを処理することができませんでした。対応可能なユーザークエリ数を増やすためには、コンテキストをより適切に使用する必要がありました。
  • より多くのユースケースを自動化するためのアクションを追加すると、Copilotのパフォーマンスは、レイテンシ(応答にかかった時間)と応答品質の両方で低下し始めました。メリットがありそうな数千ものユースケースやアプリケーションに効果的に拡張する必要がありました。

私たちはこれらの問題の解決策を見つけることに着手し、それがAgentforceの誕生につながったのです。

Agentblazerのキャラクター

Agentblazerコミュニティに参加する

世界中のAgentblazerとつながりましょう。AIスキルを高め、ユースケースを発見し、製品エキスパートの話を聞くことができるなど、さまざまなメリットがあります。AIの専門知識を高めれば、キャリアアップにつながるはずです。

Agentforce:推論の大きな飛躍

Agentforceは、業界初のエンタープライズグレードの会話型自動化ソリューションです。人間の介入をほとんどまたはまったく必要とせずに、プロアクティブでインテリジェントな意思決定を大規模に行うことができます。それを可能にしたイノベーションを紹介しましょう。

  • オーケストレーションのベースとなるReActプロンプトとCoTの比較:広範な実験とテストの結果、ReAct(推論と実行)スタイルのプロンプトの方が、CoT手法よりもはるかに優れた結果をもたらすことがわかりました。ReActメカニズムでは、ユーザーの目標が達成されるまでシステムが「推論、行動、観察」というループを繰り返します。このループを行う中で、システムは新しい情報を反映し、必要に応じて確認や質問を行いながら、ユーザーの目的をより正確に達成できるようにします。また、この手法では自然な会話に近い、流れるようなやり取りが行われます。
  • トピック分類:私たちはユーザーの意図や「やりたいこと」に相当するトピックという概念を導入しました。ユーザーがシステムに入力すると、その内容がトピックにマッピングされます。各トピックには、その要求を満たすために関連する命令、ビジネスポリシー、そして具体的なアクションが含まれています。こうしたメカニズムにより、タスクの範囲と対応するLLM用ソリューション空間が定義されるため、システムを容易に拡張することができます。トピック内には自然言語による命令が組み込まれており、これがLLMへの追加のガイドラインや制約として機能します。たとえば、特定の順序でアクションを実行する必要がある場合には、その順序をトピックの指示として設定できます。また、「30日以内なら無料で返品可能」などのビジネスポリシーがある場合は、その内容が命令としてLLMに渡されるので、それを考慮したユーザー対応が可能です。こうした概念により、AIエージェントは数千ものアクションを安全かつ確実に拡張できます。
  • LLMを活用した応答:以前のシステムはユーザーに対して直接応答することが制限されており、アクションの結果のみを返す形になっていました。この制約により、会話中の情報を基にした応答が難しくなり、対話の幅が狭まっていました。しかし、会話の履歴を参考にしてLLMが応答できるようにシステムを改善したことで、はるかに豊かな対話体験が可能になりました。その結果、ユーザーは過去の応答に対して確認や追加の質問をすることができるようになり、目標達成の確率が高くなりました。
  • 思考/推論:LLMに対して、なぜ特定の行動を選んだのか理由を求めるようにプロンプトを入力することで、ハルシネーション(幻覚)の発生を大幅に抑えられます。また、これにはLLMの判断過程の可視化というメリットもあり、管理者や開発者はAIエージェントが自分たちのニーズに合う動作をするように微調整できるようになります。Agent Builderのキャンバスにはデフォルトで推論機能が搭載されています。また、ユーザーはAIエージェントにプロンプトで追加質問できるので、推論の理由付けを得ることができるため、幻覚の発生が抑制され、AIエージェントの信頼性が向上します。

Agentforceが持つ特長

Atlas推論エンジン以外にも、Agentforceには以下のような注目すべき特徴があります。

  • プロアクティブなアクション:ユーザー入力によってAIエージェントをトリガーすることができますが、Agentforceエージェントは、ケースのステータスの更新、ブランドが受信したメール、会議開始前5分になった瞬間など、CRMまたはビジネスプロセスとルールのデータ操作によってもトリガーされます。これらのメカニズムによって、AIエージェントは高いプロアクティブ性を持ち、さまざまなダイナミックなビジネス環境で有用かつ展開することでフロントオフィス、バックオフィスの両方で活用できます。
  • ダイナミックな情報取得:ほとんどのビジネスユースケースには、情報の取得やアクションの実行が求められます。静的な情報をAIエージェントに供給する最も一般的なメカニズムの1つが「グラウンディング」です。しかし、動的な情報を活用する能力をエージェントに持たせれば、ユースケースやアプリケーションが飛躍的に拡大します。

    Agentforceは、動的情報を利用するためのいくつかのメカニズムをサポートしています。1つ目は、検索拡張生成(RAG)です。RAGを介してData Cloudの構造化データと非構造化データに対してセマンティック検索を使用することで、AIエージェントは外部データソースやデータベースから任意の関連情報を取得します。

    次に、Web検索やナレッジQ&Aなどの一般的な情報検索ツールの導入により、AIエージェントの複雑なタスクを処理する能力が向上しました。たとえば、Web検索を使用して企業や製品をオンラインで調査し、それを会社のルールやポリシーに関する内部知識と組み合わせて、連絡先に概要をメールするアクションを実行します。複数のソースからのデータを組み合わせることで、AIエージェントはビジネスタスクをより効果的かつ効率的に処理できるようになります。

    最後に、フロー、API、ApexクラスへのAIエージェントの展開が挙げられます。これにより、ワークフロー内のすべてのコンテキスト情報とさまざまなシナリオの情報をAIエージェントに渡すことができるため、カスタムソリューションを構築して各シナリオを個別に処理する必要がなくなります。こうしたメカニズムにより、AIエージェントは動的な情報を利用することができ、環境をより的確に理解することができ、その結果、インタラクティブ性が何倍にも向上します。
  • 人間の担当者への引き継ぎ:AIは非決定論的であり、ハルシネーション(幻覚)が発生することもあります。そこで、Salesforceは私たちは堅牢性に優れたEinstein Trust Layerを開発しました。これにより、有害性検出、ゼロデータリテンション契約、迅速なプロンプトインジェクションなどのメカニズムを提供します。当社ではLLMのエラーや幻覚を防ぐために、システムプロンプトにルールを組み込んでいます。しかし、これらのメカニズムがあるにもかかわらず、LLMはまだ100%正確ではありません。エラーが一切許されない重要なビジネスシナリオでは、人間にシームレスに引き継ぐことが重要であり、Agentforceはそれをネイティブにサポートしています。Agentforceは、「人間の担当者への引き継ぎ」を別のアクションとして扱うことで、任意のビジネスシナリオで会話を安全かつシームレスに人間に引き継げるようにしています。

Agentforceの次のステップ

Agentforceはまだ発展の初期段階にありますが、既に顧客に大きな革新をもたらしています。たとえば、WileyやSaks Fifth Avenueなどの顧客企業では、Agentforce Service Agentを導入後、ビジネスKPIが飛躍的に向上しています。Salesforce Researchや業界内でイノベーションや技術的進歩が進む一方で、私たちも急速に前進し、さまざまなイノベーションを活用してAIエージェントの堅牢性と知能を高めています。近い将来、お客様に提供する予定の機能は以下のとおりです。

  • AIエージェントを対象とするテストおよび評価フレームワーク:Agentforceのような複雑なAIエージェントシステムを企業に導入するには、非常に多くのテストと検証が必要です。そのため、アクションの結果、入力、出力、計画の精度、トピック分類、プランナーの状態をテストするための堅牢な評価フレームワークを開発しました。私たちはこのフレームワークの下でAIエージェントの精度、レイテンシ(応答時間)、サービスコスト、信頼性などの指標を最適化しています。流通している大半のフレームワークやベンチマークが数学や科学、一般的な知識の能力を評価するように設計されている中、私たちの評価フレームワークはCRMのビジネスユースケースに特化しています。さらに、私たちは世界初のLLMベンチマーク(英語)新しいウィンドウで開くを公開しており、現在はAIエージェント向けの評価フレームワークをお客様やパートナーに提供する準備を進めています。
  • マルチインテントのサポート:マルチインテントは、人間らしい会話メカニズムを再現するために重要な要素です。日常の表現には、無関係な目標が複数含まれることがよくあります。たとえば、「注文を更新して、サイズMのシャツを探してほしい」「ケースのステータスを更新して、トラブルシューティングの手順をお客様にメールしてほしい」「フライトを予約して、ホテルを確保してほしい」といった具合です。私たちは、LLMの自然言語理解能力や大きなコンテキストウィンドウのサポート、そしてトピックなどの革新的な概念を組み合わせることにより、信頼性、拡張性、安全性の高いソリューションをお客様に提供するための実験を続けています。
  • マルチモーダルのサポート:デジタルインタラクションの大半はテキストベースですが、音声や視覚に基づくインタラクションでは、より自然で人間的なやりとりを再現できるため、体験の豊かさが数段アップします。実際、マルチモーダル入力の同時処理技術の発展、応答時間の短縮、大きなコンテキストウィンドウ、高度な推論能力の向上により、マルチモーダルAI市場は2031年までに約36%(英語)新しいウィンドウで開く成長すると予測されています。マルチモーダルのサポートにより、企業は以下のようなユースケースでメリットをすぐに受けることが可能です。
    • 音声のユースケース:自動音声応答(IVR)から、生成AIを活用した音声サポート、従業員のコーチング、トレーニング、オンボーディングに移行します。
    • ビジョンのユースケース:製品の検索と比較、ユーザーインターフェース(Web、モバイル閲覧)、トラブルシューティング、フィールドサービスの問題解決。
  • マルチAIエージェントのサポート:AIエージェント同士のインタラクションは、現代のビジネスにおいて最も革新的な発展のひとつです。マルチAIエージェントシステムは、情報の取得、とりまとめ、処理を同時に実行する能力を持っているため、人間同士の引き継ぎによって逐次進行している現代の複雑で長い処理時間を大幅に短縮することが可能です。デジタルAIエージェントはこうした反復データ処理タスクに適用することができます。また、こうした処理に従事する人間をアシストして効率化することも可能です。

    Salesforceでははすでに、このようなマルチAIエージェントのパラダイムを営業プロセスに導入しています。AIエージェントはパイプラインを育成する営業開発担当者として、あるいは営業担当者に取引の最善の交渉方法についてアドバイスする営業コーチとして機能します。専門的なAIエージェントは、リードの認定、提案書の準備、販売後のフォローアップなど、販売プロセスの他の側面にも対応可能です。同様に、トラブルシューティング、フォローアップ、チケットの割り当てを行うAIエージェントと、顧客の問い合わせに対応し、人間のMRを支援するAIエージェントから成るサービスワークフローを構築することも可能です。

AIの第3の波に備える

Agentforceは予測型AI、Copilotに続く、AIの第3の波です。Agentforceを使用すると、お客様は会話のプロンプトに応答してアクションを実行するだけでなく、予測、計画、推論を行うAIエージェントを構築できます。人間の介入は最小限で済みます。AIエージェントは、ワークフローやプロセス全体を自動化し、意思決定を行い、新しい情報に適応することができます。これらはすべて人間の介入なしに行うことができます。同時に、これらのAIエージェントは、人間の担当者へシームレスに引き継ぎすることができるので、あらゆる事業部門でコラボレーションが促進します。Atlas推論エンジンを搭載したこれらのAIエージェントは、数回のクリックで導入でき、あらゆるビジネス機能やチームを強化および変革できます。