Skip to Content
フッターにスキップ
0%

Applied AI(応用人工知能):企業活動におけるAIエージェント構築の教訓

Applied AI: Lessons from Building Agents in the Enterprise

AIエージェント時代における実践者向けガイド

※本記事は2026年3月24日に米国で公開されたApplied AI: Lessons from Building Agents in the Enterpriseの抄訳です。本記事の正式言語は英語であり、その内容および解釈については英語が優先されます。


現在、AIエージェントについて多くの喧騒が渦巻いています。あらゆるベンダーがAIエージェントを掲げ、あらゆる基調講演がその可能性を約束しています。しかし、実際のビジネス成果に対して、本番環境で大規模に動作するAIエージェントを実際にリリースできている組織はごくわずかです。Salesforce は、それを実現しました。そして、そのプロセスで学んだことは、業界のほとんどの企業がこの概念を誤解しているということです。

本記事は、製品の売り込みではありません。世界最大級のエンタープライズソフトウェア企業の一つである自社でAIエージェントを構築・展開する中で得た苦労の末の教訓をまとめたものです。私たちはカスタマーゼロ(最初の顧客)として、自社製品をいち早く活用し、現実のシナリオでテストし、微調整を行い、その教訓をプラットフォームへ直接フィードバックしています。お客様が同じ過ちを繰り返さないよう、私たちは社内で失敗を経験してきました。このガイドにあるあらゆる知見は、実験と不可欠な試行錯誤を通じて洗練された、規律ある戦略的計画の結果です。

これらの教訓は、5人のチームを運営していても、1,000人の組織を運営していても適用できるものです。原則は同じであり、陥る間違いも同じです。そして、正しく対応できた時に得られる機会は計り知れないものとなります。


1. AIエージェントはソフトウェアではない

これは、まず第一に、そして最も重要に理解すべきことです。ソフトウェアは決定論的です。関数を書き、入力を渡せば、毎回同じ出力が得られます。それが信頼性の源であり、同時に限界でもあります。

AIエージェントは根本的に異なります。AIエージェントは独自の推論能力を持ち、コンテキスト(文脈)を解釈します。生成される回答にはばらつきがありますが、そのばらつきはバグではなく機能です。厳格なロジックが通用しない複雑で曖昧な現実のビジネスの状況において役立つのが、AIエージェントの特性なのです。

問題は、多くの企業リーダーがいまだにAIエージェントをソフトウェアの導入と同じように扱っていることです。彼らは決定論的な挙動を期待し、一度設定すればあとは放置できると考えています。そして、AIエージェントが予想外の行動をとると、それを失敗と呼びます。これは、新しく採用したアナリストが確認の質問をしてきたことに驚くようなものです。

メンタルモデルを次のように切り替える必要があります。AIエージェントの管理は、従業員の管理に近いということです。適切に指導し、コーチングするほど、パフォーマンスは向上します。明確で質の高い指示書(ブリーフ)は、より良い成果を生みます。積極的なモニタリングは、ミスの早期発見につながります。何が良くて何が悪いか例を示すキャリブレーション(調整)することにより、時間の経過とともに改善が促進されます。そして、単一のAIエージェントが多すぎるタスクで過負荷になった時の解決策は、無理に働かせることではなく、別のAIエージェントを雇うことです。

私たちが目にしてきた最も優れたAIエージェントの開発者は、優れたマネージャーのように動いています。彼らは、有能なリーダーが組織を調整するように、専門化されたAIエージェントのチーム全体で業務割り当てを設計し、それらを調整します。これこそが、可能性を解き放つ鍵となります。


2. 「職種」ではなく「ジョブ理論(Jobs to Be Done)」の単位で考える

一つの万能なAIエージェントを構築して、人が担う役割(職種)を丸ごと代替できるという神話が根強く残っています。しかし、今日時点でも、おそらく今後長い間も、それは不可能です。企業において人が果たす役割は、それぞれ異なるコンテキスト(文脈)、判断基準、例外ケースを持つ数十の個別のタスクで構成されています。一つのAIエージェントで仕事全体を自動化しようとすることは、あらゆる面で凡庸な結果を招く方法となります。

仕事を構成要素であるタスク、つまり特定の「片付けるべき仕事(Jobs to Be Done)」に分解し、それぞれをマスターするAIエージェントを構築した時に画期的な進歩が訪れます。

Salesforce の内勤営業(SDR)チームを例に挙げてみましょう。SDRは、潜在顧客とつながるための最前線です。彼らは日々の業務で、見込み顧客との会議のスケジュール調整や製品情報の共有、初期の適格性確認(クオリファイング)の対話、有望なリードのアカウント営業チームへの引き継ぎ、通話記録の作成、Salesforce 内での商談作成など、多くの業務を行っています。

私たちが「Engagement Agent(エンゲージメントエージェント)」を構築した際、人の SDR が業務で行っていたいくつかのシナリオにおける、特定の測定可能なタスクに焦点を当てました。目標は、より多くの顧客と接点を持つことで、SDRチームがノルマを達成できるよう、そのキャパシティを拡大することでした。通常であれば SDR が他の顧客対応のために手を止めなければならない場面でも、エンゲージメントエージェントが、フォローアップを継続するようにしました。人のSDR チームには対応しきれない見込み顧客に対してAIエージェントがアプローチし、顧客が会議を予約する準備が整うまでエンゲージメントを維持しました。また、AIエージェントは、顧客からの最初の製品に関する質問に答えることで、営業チームと対話する準備を整える支援を行いました。

結果は一目瞭然でした。エンゲージメントエージェントの初期のパイロット運用では、開始後わずか数ヶ月で年換算1億2,000万ドル以上のパイプラインを創出しました。これは、 SDR そのものになろうとしたのではなく、特定の SDR の業務を極めて高い水準で遂行した結果です。当社の SDR チームは、エンゲージメントエージェント無しでは、目標を達成することはできなかったでしょう。

一晩で成功したわけではありません。最初のバージョンでは、AIエージェントは人の SDR の下位10%にしか上回ることができませんでした。改善するために、私たちはトップセールスの行動を分析しました。どのように優れたメールを作成し、適切な見出しを作り、コール・トゥ・アクション(CTA)を提示しているか。それらの行動がいかにしてより多くの顧客のアポイントメントや収益につながっているかを測定しました。継続的な測定と実験を通じて、エンゲージメントエージェントを磨き続けました。何が有効か分かると、その知見を製品に組み込みました。今日、そのAIエージェントはそれらのタスクにおいて、営業担当者の90%を凌駕しています。私たちは自分たちのためにエンゲージメントエージェントを構築し、自社の経験を通じて完成度を高め、その洗練されたバージョンをお客様に提供しています。


3. AIエージェントの習熟度の測定

AIエージェントがソフトウェアというよりも従業員に近い存在であることを受け入れるなら、その測定も従業員と同じように行わなければなりません。つまり、ビジネスのコンテキスト(文脈)とは無関係な一般的なベンチマークを実行するのではなく、特定のタスクに対する「習熟度(コンピテンシー)」を評価するということです。

コールセンターを例に考えてみましょう。新人スタッフは固定のスクリプトに沿って業務を行います。彼らは狭いガードレールの中で働き、その範囲内での遵守率や解決率で評価されます。専門知識が深まるにつれ、柔軟性が認められるようになります。スクリプトから外れることも許され、より複雑な顧客の状況に対応できるようになります。彼らの習熟度は、品質基準を維持しながら、いかに難易度の高いケースを解決できるかによって測定されています。

AIエージェントも、これと同じ厳格さで比較評価されるべきです。あるタスクを始めたばかりのAIエージェントは厳密に制限され、すべての出力がレビューされるべきです。単純なチケットを正確かつ一貫して解決し、習熟度を示していくにつれて、より大きな裁量を与えます。時間の経過とともに、優れたAIエージェントは単純な問い合わせ対応を卒業し、以前はベテランの人による介入が必要だった複雑で多段階にわたる顧客ケースを解決できるようになります。

AIエージェントにこのレベルの厳格さを適用したことは、Salesforce 自社の組織を映し出す鏡となりました。AIエージェントの成功は、人の基準(ベースライン)に照らして測定しなければならないという事実が浮き彫りになったのです。AIエージェント導入の過程で、人が業務で行っているすべてのタスクよりもAIエージェントに関するデータのほうが詳細である場合が多いことが分かりました。今日のチームの業務における卓越した姿を厳密に定量化することで、AIエージェントが実際にその使命を果たしているかどうかを測定できるのです。

これは理論上の話ではありません。現在、Salesforce 内部で習熟度モデルを構築している実際の手法です。重要な指標は、AIエージェントが「賢い」かどうかではありません。AIエージェントが、特定の事項を、信頼性高く、人のパフォーマンスと同等またはそれ以上のレベルで遂行できるか、どうかです。


4. アバンダント エンタープライズ(豊かな企業)

ここから経済性が非常に興味深いものになり、ほとんどのエグゼクティブが、何が可能となるかをいまだ過小評価している部分です。

私たちが共に仕事をするすべてのビジネスリーダーは、もし人員が無制限にいたらやりたいことのリストを持っています。例えば、「パイプラインにあるすべての顧客を調査する」「すべてのデータ資産を監査する」「すべての従業員にパーソナライズされたテクニカルアシスタントを提供する」「スコアリングの閾値を超えたリードだけでなく、すべてのリードへプロアクティブなアウトリーチを行う」などです。これらは空想ではありません。明確な投資対効果(ROI)が見込める戦略です。ただし、人の労働力という経済性の中では正当化できませんでした。

AIエージェントはこの方程式を覆します。オンデマンドのインテリジェンスのコストが桁違いに下がると、これまで棚上げされていた数百の施策の計算が変わってきます。投入するに見合わないとされていた機能が突然、導入する価値のあるものへと変わります。

私たちが営業エージェントに「Account POV(取引先分析)」を導入した際、営業チームは新たな一貫性、品質、そしてスケールを手に入れることができました。手作業による取引先分析は、労働集約的で完了するまでに4〜5時間を要していました。すべての取引先をカバーすることはできず、品質にもばらつきがありました。現在では、すべての取引先に対してエキスパートレベルのPOVが自動生成され、100%のカバー率を実現しています。

私たちはこれを「アバンダント エンタープライズ(豊かな企業)」と呼んでいます。これは、これまでは数学的に不可能だったレベルの網羅性とレスポンスで運営される組織のことです。戦略が不健全だったからではなく、コスト構造がそれを許さなかった制約が、AIエージェントにより解消されたのです。

リソースが豊富な Salesforce においてさえ、エンゲージしきれなかった潜在顧客や、大規模には対処できなかったデータ品質の問題が存在していました。AIエージェントがそれを変革したのです。そして、私たちはまだその初期段階にいます。


5. 信頼、オブザーバビリティ(可観測性)、AIエージェント開発ライフサイクル

信頼なくして、これらは成立しません。そして、確率論的なシステムにおける信頼は、勝ち取るべきものです。

AIエージェントは決定論的ではないため、本質的にモデルドリフトの影響を受けます。基盤となるモデル、受信するデータ、または動作するコンテキスト(文脈)のわずかな変化によって、出力の品質が低下することがあります。ハルシネーション(幻覚)が発生し、正確性が低下します。積極的に監視していない限り、目に見えない形でパフォーマンスが劣化していくのです。

だからこそ、オブザーバビリティはオプションではなく、不可欠な基盤です。すべてのAIエージェントの出力に対して包括的なデータ測定が必要です。ビジネスへ影響が出る前にパフォーマンスの低下を検知するリアルタイムのモニタリングが必要です。そして、データが示す内容に応じて、制約を調整し、新しい例で再学習させ、スコープを狭めるといったダイヤル調整ができる能力が必要です。

私たちは、これをエージェント開発ライフサイクル(Agent Development Lifecycle: ADLC)として形式化しました。核となる原則はシンプルです。自律性は段階的に付与されるということです。AIエージェントはまず、人間による厳格な監視の下で運用が開始されます。特定のドメインにおいて、スピードと正確性における人によるベースラインに照らして習熟度が証明されるにつれて、より高い独立性を獲得します。これは一度限りの評価ではありません。測定、キャリブレーション、そして段階的な信頼構築という継続的なプロセスです。

ADLCは、基盤モデルの確率論的な性質と、企業運営における決定論的な期待との間の架け橋となります。これによって、許容できないリスクを冒すことなく、実験から本番運用へと移行できるのです。


6. 予測的習熟度(プレディクティブ・コンピテンシー)の時代

将来を見据えた時に最も興味深いのは、AIエージェントが今日できることではありません。その軌道がどこへ向かっているかです。

私たちは、企業内における人とマシンの関係の根本的な変化に向かっています。AIエージェントの習熟度が高まるにつれ、人の役割は実務を行うことから、実務を行うAIエージェントをメンタリングすることへと移行します。将来の優れたマネージャーは、何人の部下を率いているかではなく、人の才能と並行していかに効果的にAIエージェントのチームをオーケストレーションしているかで評価されるようになるでしょう。

目的地は、私たちがプレディクティブ・コンピテンシー(予測的習熟度)と呼ぶものです。これは、指示に反応するだけでなく、ビジネスニーズを先読みするAIエージェントです。入力に対して出力を返す現在の問題解決モデルとは異なり、未来のAIエージェントは企業全体のパターンを認識し、プロアクティブにインサイトを提示し、ワークフローを開始し、問題が表面化する前に解決します。これは SF の世界ではありません。構成要素は今日、すでに存在しています。欠けているのは、これらのシステムをいかに展開し、測定し、信頼するかという点だけです。

Salesforce は、このエコシステムを先導しています。Salesforce の現在のソリューションは、確率論的モデルと決定論的なビジネスニーズの間のギャップを埋めるように設計されています。私たちが構築するあらゆるツール、展開するあらゆるAIエージェントは、企業の運営能力が人の判断力に匹敵し、多くの領域でそれを凌駕する未来への一歩なのです。

本シリーズの今後の記事では、この変化のメカニズムについてさらに深く掘り下げていきます。

  • 第2回:エージェント開発ライフサイクル(ADLC):AIエージェントのテクノロジーとデータ駆動型のメンターシップについて詳しく解説します。
  • 第3回:労働力の変革:人が実行者からAIエージェントの管理者へと移行する際、役割がいかに進化するかを分析します。
  • 第4回:有効性の測定:非決定論的な世界における信頼、オブザーバビリティ、およびパフォーマンスを定量化するための新しいフレームワークを提示します。

Salesforce は実践者として、ゼロから構築に取り組んでいます。カスタマーゼロとして、より自律的で有能、かつ豊かな未来に向けた企業の変革を導くために、この道のりをリアルタイムで記録していきます。

本記事、または公式に言及されている未提供のサービスや機能は現在利用できないものであり、予定通りに、または全く提供されない可能性があります。お客様は、現在利用可能な機能に基づいて購入をご判断くださいますようお願いいたします。