ソフトバンクのグループ会社で、企業向けの生成AI SaaSとコンサルティングサービスを提供し企業のAX(AIトランスフォーメーション)を支援する、Gen-AX(ジェナックス)株式会社のトップを務める代表取締役社長 CEOの砂金信一郎は、日本マイクロソフトやLINEでのキャリアを経て現職に就き、AIの可能性を追求する最前線にいる。
「りんな」プロジェクトや「LINE CLOVA」の立ち上げに携わり、データ活用・AI開発の重要性を肌で感じてきた砂金氏が描くAIエージェントの可能性、人がすべきことなどを一般社団法人AICX協会 代表理事を務める小澤健祐氏が聞きました。
砂金CEOのこれまでの軌跡
小澤:今日はAIビジネスに長く携わる砂金さんに、AIのトレンドに関する私見、持論をたくさん語ってもらえればと思います。その前に、もう知り合って長いですが、まずは砂金さんの経歴を振り返っていただきたいです(笑)。
砂金:わかりました(笑)。私は日本オラクル、ローランド・ベルガーを経て、日本マイクロソフトでAzureのテクニカルエバンジェリストを長く務めていたんですね。そのキャリアの中で、「りんな」プロジェクトに携わったのが、それまでのITベンダーやコンサルとは異なる業態のLINEに移籍するきっかけでした。

Gen-AX株式会社 代表取締役社長 CEO
東京工業大学卒業後、日本オラクル、ローランド・ベルガー、日本マイクロソフトでのテクニカルエバンジェリスト、LINE(現LINEヤフー)でのAIカンパニーCEOを経て現職。生成AIのビジネス向けSaaSと業務変革コンサルティングを手がけるソフトバンクの100%子会社Gen-AXの代表取締役社長CEOを務める。業務知識や接遇の高度なチューニングが必要なカスタマーサポートや照会応答業務の効率化・自動化を、自律型エージェントやLLM Opsなどの技術で実現する。このほか、2019年度より政府CIO補佐官、その後発足時よりデジタル庁を兼任し、インダストリアルユニット長を兼任。
「りんな」は、日本マイクロソフトが2015年に開発した女性型チャットボットです。「りんな」はLINEを活用したサービスだったこともあり、一緒に仕事していました。当時のAI性能の上がり方を見ていると、アルゴリズムの改善より良い学習データがあることが重要だと考えていました。
それで、多くのユーザーがいるB2Cサービスに行ったほうが、豊富なデータがありAIの進化に寄与できるのではないかという考えがあったのです。まさにそれがLINEということで、りんなの縁で気付いたらLINEに転職していました。
LINEでは、最初にメッセージングプラットフォームのオープン化の立ち上げなどを手がけ、その後スマートスピーカー「CLOVA」のチームに。主に B2B の事業化を担当していました。ちょうど「Alexa」や「Google Home」もマネタイズの方法を模索している時期ですね。
LINEは、日本語の音声認識技術は相当高いレベルのものを持っていたので、それを活用して現在の「LINE WORKS AiCall」のようなプロダクトを開発し、その後はOCRなど認識系AIを応用したプロダクトをいくつか開発しました。
小澤:そこからソフトバンクのグループに。
砂金:LINE在籍中、「Chat GPT-3」の登場前後にNAVERと共同でGPT-3クラスのモデルを自社開発する「HyperCLOVA」というプロジェクトを立ち上げることになったんです。
その頃、世の中では生成AIブームが到来しさまざまな前提条件が変わってきました。ソフトバンクでも生成AIの国産LLM(大規模言語モデル)を構築しようということで、国産LLMの研究開発を行うSB Intuitions株式会社が設立されることになりました。
私は、SB Intuitions株式会社には移らず ソフトバンクの100%子会社で、B2Bプロダクトの開発および展開を担うGen-AX株式会社でお客様のAIのビジネス利用を加速させるお手伝いをし、自社の事業を成長させる道を選び、現在に至っている。そんなところです。
小澤:ビジネスの現場とテクノロジーの最前線をつなぎたい、橋渡し役を担いたいというのが今の砂金さんのミッションですね。

一般社団法人AICX協会 代表理事
人間とAIが共存する社会をつくる」をビジョンに掲げ、AI分野で幅広く活動。著書『生成AI導入の教科書』の刊行や1000本以上のAI関連記事の執筆を通じて、AIの可能性と実践的活用法を発信。一般社団法人AICX協会代表理事、一般社団法人生成AI活用普及協会常任協議員を務めるほか、GoogleのAI「Gemini」アドバイザーとして生成AIの活用普及に貢献。Cynthialy取締役CCO、Visionary Engine取締役、AI HYVE取締役など複数のAI企業の経営に参画。日本HP、NTTデータグループ、Lightblue、THA、Chipperなど複数社のアドバイザーも務める。千葉県船橋市生成AIアドバイザーとして行政のDX推進に携わる。NewsPicksプロピッカー、Udemyベストセラー講師、SHIFT AI公式モデレーターとして活動。AI関連の講演やトークセッションのモデレーターとしても多数登壇。AI領域以外では、2022年にCinematoricoを創業しCOOに就任。PRやフリーカメラマン、日本大学文理学部次世代社会研究センタープロボノ、デヴィ夫人SNSプロデューサーなど、多彩な経験を活かした活動を展開中。
砂金:橋渡しというキーワードは良いですね。AIに関わらず、先進テクノロジーでR&Dの要素が強いものをビジネス化するのは一筋縄ではいかない、そのための理想的な組織を作るのも難しいものです。
テクノロジー側とビジネス側の連携で、いわゆるシーズドリブン型の「良い技術があるからビジネスを作ろう」というアプローチだけでは、成功は極めて難しい。一方で、単純にニーズだけを追いかけるのも他者との差別化が困難。
大切なのは「バランス」。PoCばかりでビジネスインパクトを生まないような仕事ではなく、過去にない新しい価値をもたらすテクノロジーをビジネスに生かせるように支援して成果を出す。AIの進歩が一気に進む今はとくに、私たちのような存在が必要だと確信しています。
AIに対して世間は冷たい?
小澤:ありがとうございます。それでは、本題に。まずは最近のAIブームをどう捉えていますか。
砂金:いろいろな観点がありますが、一つ挙げるとすれば、「みんなAIに冷たいな」って。
小澤:冷たい?
砂金:そう。情報をまとめる、データを作る際にAIのことを考慮していないことが多い気がします。例えばWordで文書を作る時、人間のために最適化されていて色をたくさん使い、図表をたくさん入れ、丁寧な日本語で回りくどく書く。
これはAIが理解するには迷惑この上ない。AIからすれば、マークダウンで箇条書きにして要点だけを記載してくれたほうが扱いやすいですから。
東大卒の新卒社員でも、いきなりビジネスの現場に出して「結果を出せ」と言っても出せるはずがありませんよね。どんなに地頭が良くても、スキルアップや経験を積むための環境とツールを用意してあげないと活躍できません。
AIだって一緒です。AIが正確に考え、答えを出すためのデータや環境を用意してあげないと進化しない。それをしていないのに、「AIは使えない」とか「期待した以上ではない」という声を耳にします。
また、データへの理解も不足しているように思います。「AIの進化にはデータが大事」というのはみなさんお分かりですが、もう少しデータに対する解像度を上げてほしい。
データの中に表記の不一致があったり、同じような内容なのに微妙に違う表現があったりすると、AIからするとどちらが正解なのかわからない。そういった整理されていないデータしか持っていない状態で、高度な処理をさせようとしても難しいんですよね。

AIの本流は「マルチエージェントシステム」に
小澤:生成AIの進化によって、知名度も使う人も一気に増えてきたけれど、それゆえに正しい理解がされていないのも事実。ここをもっと業界をあげて認知・理解させていかないとだめですね。2025年もAIに対する企業の関心度は高まるでしょう。予測AI、生成AIときて、今年はAIエージェントが注目を集めそうですが、砂金さんはどうみていますか。
砂金:AIエージェントの定義は、結構難しいんです。人によって思い描いているものが全然違うと感じています。
多くの人がイメージするのはパーソナルエージェント、自分の代わりに何かをしてくれる存在です。でも、その実現には「ライフログ」が必要不可欠なんです。自分しか知り得ない情報をスマホやPCに鍵をかけて保持していますが、そのデータをパーソナルエージェントに提供するかどうか。エンドユーザーが安心してデータを提供できるパーソナルエージェントをどう作るかが勝負になってきますね。
また、企業で使うAIエージェントを考えるとカギを握るのが、「マルチエージェント」。
AIエージェントを1つのAIエージェントで成立させるのは結構難しいです。例えばコールセンターって1人ではなく、複数の担当者が連携し合いながら活動していますよね。それと同じでコールセンターを自動化するとした場合、裏側では特定のドメイン知識を持つ複数のエージェントが連携して動くことになるでしょう。
小澤:Microsoftが2024年に開いたイベント「Ignite」(イグナイト)でも、トヨタ自動車のマルチエージェントが話題になっていて、9個の担当を作ったんですよね。エンジン担当、車両設計担当など、全部別のRAGシステムを作ったそうです。1つのエージェントにまとめすぎると、ぼやけてしまいますよね。
砂金:マルチエージェントの難しさは「自分ができないことを正しくできません」と手を上げることなんです。コールセンターでも、お客様がヒートアップしたり、問い合わせ内容が変わったりした時に「私だけでは対応できない」とスーパーバイザーに引き継ぐことがあります。
AIエージェントも同じで、「これはわかりません」と言って別のAIエージェントに処理を引き渡すべきなのに、自分で何とかしようとしてハルシネーション(誤った情報)満載の回答をしてしまうことがあります。
これを抑制するために、ドメインの範囲をできるだけ小さくするマルチエージェントシステムが生きるんです。これはプログラミングでのクラス設計と似ていて、どこまでを1つのまとまりとして持つかは、センスに依存します。
理想的には、現状の業務分析を分析することで自動的にエージェントシステムの分割単位を算出できれば良いのですが、領域定義は当面は人間による擦り合わせが必要となるでしょう。
AIエージェントとは。
この記事では、AIエージェントとは何か、なぜ注目を集めることになったのかについてわかりやすく解説しています。

砂金流LLMOpsの捉え方
小澤:もう一つ重要なキーワードになりそうなLLMOps(*)についても砂金さんの意見を教えてください。LLMOpsは、データ精度に関わる重要な話ですよね。非構造化データの活用は難しいけれど、RAGシステムを作れないわけではありません。人を介在させ、システムとして改善のプロセスを回す仕組みの体験設計が重要だと考えています。
*LLMOps:大型言語モデルの開発からデプロイ、メンテナンス、最適化までの一連の実践とプロセス
クレディセゾンの事例でも、担当者が必ずレビューすることで毎回精度が上がっていく仕組みを作っていました。AIだけに任せるのではなく、人を介した設計をすることの重要性を感じています。

砂金:「ヒューマンインザループ」と呼ばれる概念ですね。「Chat GPT-3.5」の頃から語られ続けてきたことですね。
OpenAIやGoogleは、アノテーションや人間によるレビュー、ファインチューニングに必要なデータについて理解しています。ただし、現状ではOpenAIもGoogleも、深いパラメーターまでファインチューニングさせてくれません。
今後、何らかの追加学習の仕組みができた時に、うまく活用できるかどうかで大きな差が出るでしょう。例えば、「これは良い」という質問と回答のペアは学習させやすいですが、「これは悪い」というデータを効果的に与えるのは難しいんです。
今のトランスフォーマーベースのモデルでは、「より良かったもの」をどう体系立てて蓄積するかが重要で、自然に任せていては、最適な仕組みは生まれてきません。
小澤:Metaが開発したLLM「LLama (ラマ)」が3.1から3.2になったり、Microsoftの小規模モデルが出てきたりすると、月1回のモデルアップデートや、企業ごとに週1回アップデートするような世界が2-3年で来る可能性がありますよね。
砂金:その通りです。今はLLMと小規模言語モデル(SLM)と呼んでいますが、これらを業務の中でうまく使い分ける時代が来ています。
これまではAPIのコストが高いからGPT-4ではなくMiniを使うといった、コスト面での考慮でしたが、これからは特徴ベースで考えるようになるでしょう。出版社が雑誌のテイストに合わせた言語モデルを作れるような世界です。
画像生成の分野では、すでにLoRAチューニングが比較的容易で、著作権管理は微妙な部分もありますが、特定の作風を出力するモデルが言語モデルより先に広まっています。
このように、パラメーターサイズが大きくないSLMであれば、自分たち用にチューニングしたいというニーズは高まり、そちらの方向に世の中は進んでいくと思います。
小澤:パーソナルエージェントを考えると、それぞれのWindowsデバイス上に、個別のモデルが搭載されてスタンドアローンで動いている可能性もありますよね。
砂金:そうですね。PCだけでなく、スマホの単体デバイスで、クラウドと通信せず、電池消費も少ないSLMが重要になってきます。
先ほど話したライフログの大半はスマホに入っています。LINEのメッセージや撮りためた写真などを、Appleのクラウドサービスにデータを提供せず、デバイス内で完結できれば、大きなブレイクスルーになりますね。

小澤:そうすると、データレイヤーのあり方も大きく変わってきますね。モデルが小さくなっていく中で、データの扱いも再考しなければならない。AGI(人工汎用知能)への道のりは、意外と複雑で簡単ではないかもしれません。
砂金:その通りです。ある程度の予測はできますし、それに対して準備もしていく必要があります。データを貯めておかないと、チューニングできても機能しないでしょうし。
しかし、最も大切なのは、いつ何のビッグウェーブが来るかわからないので、柔軟性の高い状態を維持することです。特定の技術にロックインされないよう、新しい技術が出てきた時にすぐに差し替えられる、あるいは最初から差し替え可能なツールを使うことが重要なんです。
昔のミドルウェアのように、裏側の物理実装は変わっても、表側のアプリケーションは隠蔽できるような仕組みを意識しています。
小澤:将来的には、会社を超えた動きも必要になってくるかもしれません。国家戦略や業界団体でのAPI連携の仕方なども考えていく必要がありそうですね。
砂金:ヨーロッパならGDPR(EU一般データ保護規則)のような標準を作りますが、日本の場合は少し文化が違いますね。みんながやっているからそれに合わせていくというアプローチです。
理想を言えば、グローバルビッグテックのプラットフォームの上で踊らされるのではなく、日本のSaaSプレイヤーが対等な立場で関係性を築けると良いんですが、まだ実力が十分に醸成されていない部分もあります。
それでも諦めずに、柔軟に、そして前向きに取り組んでいくことが大切だと考えています。

「カンニング」ではないAIの使い方
小澤:これまでのお話を聞いていると、人間がすべきことがみてきた気がします。
砂金:そうですね。人間の仕事は、「ノイズを入れる」こと、つまり新しい知見をAIに教えることになるでしょう。今までの繰り返し作業はAIエージェントに任せればいい。ただし、AI が持っている知識だけでは解決できなかった領域を見つけ、そこにデータを提供できた人には、AIを賢くした貢献として、きちんとインセンティブが支払われるべきですね。
小澤:堀江(貴文)さんも「人間は最適化されたところじゃない方に行くべきだ」と言っていましたね。AIが確からしいことをできても、それが面白いとは限らない。むしろ、全てのビジネスが「成功する領域」と「成功しないかもしれないが自分が楽しい領域」があるなら、楽しい領域をやりたい人はたくさんいるはずです。
砂金:そうですね。今のトランスフォーマーベースの生成AIは、統計的な手法で「みんなが期待する答え」を出すことはできます。しかし、それ以外の領域を人間が楽しみながら、気づきや発見で埋めていく。そして、それをAI側にも理解してもらうんです。
これは単なるビジネスロジックの左脳的な話だけでなく、感情や感性といった右脳的な部分も含めて、AIが機能として持てるようになってほしい。孫さんがソフトバンクワールドで語った「AIエージェントの5段階」の上位3つ、つまり「感情を理解して人に寄り添い、最終的には人類の幸せのために役立つAI」を目指すなら、人間の感情的な部分への理解も必要になってくるでしょう。

小澤:今後求められるスキルについてはどのようにお考えですか。
砂金:「ノイズになれる力」というか、常にいろんな挑戦をしている中で奇想天外な発想ができる人材が重要になってくると思います。
アイデアは豊かなのに、これまでは伝え方が整理されておらず、自分の価値をうまく伝えられなかった人たちが、生成AIやエージェントを通じてコミュニケーションを取ることで、適切に整理された状態で表現できるようになる。
そこに自分のノイズ、十分には整理されておらずAIには理解しづらい部分を提供できる能力を持つ人材が重視されるのではないでしょうか。
小澤:日本の場合、受験勉強のような規定路線のキャリアが多いですが、武蔵野大学のアントレプレナーシップ学部のような教育の重要性も高まりそうですね。
砂金:そうですね。AIの文脈だけでなく、世の中で言われている「問いを立てる力」、課題発見能力が非常に重要です。

以前、「のび太力が大事」という話をしたことがあるんですが、ドラえもんが生成AIで何かをやってくれるとすれば、のび太くんの良いところは「こういう状況を解決すればジャイアンに勝てる」とか「しずかちゃんにモテる」といった課題発見の力があることです。
解決力がないからドラえもんの道具を使うわけですが、人間に必要なのは「ここが勝負どころだ」「ここが重要なポイントだ」というところを指し示す力、つまり課題発見力なんです。
小澤:例えばChatGPTもカンニング的に使ってしまう人が多いですが、単に分からないことを聞くだけ、既存のプロセスに当てはめるだけではない使い方が重要というか。問いを立てられる人は生成AIとの相性がとてもいいですよね。
砂金:特に意思決定権者の方々にとって、生成AIはわからないことを調べる検索ツールというよりも、思考を深めるための壁打ち相手として有効です。
部下に弱みを見せにくかったりと職位が上の人は孤独なものですから、人間に相談するよりもAIに相談しながら、自分の思考を整理する相手として非常に優れていると言えます。
小澤:問いを設計し、その問いを事業を通して解決していくプロセスを回せる人材が増えていくことが望ましいですね。それは単なる答え合わせではない、カンニングではない生成AIの使い方です。
砂金: まさしくその通りです。データの扱いや契約に関して十分確認した上で、自分の思考をより深められる相手として活用していく。結果としてAIを育てながら人間側も成長する。これは特に経営者層にとって有効な使い方だと考えています。
【5分で解説】Salesforceの自律型AIエージェント “Agentforce”とは?
SaleforceのAgentforce(エージェントフォース)は、自律型AIエージェントを作成して展開するための新しいプラットフォームです。自律型AIエージェントは、ユーザーに代わって業務を実行し、複雑なタスクを自動で処理できます。その様子を、デモでわかりやすく紹介します。
