Skip to Content

LLMをまだファインチューニングしますか?もっと良い方法、あります。

ベクトルデータベースは、AIを成功に導く
AI 時代に向けて構築されたベクトルデータベースは、すべてのビジネスデータに簡単にアクセスして分析できる方法で情報を保存します。

AIのファインチューニングにおける次なる飛躍は、全くチューニングしないことかもしれません。ベクトルデータベースを使用することで、すべてのビジネスデータに簡単にアクセスし分析できるようになります。

あなたは購入した商品をまた売りつけようとするプロモーションメールを受け取ったことがありますか?同じ質問を異なる相手から受けて何度も答えた経験はありますか?

大規模言語モデル (LLM) は、企業の業務内でより高いレベルの情報共有とパーソナライゼーションを提供することで、これらの煩わしさを解消することを目指しています。

問題は、OpenAIのChatGPTやGoogleのBardなど、多くの企業で使用されているLLM が、インターネット上で入手可能な汎用データを使用して構築されていることです。

企業内の独自データを活用できないため、その上に構築されたAIは顧客が期待する回答を提供できません。

また、一般的なデータは常に最新であるとは限りません。たとえば、ChatGPTのデータは2023年4月までしかありません(2024年5月時点)。

Salesforce、企業の生成AI活用の信頼性と柔軟性をさらに高めるEinstein 1 StudioおよびData Cloudの新機能を日本市場で提供開始

既製のLLMを自社のニーズに合わせてカスタマイズするには、自社のデータをAIモデルに組み込む必要があります。ファインチューニングと呼ばれるこのプロセスは、顧客にとってより良い結果をもたらすかもしれません。しかし、費用と時間がかかり、信頼性の問題も生じる可能性があります。

そこでもっと良い方法があります。ベクトルデータベースは「AI時代の新しいデータベース」であり、ファインチューニングのあらゆる利点を提供し、プライバシーの懸念を軽減し、データの統一を支援し、時間と費用を節約します。

LLMのファインチューニングとは

LLM のファインチューニングとは、顧客の感情分析や患者の健康履歴の要約など、特定のタスクをより良く行うためにLLMをトレーニングすることです。 

ファインチューニングでは、モデルに完了させたいタスクに関連するサンプルまたはデータをモデルに公開します。 たとえば、法律事務所は、法的条項や条件に関する情報を使用して LLM をファインチューニングし、文書から特定の情報を抽出できるように訓練することができます。

しかし、ファインチューニングにはコストがかかり、多くの計算能力、特定の専門知識、追加のインフラが必要です。また、大規模モデルはトレーニングに多くの時間を必要とするため、時間もかかります。モデルが大きくなるほど、必要な時間も長くなります。

【徹底解説】ビジネスに最良のAI、Einsteinの活用法を知り尽くす

さらに、ファインチューニングは根本的な欠点、つまり統合されたデータの欠如に対処できません。なぜ統合されたデータにこだわる必要があるのでしょうか?なぜなら、企業データが組織内のさまざまな場所にサイロ化されていると、顧客はバラバラで反復的な体験を得ることになるからです。

Salesforceの製品管理担当副社長であるラーフル・オーラドカール氏は「ファインチューニングはまだ未知であり、その利点は証明されていません。顧客に関連するデータを使用してモデルをファインチューニングすると、顧客データの一部をモデルに注入することになり、実際に多くの信頼性の問題が生じます」と述べています。 

ベクトルデータベース

ベクトルデータベースは、LLMやプロンプトにダイレクトに接続することが可能です。

 ベクトルデータベースと呼ばれる理由は、さまざまなタイプのデータをベクトル(異なるデータを詳細に記述するタグ)に変換し、これらベクトルを整理し保存するためです。データの起源に関係なく、大量のデータの中から関連情報を見つけるのに役立ちます。

たとえば、大規模なサプライチェーンを管理する企業は、ベクトルデータベースを使用して輸送ルートを分析し最適化できます。ベクトルデータベースには交通パターン、天候、通行止めに関する情報の保存が可能です。

あるいはセルフサービスページのAIチャットボットは、適切なソースから適切なタイミングで関連データを合成するため、顧客がアップグレードや特別オファーの対象かどうかを知ることができます。

EinsteinとData Cloudでビジネスに使えるAIを。

このように、ベクトルデータベースによりファインチューニングの必要がなくなり、すべての企業データとCRMが一気に統合されます。

これは、AIプロンプトから得られる出力(回答)の正確性、完全性、効率にとって非常に重要です。

その理由は次の通りです。 企業データの90%は、PDF、テキスト文書、動画、電子メール、ソーシャルメディアへの投稿など、いわゆる非構造化フォーマットで保存されており、ビジネスアプリやAIモデルにはほとんどアクセスできないものです。構造化され整理された形式を持たないため、LLMが分析することはほとんど不可能です。

「非構造化データは企業にとって超貴重なものですが、それを活用するのは非常に困難です。企業はこの非構造化データに命を吹き込みたいのです」とオーラドカール氏は言います。

企業独自のデータは、エンタープライズ LLMを構築するための基盤です。ベクトルデータベースは、AIがこれらのデータを理解しやすく分析しやすい方法で保存し処理することを可能にします。

これにより、ビジネス価値とROIが向上します。非構造化データと構造化データを組み合わせ、あらゆるビジネスアプリケーションでAI、自動化、分析を強化します。このようなすべての情報にアクセスできるようになれば、より良い意思決定が可能になり、より良いビジネス成果につながります。

Data Cloudで、AI時代を勝ち抜く

※本記事は米国で公開された “Fine-Tuning Your LLM? There’s a Better Way” の抄訳版です。本ポストの正式言語は英語であり、その内容および解釈については英語が優先されます。

ビジネスに役立つコンテンツを定期的にお届けします