データプラットフォームのガイド
データプラットフォームとは、データを効果的に管理、分析、使用するための基盤です。安全で拡張性に優れた、ビジネス向けのデータソリューションを実現します。
データプラットフォームとは、データを効果的に管理、分析、使用するための基盤です。安全で拡張性に優れた、ビジネス向けのデータソリューションを実現します。
データプラットフォームは、組織のデータを管理、保存、連携、有効化するように設計されたシステムです。膨大な量のデータからビジネス価値を引き出すための基盤となります。この場合の具体的なビジネス価値は、顧客やビジネスの全体像の把握や多くのユースケースの支援まで多岐にわたります。たとえば、AI、エージェント型AI、アナリティクスのサポート、意思決定の根拠となる情報の提供、営業、サービス、マーケティング、コマース全体での自動化の促進などが挙げられます。データプラットフォームは、データの収集、処理、分析方法を改善することで、データをライフサイクル全体でスムーズに管理して使用できるようにします。
こうしたプラットフォームは、組織全体でデータの統合やサイロの解消を実現するために重要な役割を果たします。また、あらゆるグループやステークホルダーがデータにアクセスして使用できる環境も確立します。
一般に、データプラットフォームアーキテクチャには以下のような構成要素が含まれます。
データプラットフォームインフラストラクチャには、クラウドまたはオンプレミス環境、ネットワーク、ストレージシステムが含まれます。これらが互いに連携し、データをリアルタイムまたは一括で取得、処理、提供します。最新のデータプラットフォームインフラストラクチャは、データの増加と複雑化に合わせて拡張できるように設計されています。さらに、安全かつコンプライアンスに準拠したデータ処理も実現します。
データプラットフォームは、以下の段階ごとに、データの収集と管理を支援します。
データの取り込みは、データを収集してプラットフォームにインポートするプロセスです。すべてのデータワークフローのスタート地点になります。エンタープライズシステム、アプリケーション、データレイク、ウェアハウス、ソーシャルメディア、IoTセンサーなど、さまざまなソースからデータを収集する作業が該当します。通常、データは以下の方法で連携されます。
一括処理は、従来の抽出-変換-ロード(ETL)または抽出-ロード-変換(ELT)パイプラインを使用して処理するのが一般的です。
取り込んだデータを中央リポジトリに保存します。この場合、拡張性、堅牢性、アクセス性を備えたリポジトリが理想です。以下のようなリポジトリが想定されます。
未加工のデータは、事前にクリーニング、標準化、エンリッチ化しないと、有効に活用できません。このデータ変換には、以下のステップが含まれます。
Apache Sparkなどのツールは分散データ処理を得意とし、SQLは構造化された変換で効果を発揮します。
次のプロセスが含まれます。
こうしたプロセス自動化ツールを駆使してデータインテグレーションを加速することで、データを速やかに統一できます。同じ小売会社の例で考えると、データアナリティクスとAIによってデータを分析することで、顧客の好み、購買行動、統計情報などの詳細を含む、統一された顧客プロファイルを作成できます。
データプラットフォームは、ビジネス戦略と業務遂行に変革をもたらします。主なメリットは次のとおりです。
データプラットフォームには、さまざまな形態があります。いずれも具体的なビジネス課題やデータ管理ニーズに対処できるように設計されています。以下は、多くの組織が使用している4種類のプラットフォームです。
クラウドデータプラットフォームは、クラウドインフラストラクチャを使用してすべてのデータを保存します。拡張性に優れた、容易にアクセスできる柔軟なデータソリューションとして、オンプレミスシステムの制約なしでデータを処理、分析、保存できます。クラウドデータプラットフォームのメリットは以下のとおりです。
エンタープライズデータプラットフォーム(EDP)は、大規模な組織の複雑なデータ管理ニーズを満たすように構成された包括的なソリューションです。EDPは拡張性とコンプライアンスを両立させつつ、整合性を保ちながら複数のソースにあるデータを連携させます。
EDPの一般的な使用例は以下のとおりです。
連携機能を提供するEDPは、データ戦略を組織目標と一致させたいと考えるビジネスに不可欠です。
顧客データプラットフォーム(CDP)は、複数のタッチポイントから得た顧客データを統合し、それぞれの顧客の全体像を提供することに特化したプラットフォームです。CDPはパーソナライズされた顧客体験を提供する際、特に重要な役割を果たします。通常、CDPは、Webサイト、モバイルアプリ、ソーシャルメディア、オフラインでのやり取りなど、さまざまなソースからデータを収集します。
CDPは主に顧客の好みに基づくターゲティングやレコメンデーションを可能にし、顧客行動トレンドの信頼できる唯一の情報源を提供します。CDPは、データを実践的なインサイトに変換することで、顧客にメリットをもたらし、顧客ロイヤルティを高めて、組織の顧客満足度の改善に貢献します。
ビッグデータプラットフォーム(BDP)は、従来のデータ処理システムでは処理しきれない複雑で膨大なデータセットを管理・分析するために設計されています。たとえば、Webサイトでやり取りする数百万のユーザーから生成されるクリックストリームデータなどの処理に対応します。これらのプラットフォームは、ハイパフォーマンスコンピューティングと大規模データストレージを専門とし、構造化データと非構造化データをリアルタイムで処理できます。
BDPの一般的なユースケースは以下のとおりです。
カスタムデータプラットフォームを構築するか、既存のソリューションを購入するかどうかの判断は、組織が掲げる目標、予算、技術的な専門性、タイムラインが鍵になります。いずれも明確なメリットと課題があります。
カスタムデータプラットフォームを構築する場合は、組織固有の要件を満たすように設計された専用のソリューションを作成することになります。
独自のデータプラットフォームの構築には、以下のようなメリットがあります。
一方で、課題もいくつかあります。
カスタムプラットフォームの構築は、ニッチな業界の組織や、既成のプラットフォームではサポートできない独自のユースケースを抱える組織に最適です。たとえば、ゲノム研究向けの専門的なデータインテグレーションを必要とするバイオテック企業は、そのデータフロー独自の複雑さに対応するプラットフォームを構築できます。
データプラットフォームを購入する場合は、すぐに使える機能や能力を備えた、ベンダー製のプレビルトソリューションを導入することになります。
組織は以下のようなメリットを得られます。
一方で、以下のような課題もあります。
ソリューションを直ちに必要としている場合や、カスタムプラットフォームを維持するリソースを持たない場合は、プラットフォームを購入した方が効果的でしょう。たとえば、リアルタイムの顧客パーソナライズを導入したい小売会社は、Data 360などのクラウドベースのデータプラットフォームを購入することで、データをすばやく連携して顧客インサイトを活用できます。
構築と購入のいずれかを選択する判断では、具体的な目的、技術的な能力、予算が重要になります。スピードと実績のある機能を求める場合は、確立されたソリューションの購入が適しています。
データプラットフォームを導入することで、データの抽出から分析まで一貫して管理できます。Salesforceエコシステムでは、Data 360が、構造化データと非構造化データも含めて、すべてのデータ管理の中心になります。データをネイティブなCustomer 360ビューに集約し、信頼できるコンテキストデータをAgentforceに供給することで、既存のデータレイクやデータウェアハウスの効果を拡大し、リアルタイムのインサイトやインテリジェントなアクションを有効活用します。自動化ツール、データガバナンス、高度なAIを備えたData 360があれば、データを最大限活用できます。
データプラットフォームとは、データを管理して使用するための包括的なソリューションです。さまざまなソースからデータを収集して保存し、クリーニングして分析するためのツールが備わっており、インサイトを導き出してビジネス業務を強化します。
データプラットフォームは、ビジネスにおけるデータサイロの解消、自社データを活用した信頼できる唯一の情報源の確立に役立ちます。その結果、より正確で迅速な意思決定が可能になり、パーソナライズが強化され、業務効率が向上します。
データプラットフォームは、AIと機械学習モデルのトレーニングに欠かせない、統合・整理されたクリーンなデータを提供します。質の高い膨大なデータに容易にアクセスできるようになるため、インテリジェントアプリケーションの開発と導入が加速します。
主なコンポーネントには、ソースからデータを取り込むデータ取得ツール、ストレージレイヤー(データレイクやデータウェアハウスなど)、処理エンジンやアナリティクスエンジンなどがあります。さらに、データ品質とコンプライアンスを確保するデータガバナンスとセキュリティ機構も含まれます。
データプラットフォームは柔軟なシステムです。構造化データと非構造化データの両方をリアルタイムで処理できるため、動的なアナリティクスに適しています。一方、データウェアハウスは、構造化データと履歴レポートを保存することに最適化されています。