OLAP(Online Analytical Processing)とは? データマネジメント用語をわかりやすく解説



近年、多くの企業ではデータを軸にしたビジネス推進を行っています。
データを活用する上で、特に重要視されているのがデータ品質の向上と維持運用を行うデータマネジメントです。
この用語集では、データマネジメントやデータ活用に関する用語を解説しています。
また、データマネジメントの専門家として活動するNTTデータ バリュー・エンジニアが、データ活用のヒントもご紹介しています。

OLAPとは

OLAP(Online Analytical Processing)とはデータベースに蓄積された大量データに対して、オンラインリアルタイムでの問い合わせ形式で複雑な検索や集計処理を行い、素早くデータ分析結果を提供する機能のことです。

 

BIの機能の一部として位置づけられますが、複数の軸を含む多次元データモデルを取り扱うことができるのがOLAPの特徴です。

BIの機能のひとつであるダッシュボードが、どちらかというと定型的な分析結果を表示するのに対して、OLAPではデータ分析者が検索条件や計算方法をシステムにインタラクティブに指示しながら目的の分析結果を得るところが異なります。

OLAPの考え方は1990年代からあり、当時はEUC(End User Computing:エンドユーザ自身がDBを操作してデータ分析結果を取得するという考え方)と相まって注目されました。

今日ビッグデータデータアナリストデータサイエンス などデータ分析に関する一連のテーマが話題となっていますが、OLAPはその先駆けに位置づくと言えるでしょう。

NTTデータ バリュー・エンジニアが考えるデータマネジメント

ダッシュボードのように固定した定型の切り口ではなく、オンライン画面上で必要な条件の組み合わせを指定することによって、簡単かつスピーディに大量のデータを色々な切り口で集計することができるOLAPは、プログラミングなどの専門知識がなくても使うことができる便利な環境です。

OLAPが参照するデータは、分析者の関心事項を想定した複数の次元(集計の軸)を盛り込んだ多次元データベースに格納されるのですが、その際、特に注意しなければならないのが、次元に使われるデータ項目の値です。

例えば、代表的な次元である「日付」や「時間」を使って、時系列による絞り込みや集計を行う際、格納されるデータが複数の国から集められている場合は、時差や日付変更線を考慮して、日付や時間を同じタイムゾーンに変換して揃える必要があります。

このようにデータ分析を行うためには、データの状態を確認し分析ができる状態に下準備を行うデータプレパレーションが必要となります。

 

NTTデータ バリュー・エンジニアが提供するデータアナリティクスソリューションでは、データ分析・活用を行う前に「目的明確化」、「可視化イメージの設計」、「必要なデータの品質と精度を見定め」というアプローチを取り入れることで、信頼できるデータ分析結果を導きます。

 

また、長年データマネジメントの専門会社として活動しているNTTデータ バリュー・エンジニアは、データの定義書に書かれていることだけでなく、実際のデータの値も確認することで、正確なデータ品質のアセスメントを行うことができます。

 

 

詳細は以下をご覧ください。

 

 

 

>   データアナリティクスソリューション

お客様のデータ活用目的を明確化し、必要なデータの収集、データの状態をアセスメント、分析に適した状態へ加工(クレンジング、名寄せ)、データの可視化までをトータルサポートします。

 

>   NTTデータ バリュー・エンジニアのこだわり

お客様と伴走してデータマネジメント支援、データ活用支援を行うNTTデータ バリュー・エンジニアが大切にしているコトです。

 

 

 

 

 

用語集一覧に戻る

関連ブログ