データ仮想化とは? データマネジメント用語をわかりやすく解説



近年、多くの企業ではデータを軸にしたビジネス推進を行っています。
データを活用する上で、特に重要視されているのがデータ品質の向上と維持運用を行うデータマネジメントです。
この用語集では、データマネジメントやデータ活用に関する用語を解説しています。
また、データマネジメントの専門家として活動するNTTデータ バリュー・エンジニアが、データ活用のヒントもご紹介しています。

データ仮想化とは

データ仮想化とは、物理的にデータを統合することなくユーザにとってはあたかもデータが統合されているかのうように見せる技術のことを言います。

 

物理的にデータを統合する場合、例えば複数の業務データを編集加工し、形式を整えてDWHに蓄積した後に利用者に公開しなければならず手間や時間がかかりユーザのニーズに迅速に応えることができません。

また、このようにして個々のユーザニーズに応じたデータ統合や公開を繰り返していくと似通ったデータマートが乱立し、同じようなデータが多量に物理的に蓄積されることになります。

このような状態では、データの更新もそれぞれに反映する必要があるため、運用の工数も増えてしまいます。

 

データ仮想化はこのような統合された物理データを作成せず、意味的に同じデータをViewの形式でまとめてユーザに提供する技術です。

つまり、複数の業務で取引先コードが異なっていても同じ取引先であればViewに1行で表示されることを意味します。

ユーザがViewからドリルダウンしてデータを取得したいときは、データ仮想化技術が自動的にViewに表示している各々の業務データにアクセスして、仮想的に統合されたデータをユーザに提供します。

データ仮想化技術により迅速にユーザにデータを提供することができるとともに、ストレージと運用工数の増加を抑制することができます。

NTTデータ バリュー・エンジニアが考えるデータマネジメント

多様なデータを物理的にデータ統合することなく、データをそれぞれのデータソースに置いたまま仮想的に統合する「データ仮想化」の技術により、企業はリアルタイム性、コスト効率に優れたデータ利活用が可能となりました。

 

データを仮想的に統合する場合でも、データソースのデータはそれぞれの要件で定義されているため、仮想化ツール上でデータの紐づけや名寄せルールを設定する必要があります。

しかし多くの場合において、それぞれのデータソースに蓄積されたデータは、運用の過程で発生した「例外値」や「外れ値」が含まれているため、そのままデータ統合すればデータ品質が低下します。

このため、まずはデータの状態をアセスメントし、仮想化ツールでは吸収しきれない品質のデータを特定し、適した形に加工・変換を行う必要があります。

こうした作業を行うにはデータの個性を読み解く力や、データの取扱いについてのノウハウが求められます。

 

データマネジメントの専門会社であるNTTデータ バリュー・エンジニアには、マスタデータ、トランザクションデータを問わず、様々なデータを取り扱う技術と実績があります。

長年の経験から確立された手順・ノウハウに基づき設計・運用を行うため、抑えるべきポイントを踏まえた精度の高いデータを、比較的スピーディに提供することができます。

さらにお客様固有の特徴的なデータにも柔軟な対応が可能です。

 

 

詳細は以下をご覧ください。

 

 

 

>   NTTデータ バリュー・エンジニアのこだわり

お客様と伴走してデータマネジメント支援、データ活用支援を行うNTTデータ バリュー・エンジニアが大切にしているコトです。

 

>   データマネジメントを成功させるポイント

NTTデータ バリュー・エンジニアが考えるデータマネジメントを成功させる3つのポイントを紹介しています。

 

 

 

 

 

用語集一覧に戻る

関連ブログ