リファレンスデータとは? データマネジメント用語をわかりやすく解説



近年、多くの企業ではデータを軸にしたビジネス推進を行っています。
データを活用する上で、特に重要視されているのがデータ品質の向上と維持運用を行うデータマネジメントです。
この用語集では、データマネジメントやデータ活用に関する用語を解説しています。
また、データマネジメントの専門家として活動するNTTデータ バリュー・エンジニアが、データ活用のヒントもご紹介しています。

リファレンスデータとは

リファレンスデータとは、区分データのことです。
例えば注文区分、性別など情報システムに存在する様々な区分データが該当します。
これらの区分データは、一度登録されるとほとんど変更されることはなく参照のみに利用されるため、リファレンス(reference=参照)データと呼ばれています。
リファレンスデータは次の特徴を持っています。

① 安定的:一度登録されたらほとんど変更しない。
② データ構造がシンプル:ほとんどのリファレンスデータはKEY項目とKEY項目に対応する名称などの属性項目しか持たない。
③ トランザクションデータやマスターデータの属性に登場し、それらのデータを修飾・分類する。

リファレンスデータは、単にトランザクションデータやマスターデータを装飾するだけでなく、それらのデータの集計軸として使われる場合があります。
例えば、販売データを男女別に集計して分析したり、取引先マスタのデータを業種別に分類するなどです。

またリファレンスデータによっては業務を横断して広く使われるものもあるため、設計を疎かにしないほうが良いでしょう。
設計にあたっては、性別区分が男性、女性で構成されるように、なるべく漏れがなく重複がなく値を作ることがポイントです。

NTTデータ バリュー・エンジニアが考えるデータマネジメント

企業では日々、様々なデータが生成され、そのデータ量は年々増え続けます。
この膨大なデータをただ業務運営だけに利用するのではなく、高度な分析をし経営戦略に役立てたり、新たなビジネス創出に役立てたいというニーズも当然あります。

しかしながら、いざデータ分析を進めようとしても、肝心の対象データがどこにあるのかわからなかったり、連携する様々なシステム内に散在し集約が必要だったりして、正確に対象を捉えることすら難しい場合があります。
このような時、事前の状況把握や準備に時間や手間がかかりすぎ、肝心のデータ分析に至る前に挫折をしてしまうケースも多々あります。

これらを防ぐために有効なのが、データサイエンティストが本来の解析業務を行う前の、「データプレパレーション」です。
現状データの状態を紐解き構造化し、分析可能な状態にまで引き上げます。
これらの作業は、大変地道な作業の繰り返しとなり、膨大な時間と労力を費やす上に、データの個性を読み解く力、データの取扱いについてのノウハウなくしては、有用なデータを作り上げることはできません。

データマネジメントの専門会社であるNTTデータ バリュー・エンジニアには、データプレパレーションを始めとした、様々なデータを取り扱う技術と実績があります。
長年の経験から確立された手順・ノウハウに基づき設計・運用を行うため、抑えるべきポイントを踏まえた精度の高いデータを、比較的スピーディに提供することができます。
さらにお客様固有の特徴的なデータにも柔軟な対応が可能です。

 

詳細は以下をご覧ください。

 

 

 

>   NTTデータ バリュー・エンジニアのこだわり

お客様と伴走してデータマネジメント支援、データ活用支援を行うNTTデータ バリュー・エンジニアが大切にしているコトです。

 

>   データマネジメントを成功させるポイント

NTTデータ バリュー・エンジニアが考えるデータマネジメントを成功させる3つのポイントを紹介しています。

 

 

 

 

 

用語集一覧に戻る

関連ブログ