データカタログ

データカタログとは、「データのカタログ」という、そのままの意味です。
とは言っても、どんなものかイメージが沸きづらいかもしれませんので、まずは、一般的なカタログ冊子を思い浮かべていただくと良いかと思います。

カタログ上で品物を探す時、人によっては、一通りに目を通して「欲しいと思える品物があるかどうか」を見たい場合もあると思います。
また、人によっては欲しいものが大体決まっていて「どんな色があるのか、どんな大きさがあるのか」などバリエーションを見たい場合もあると思います。

そのようなニーズに合わせて、全体の品揃えがわかるページを用意したり、索引を載せたりして、そこから各品物が記載されたページを探せるようにしたり、各ページでは、どのようなパリエーションがあるのかを記載したりするわけです。

これと同様にデータカタログも「欲しいと思えるデータがあるかどうか」を検索できる機能を用意したり「そのデータには、どのようなバリエーションがあるか」がわかるような機能が用意されます。

なお、データカタログで管理されるデータ(例:データ項目名、データの意味など)を、メタデータと呼びます。 ​

2010年頃にデータレイクという概念が登場し、企業は膨大な量の多種多様なデータを格納することが可能になりました。
しかし、無目的にデータを集め続けていった結果、どんなデータが格納されているのか把握できなくなり、データレイクは“湖”どころか、データスワンプ、つまり“濁った沼”になってしまっているケースも少なくありません。
そうしたデータレイクの惨状を救うために誕生したのが、データカタログであると推察しています。

データカタログは、ツールとしてデータカタログを導入しても、合わせてメタデータは導入されません。
データカタログツールの中にはメタデータを自動的に収集してくれるものもありますが、それは既に社内に存在しているものに限られます。
つまり、現存しないメタデータは収集できません。
そうしたことから、データカタログ構築の成功のカギは、メタデータをいかに効果的に作成、運用するかにあります。


リアライズは以下の4点を重視して、お客様のデータカタログ構築を成功に導きます。
1.データカタログ利用ユーザーの特定
2.ユーザーのデータ活用目的の把握と要件の定義
3.メタモデルの定義と、データカタログツールの選定
4.データカタログ運用チームの設立


詳細は以下をご参照ください。

「3つの『リアライズ流』がデータガバナンスを徹底的に支援する」

関連用語

関連ブログ