データライフサイクル

データライフサイクル(Data Life Cycle)とは「データが、生まれてから死ぬまでのこと」です。
つまり、登録されてから削除されるまでの各ステージを指します。
具体的には、作成→保存→利用→共有→長期保管→破棄のステージに分かれます。

何故これらを意識するのかというと「データを適切に片付けたい」からです。
仮に服に例えると、よく着る服はよく使う場所に片付けたいものです。
滅多に着ない服は倉庫や棚に片付けたり、絶対に着ない服は捨てたいわけです。
それを、全て同じ場所に置いておくと、探すのも出すのも大変で効率が悪いわけです。

そして、それはデータに関しても同じことが言えるわけです。 ​

企業においては日々、様々なデータが生成され、そのデータ量は年々増え続けます。
この膨大なデータをただ業務運営だけに利用するのではなく、高度な分析をし経営戦略に役立てたり、新たなビジネス創出に役立てたいというニーズも当然あります。

しかしながら、いざデータ分析を進めようとしても、肝心の対象データがどこにあるのかわからなかったり、連携する様々なシステム内に散在し集約が必要だったりして、正確に対象を捉えることすら難しい場合があります。
このような時、事前の状況把握や準備に時間や手間がかかりすぎ、肝心のデータ分析に至る前に挫折をしてしまうケースも多々あります。

データには、生まれてから(生成)消滅するまでの(破棄)データライフサイクルがあります。各データがどこで、どのように生成され、その後どのような流れを経て、誰にどのように利用されているのか。
データを正しく活用していくためには、データライフサイクルと、データの流れを適切に捉えた上で、活用対象のデータを絞り込んでいく必要があります。

リアライズのデータマネジメント支援では、「構想策定フェーズ」「構築・実装フェーズ」「運用・定着化フェーズ」の3つのフェーズを通じて、お客様の課題を解決していきます。
この際、データの棚卸しやデータ間の関係性分類、データ流の把握などを「構想策定フェーズ」にて行い、データライフサイクルを意識したご提案を行うことが可能です。

■構想策定フェーズで実施すること

お客様の課題をヒアリングした上で、データ品質向上による期待効果とコンテンツ(データ品質)と、それを作りあげる要素(ルール、役割等)に着目し、実行すべき施策をデータマネジメント専門家のノウハウにより明らかにしていきます。

①目的とスコープの明確化:
取り組みの目的・狙いを明確にすることにより、可視化の観点を明らかにします。また、業務の流れと構造に着目し、業務のサービスレベル、業務機能、実行組織など業務に関わる要素間の関係性を整理することで、網羅的に業務の全体像を把握します。

②対象データの特定:
業務の目的であるデータに着目することで、業務の本質を把握します。
具体的には、データの棚卸とデータ間の関係性による分類や、システムや部門間のデータの流れ(データ流)を把握します。

③業務の把握:
業務分析フレームワークを活用し、業務フローの見直しや、業務集約統合の検討、機能と体制を把握します。

④データ品質ギャップとその原因特定:
データ品質分析フレームワークを活用し、データ品質における問題点や、業務上の問題点を明らかにすることで根本原因の分析を行います。

⑤施策立案(ロードマップ):
特定した原因に対する打ち手の検討を行い、選定した解決策の実現イメージを明らかにし、解決策の前後関係や優先順位などを考慮し、ロードマップを策定します。


「構築・実装フェーズ」「運用・定着化フェーズ」についてはこちらをご参照ください。
「リアライズのデータマネジメント進め方」

また、近年導入が進んでいるAI活用においても、データをライフサイクルで捉え、調査、企画、検証、導入、
活用するところまで順序立てて進み、入口のデータ、出口のデータを検証し、PDCAサイクルを回すことが重要です。

リアライズでは、AIをそれぞれの場面や目的に沿って活用できるように、専門家の立場でご支援します。

AI活用におけるデータライフサイクルの必要性について語った講演、レポートはこちらです。

データが変われば結果も変わる!~AI活用のためのデータマネジメント&教師データ作成~

関連ブログ