データマイニングとは? データマネジメント用語をわかりやすく解説
近年、多くの企業ではデータを軸にしたビジネス推進を行っています。
データを活用する上で、特に重要視されているのがデータ品質の向上と維持運用を行うデータマネジメントです。
この用語集では、データマネジメントやデータ活用に関する用語を解説しています。
また、データマネジメントの専門家として活動するNTTデータ バリュー・エンジニアが、データ活用のヒントもご紹介しています。
データマイニングとは
データマイニングとは、大量のデータに統計学や人工知能などの分析手法を用いることで人の目ではわからなかった知見を発見する手法全般のことを意味します。データマイニングの「マイニング」とは採掘の意味であり、山から金を採掘するように大量のデータから知見を発見することを表しています。
今日では、ビッグデータ・データサイエンス・データの統計処理・機械学習、あるいは金融工学などの言葉が前面に出ていますがこれらはすべてデータマイニングを目的とした概念・手法であると言えます。
データマイニングの概念は1980年末に生まれた学術研究分野である"Knowledge Discovery in Databases"と言われています。
その後コンピュータ性能の向上とWebや企業情報システムにおけるデータ量の増大と統計学、1950年代以降地道に積み重ねられてきたAIの研究成果が結集し現在のように大量のデータから知見を発見してビジネスに活かすことが当たり前の世界となりました。
NTTデータ バリュー・エンジニアが考えるデータマネジメント
データの中から新たな知見や気付きを発見するデータマイニングを行なうことによって、単なる集計だけでは見えてこなかった、新たな付加価値を生み出すことができます。
今日では、オープンデータや様々なセンサーが生み出すIoTデータなど、入手可能なデータが飛躍的に増加しており、それらを組み合わせることによるデータマイニングの可能性も一層広がりを見せています。
また、最も知られているマイニング技法の「デシジョンツリー」や「ニューラルネット」を簡単に行えるデータマイニングツールも数多く提供されています。
しかし、どんなに優れた分析技法を駆使しても、インプットとなるデータの品質が悪ければ、ビジネスに活かせる精度の知見を導くことはできません。
NTTデータ バリュー・エンジニアは、インプットとなる入手データの品質を整えるデータプレパレーションを含めた「データアナリティクスソリューション」で、お客様のデータ分析・活用をトータルにサポートします。
詳細は以下をご覧ください。
お客様のデータ活用目的を明確化し、必要なデータの収集、データの状態をアセスメント、分析に適した状態へ加工(クレンジング、名寄せ)、データの可視化までをトータルサポートします。
お客様と伴走してデータマネジメント支援、データ活用支援を行うNTTデータ バリュー・エンジニアが大切にしているコトです。
|