データクレンジングとは? データマネジメント用語をわかりやすく解説



近年、多くの企業ではデータを軸にしたビジネス推進を行っています。
データを活用する上で、特に重要視されているのがデータ品質の向上と維持運用を行うデータマネジメントです。
この用語集では、データマネジメントやデータ活用に関する用語を解説しています。
また、データマネジメントの専門家として活動するNTTデータ バリュー・エンジニアが、データ活用のヒントもご紹介しています。

データクレンジングとは

データクレンジングとは、データクオリティを向上させるために、データを洗浄(クレンジング)することです。

データを洗浄するということは、データが汚れていることを意味するわけですが『何を汚れているとみなすか』は『本来はどうあるべきか』というルールによって変わります。

一般的には、そのようなルールが明確でない会社が多く、データクレンジングをすると決まってから、慌ててルールを整備することも多いのが実状です。

NTTデータ バリュー・エンジニアが考えるデータマネジメント

システムで保有しているデータを活用しようとする際に、データの半角/全角、空白や区切り文字、法人格や住所、電話番号の表記方法が異なることにより、十分に活用しきれないケースが多々あります。
このような場合、データの表記ルールの統一、正規化を行い、活用に足る状態にデータ品質を整える必要があります。

NTTデータ バリュー・エンジニアではデータ整備の基本手法として、データクレンジング実施しています。

NTTデータ バリュー・エンジニアでは、単なる作業としてのデータクレンジングではなく、お客様の利用目的や実際のデータ状態を確認した上で、最適なデータクレンジングの設計をします。
「半角/全角」「大文字/小文字」「法人格や住所表記の統一」といった基本クレンジングに加え、お客様独自のデータ項目や管理ルール、活用方法を踏まえた上で、個別的なデータクレンジングも対応が可能です。

NTTデータ バリュー・エンジニアは、以下の3つの点を重視して、データクレンジングのご支援をします。

1.「ツール+人間の目」だからできる、データの意味を捉えた深いクレンジングの実施
2.あらゆる種類のマスタ、トランザクションデータが対象
3.手順化されたデータクレンジング設計・運用で精度の高いデータをスピーディに

 

詳細は以下をご覧ください。

 

 

 

>   NTTデータ バリュー・エンジニアのデータクレンジング

単なる作業としてではなく、お客様の利用目的や実際のデータ状態を確認した上で最適なデータクレンジングの設計をします。

 

 

 

 

 

用語集一覧に戻る

関連ブログ