データクレンジング

データクレンジングとは、データクオリティを向上させるために、データを洗浄(クレンジング)することです。

データを洗浄するということは、データが汚れていることを意味するわけですが『何を汚れているとみなすか』は『本来はどうあるべきか』というルールによって変わります。

一般的には、そのようなルールが明確でない会社が多く、データクレンジングをすると決まってから、慌ててルールを整備することも多いのが実状です。 ​

システムで保有しているデータを活用しようとする際に、データの半角/全角、空白や区切り文字、法人格や住所、電話番号の表記方法が異なることにより、十分に活用しきれないケースが多々あります。
このような場合、データの表記ルールの統一、正規化を行い、活用に足る状態にデータ品質を整える必要があります。

リアライズではデータ整備の基本手法として、データクレンジング実施しています。

リアライズでは、単なる作業としてのデータクレンジングではなく、お客様の利用目的や実際のデータ状態を確認した上で、最適なデータクレンジングの設計をします。
「半角/全角」「大文字/小文字」「法人格や住所表記の統一」といった基本クレンジングに加え、お客様独自のデータ項目や管理ルール、活用方法を踏まえた上で、個別的なデータクレンジングも対応が可能です。

リアライズは、以下の3つの点を重視して、データクレンジングのご支援をします。

1.「ツール+人間の目」だからできる、データの意味を捉えた深いクレンジングの実施
2.あらゆる種類のマスタ、トランザクションデータが対象
3.手順化されたデータクレンジング設計・運用で精度の高いデータをスピーディに


詳細は以下をご参照ください。

「3つの「リアライズ流」で、データクレンジングを徹底的に支援する」

関連ブログ