重複とは? データマネジメント用語をわかりやすく解説
近年、多くの企業ではデータを軸にしたビジネス推進を行っています。
データを活用する上で、特に重要視されているのがデータ品質の向上と維持運用を行うデータマネジメントです。
この用語集では、データマネジメントやデータ活用に関する用語を解説しています。
また、データマネジメントの専門家として活動するNTTデータ バリュー・エンジニアが、データ活用のヒントもご紹介しています。
重複とは
重複とは「同じ物事が重なり合うこと。同じ物事が二つ(二度)以上重なること」です。
但し、『何をもって同じ物事とみるか』は、範囲や目的やによって変わります。
例えば、ある人からすると全く同じ本に見えても、所有者からすると「保存用と閲覧用で分けている」とか、家族がそれぞれ本を買っていて、それそれの中では同じ本を持っていないつもりだったけど、家族で共有の本棚を作って寄せ集めてみると、同じ本が何冊もあるという場合があります。
したがって、重複を見つけるには、「どういう範囲でどういう目的で重複を探すのか」が重要になってきます。