オントロジー

オントロジー(ontology)とは、元々は哲学の世界で言う「存在論(存在とは何かを研究する学問)」を示す単語ですが、ITの世界では知識の共有化や再利用の方法として研究開発が進み「対象世界をどの様に捉えた(概念化した)かを記述するもの」という意味で使われています。

例えば「『カレー』は『料理』という上位概念に含まれ『作る手順』は『切る』、『焼く』、『煮る』という順になり、『切る』とは…」などと概念を整理すると正確に伝達することができ知識の共有化に繋がります。

また、人工知能(AI)の分野では「人がどの様に情報の意味を理解しているか」を、コンピュータに分かるようにするためにはどうすれば良いかが研究されており、情報システム開発の分野では「システムの利用者が、どの様に業務を捉えているか」を、設計者や開発者が共通理解や情報共有をするためにはどうすれば良いかが研究されています。

いずれにせよ、記述する人によって記述の方法や記述の粒度がまちまちになると、そもそもの知識の共有化や再利用が難しくなるため、記述ルールの標準化が必要になります。 ​

データクレンジング名寄せを行う際、単純な表記ゆれは機械処理である程度補正することが可能です。
しかし、概ね半数以上のデータは単純な機械処理では捕捉ができないような表記のゆれ方をしているので、機械的な対応だけでは十分な結果が得られないというのが今までの実態でした。

しかしながら、AIの進化により、今まで人の目を介して初めて捉えていたような事実を、オントロジー(概念)レベルで機械的に紐づけ、マッチングをさせていくような技術研究が各所で進んでいます。

これらのテクノロジーを使いこなすためには、機械にインプットする「教師データ」が必要になります。この「教師データ」を構築し、学習方向を補正し、機械が判断する際の誤り率を減らす舵取りは、やはり人間の手を介さざるを得ません。

リアライズはこうした、AIをはじめとする最新技術に対するインプットデータの構築についても、ご支援をしています。


詳細は以下をご参照ください。

「3つの「リアライズ流」で、データクレンジングを徹底的に支援する」

「3つの『リアライズ流』で名寄せを徹底的に支援する」

「データマネジメントを成功させるポイント」

関連ブログ