Thesis Abstract: m953429

氏名: 政井宏之 (m953429)

論文題目: 文書画像理解のための文書の類別に関する研究

論文概要

文書画像理解とは、文書画像から有意な情報を自動的に抽出する課題であり、文書モデル（文書に関する知識）を利用して文書画像を解釈する枠組になっている。また、文書モデルは解釈精度の向上のために文書に強く依存している。一方、汎用的な文書画像理解の研究も現在行なわれているが、それらは文書モデルを汎用化し、一つの文書モデルで数種の文書を解釈するものである。しかし、文書モデルの汎用化は個々の文書に対する依存度を低下させるため、解釈精度の低下が問題になる。

そこで、我々は入力文書を適当な文書集合に類別し、その集合に応じた文書画像理解を行なうアプローチを提案する。ここでは、文書集合の定義と類別方法が重要になるが、我々は、文書構造（論理構造・レイアウト構造）に基づいた文書集合を階層的に定義し、それらを文書類・文書型・文書クラスと呼ぶ。また、類別方法は分類・検証の二段階処理で構成し、この処理を繰り返すことで、入力文書を文書類・文書型・文書クラスに順次類別する。

本稿では、６種類の文書の文書類・文書型を定義し、各文書集合に観察される特徴を挙げる。そして、これらの特徴を利用した類別実験を行ない、分類・検証による類別方法の効果を示す。

目次に戻る