氏名: 富永 孝 (089333438)
論文題目: 奥付けを対象とした文書画像理解における
書式構造知識の自動獲得に関する研究
論文概要
現在出版されている書籍・雑誌は数多く、これらの情報を電子化するには、
人手を煩わせず行うことが必要である。書誌の情報は、奥付けに最も集中して
記載されているので、奥付けから情報を抽出するのが最適である。また、従来
文書画像理解においては、書式構造知識を外部から構造認識システムに与える
手法を取っていたが、これは対象に強く依存するので、その書式構造知識をシ
ステム自身が自動的に獲得することが求められる。よって、この論文では、書
籍や雑誌にある奥付けが持つ書式構造知識の自動獲得について述べる。自動獲
得においては、構造分解処理によって奥付けから項目域を抽出し、構造抽出処
理によって抽出した知識を、構造木によって記述する。
目次に戻る