WEKO3
アイテム
統計的手法による文字誤りテキスト検索
https://ipsj.ixsq.nii.ac.jp/records/129703
https://ipsj.ixsq.nii.ac.jp/records/129703ec71fbcf-bbb7-457d-a533-64fbffef9574
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | National Convention(1) | |||||
---|---|---|---|---|---|---|
公開日 | 1996-03-06 | |||||
タイトル | ||||||
タイトル | 統計的手法による文字誤りテキスト検索 | |||||
タイトル | ||||||
言語 | en | |||||
タイトル | Statistical Approach to Text Retrieval containing Miss Recognized Characters | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
著者所属 | ||||||
東京大学大学院工学系研究科 | ||||||
著者所属 | ||||||
学術情報センター研究開発部 | ||||||
著者所属 | ||||||
学術情報センター研究開発部 | ||||||
著者所属 | ||||||
学術情報センター研究開発部 | ||||||
著者所属(英) | ||||||
en | ||||||
Graduate school Of Engineering, The University of Tokyo | ||||||
著者所属(英) | ||||||
en | ||||||
Research & Development Department,National Center for Science Information Systems | ||||||
著者所属(英) | ||||||
en | ||||||
Research & Development Department,National Center for Science Information Systems | ||||||
著者所属(英) | ||||||
en | ||||||
Research & Development Department,National Center for Science Information Systems | ||||||
論文抄録 | ||||||
内容記述タイプ | Other | |||||
内容記述 | OCR(光学的文字読取装置)を用いると大量の印刷文書のDBへの入力作業が大幅に省力化される。そこで大量の印刷文書を画像で入力し、OCRを使って全文DBを構築する試みもあるが、その場合OCRの誤認識への対処が必要不可欠である。現在までに著者らは、この誤認職を訂正するのではなく検索段階で吸収する手法について検討し、類似文字テーブル及び単語部分照合を用いた手法の提案を行なった。 本稿ではさらなる検索効率の向上のために、統計的に得られる文字の連接情報(2-gram確率)を用いる。 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN00349328 | |||||
書誌情報 |
全国大会講演論文集 巻 第52回, 号 データベース, p. 211-212, 発行日 1996-03-06 |
|||||
出版者 | ||||||
言語 | ja | |||||
出版者 | 情報処理学会 |