WEKO3
アイテム
OCR文書の認識誤り修正支援システムの開発
https://ipsj.ixsq.nii.ac.jp/records/132108
https://ipsj.ixsq.nii.ac.jp/records/13210866658f77-8879-4523-bdec-421cbb0fbf20
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | National Convention(1) | |||||
---|---|---|---|---|---|---|
公開日 | 1997-09-24 | |||||
タイトル | ||||||
タイトル | OCR文書の認識誤り修正支援システムの開発 | |||||
タイトル | ||||||
言語 | en | |||||
タイトル | Development of the Spell Checker for Japanese OCR Text | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
著者所属 | ||||||
日立製作所システム開発研究所 | ||||||
著者所属 | ||||||
日立製作所システム開発研究所 | ||||||
著者所属 | ||||||
日立製作所システム開発研究所 | ||||||
著者所属(英) | ||||||
en | ||||||
Systems Development Laboratory, Hitachi, Ltd. | ||||||
著者所属(英) | ||||||
en | ||||||
Systems Development Laboratory, Hitachi, Ltd. | ||||||
著者所属(英) | ||||||
en | ||||||
Systems Development Laboratory, Hitachi, Ltd. | ||||||
論文抄録 | ||||||
内容記述タイプ | Other | |||||
内容記述 | ディジタル図書館の実現のために, 紙でしか存在しないもののディジタル化手段として, OCR (Optical Character Recognition)の需要が高まっている。OCR結果には, 文字認識誤りが多く, 誤りの訂正には時間がかかるため, 入力工数削減が望まれている。本研究では, 技術情報サービスで対象としている文書の特徴をとらえて, 訂正能力が優れ, 操作性のよい認識誤り修正支援システムを開発した。スペル誤りのチェックおよび自動訂正の研究は古く, 英文で30年, 和文で10年以上の歴史があるが, 今日もなお研究が続いている。それぞれの手法は用途が限られ, また誤り訂正能力に制約があり, OCRなどでは, スペル誤りの訂正に要する工数は今なお, 多大なためである。従来のスペルチェック・訂正の研究では, 1つの単語に含まれる文字誤りは少ないこと(せいぜい2, 3個)が前提となっていることが多い。しかし, 英字を含む和文OCRでは, 長さ10文字の英単語に4, 5文字のエラーが含まれていることが珍しくない。われわれは, 先に, 日本語OCR文において認識エラーの多い英字, カタカナを対象を対象としたスペル誤りの訂正方式を開発した。ここで開発したスペルチェッカ(SpellChecker-1)は, 誤りのある単語を一つずつダイアログボックスで確認して, 修正するものであった。本稿では, これをさらに発展させ, 単語の切り出し精度の改善と, 誤りを含む単語を一斉に表示して, 正しい単語が第一候補にある場合, ワンタッチで修正できる認識誤り修正支援システム(SpellChecker-2)を提案する。 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN00349328 | |||||
書誌情報 |
全国大会講演論文集 巻 第55回, 号 人工知能と認知科学, p. 99-100, 発行日 1997-09-24 |
|||||
出版者 | ||||||
言語 | ja | |||||
出版者 | 情報処理学会 |