WEKO3
アイテム
近代言語モデルを用いた近代公文書OCRの精度改善手法の提案
https://ipsj.ixsq.nii.ac.jp/records/237017
https://ipsj.ixsq.nii.ac.jp/records/237017961b6f85-a3a7-44a2-a9ff-d42b3a78915b
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
| Item type | National Convention(1) | |||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2024-03-01 | |||||||||||||||||
| タイトル | ||||||||||||||||||
| タイトル | 近代言語モデルを用いた近代公文書OCRの精度改善手法の提案 | |||||||||||||||||
| 言語 | ||||||||||||||||||
| 言語 | jpn | |||||||||||||||||
| キーワード | ||||||||||||||||||
| 主題Scheme | Other | |||||||||||||||||
| 主題 | コンピュータと人間社会 | |||||||||||||||||
| 資源タイプ | ||||||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||||||
| 資源タイプ | conference paper | |||||||||||||||||
| 著者所属 | ||||||||||||||||||
| 中京大 | ||||||||||||||||||
| 著者所属 | ||||||||||||||||||
| 中京大 | ||||||||||||||||||
| 著者所属 | ||||||||||||||||||
| 中京大 | ||||||||||||||||||
| 著者所属 | ||||||||||||||||||
| 中京大 | ||||||||||||||||||
| 著者所属 | ||||||||||||||||||
| 中京大 | ||||||||||||||||||
| 著者所属 | ||||||||||||||||||
| 中京大 | ||||||||||||||||||
| 著者名 |
亀山, 京右
× 亀山, 京右
× 山田, 雅之
× 中, 貴俊
× 兼松, 篤子
× 宮崎, 慎也
× 長谷川, 純一
|
|||||||||||||||||
| 論文抄録 | ||||||||||||||||||
| 内容記述タイプ | Other | |||||||||||||||||
| 内容記述 | 我々の研究チームでは,近代の文書として体系的に保管されている台湾総督府公文書を題材とした近代公文書自動認識システムの構築を進めている.その中で,公文書による学習のみでは近代文書の特徴をうまく捉えることができない点が課題としてあった.そこで本研究では,青空文庫で公開されている近代の文書データを用いて近代言語モデルの事前学習を行い,近代文書の汎用的な特徴を学習することによる近代公文書認識システムの精度向上を目指した手法の提案を行う. | |||||||||||||||||
| 書誌レコードID | ||||||||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||||||||
| 収録物識別子 | AN00349328 | |||||||||||||||||
| 書誌情報 |
第86回全国大会講演論文集 巻 2024, 号 1, p. 819-820, 発行日 2024-03-01 |
|||||||||||||||||
| 出版者 | ||||||||||||||||||
| 言語 | ja | |||||||||||||||||
| 出版者 | 情報処理学会 | |||||||||||||||||