| Item type |
National Convention(1) |
| 公開日 |
2024-03-01 |
| タイトル |
|
|
タイトル |
日本近代公文書画像における文脈を考慮した文字検出手法 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
コンピュータと人間社会 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
| 著者所属 |
|
|
|
中京大 |
| 著者所属 |
|
|
|
中京大 |
| 著者所属 |
|
|
|
中京大 |
| 著者所属 |
|
|
|
中京大 |
| 著者所属 |
|
|
|
中京大 |
| 著者所属 |
|
|
|
中京大 |
| 著者名 |
宮川, 裕貴
山田, 雅之
中, 貴俊
兼松, 篤子
宮崎, 慎也
長谷川, 純一
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近代の公文書には史料的価値があるが,その多くはくずし字を含む手書きの文書であるため近代古文書の知識が無ければ解読が困難である.我々は台湾総督府文書を題材として,近代公文書を対象としたOCRシステムの開発を進めている.本研究では文字検出を行う機械学習モデルとして,画像特徴と文脈情報を利用するTransformerベースのモデルを提案する.このモデルはエンコーダでは画像特徴の抽出を行い,デコーダでは画像特徴と文脈情報を合わせて文字検出のための特徴を獲得,これを利用して画像中の各文字の領域と字種を予測する.近代公文書画像に対して文脈を考慮しないモデルとの精度比較を通じて提案モデルの有効性を示す. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00349328 |
| 書誌情報 |
第86回全国大会講演論文集
巻 2024,
号 1,
p. 817-818,
発行日 2024-03-01
|
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |