@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00237016, author = {宮川, 裕貴 and 山田, 雅之 and 中, 貴俊 and 兼松, 篤子 and 宮崎, 慎也 and 長谷川, 純一}, book = {第86回全国大会講演論文集}, issue = {1}, month = {Mar}, note = {近代の公文書には史料的価値があるが,その多くはくずし字を含む手書きの文書であるため近代古文書の知識が無ければ解読が困難である.我々は台湾総督府文書を題材として,近代公文書を対象としたOCRシステムの開発を進めている.本研究では文字検出を行う機械学習モデルとして,画像特徴と文脈情報を利用するTransformerベースのモデルを提案する.このモデルはエンコーダでは画像特徴の抽出を行い,デコーダでは画像特徴と文脈情報を合わせて文字検出のための特徴を獲得,これを利用して画像中の各文字の領域と字種を予測する.近代公文書画像に対して文脈を考慮しないモデルとの精度比較を通じて提案モデルの有効性を示す.}, pages = {817--818}, publisher = {情報処理学会}, title = {日本近代公文書画像における文脈を考慮した文字検出手法}, volume = {2024}, year = {2024} }