@techreport{oai:ipsj.ixsq.nii.ac.jp:00231267, author = {片山, 歩希 and 東山, 翔平 and 大内, 啓樹 and 渡辺, 太郎}, issue = {9}, month = {Nov}, note = {歴史的日本語資料には,当時の地理空間上に存在した人物・事物や,そこで起きた出来事・事象についての情報が記録されているものがある.そうした情報を,地理空間,つまり「場所」の観点を踏まえて構造化することで,古人が辿った地理的軌跡を明らかにしたり,災害伝承の記録を掘り起こすといった,資料の内容の調査・分析が容易になると考えられる.本研究では,歴史的日本語資料に対する地理的な情報構造化に向けた最初のステップとして,近世紀行文「おくのほそ道」に含まれる場所参照表現の抽出に取り組む.「おくのほそ道」本文に場所参照表現を人手付与したデータセットを用いて,既存の自然言語処理システム,GiNZA および ChatGPT(GPT-3.5およびGPT-4)の抽出精度を調査した.実験結果から,GiNZA の一般的な現代日本語向け固有表現抽出モデルでは十分な精度を得ることが難しい一方で,GPT-4 で比較的高い精度が得られることを確認した.}, title = {歴史的日本語資料を対象とした場所参照表現抽出―「おくのほそ道」を例として―}, year = {2023} }