| Item type |
SIG Technical Reports(1) |
| 公開日 |
2023-11-25 |
| タイトル |
|
|
タイトル |
歴史的日本語資料を対象とした場所参照表現抽出―「おくのほそ道」を例として― |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Location Mention Recognition from Japanese Historical Documents―A Case Study of Oku no Hosomichi |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
教育・文学 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
奈良先端科学技術大学院大学 |
| 著者所属 |
|
|
|
情報通信研究機構/奈良先端科学技術大学院大学/国立国語研究所 |
| 著者所属 |
|
|
|
奈良先端科学技術大学院大学/理化学研究所/国立国語研究所 |
| 著者所属 |
|
|
|
奈良先端科学技術大学院大学 |
| 著者名 |
片山, 歩希
東山, 翔平
大内, 啓樹
渡辺, 太郎
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
歴史的日本語資料には,当時の地理空間上に存在した人物・事物や,そこで起きた出来事・事象についての情報が記録されているものがある.そうした情報を,地理空間,つまり「場所」の観点を踏まえて構造化することで,古人が辿った地理的軌跡を明らかにしたり,災害伝承の記録を掘り起こすといった,資料の内容の調査・分析が容易になると考えられる.本研究では,歴史的日本語資料に対する地理的な情報構造化に向けた最初のステップとして,近世紀行文「おくのほそ道」に含まれる場所参照表現の抽出に取り組む.「おくのほそ道」本文に場所参照表現を人手付与したデータセットを用いて,既存の自然言語処理システム,GiNZA および ChatGPT(GPT-3.5およびGPT-4)の抽出精度を調査した.実験結果から,GiNZA の一般的な現代日本語向け固有表現抽出モデルでは十分な精度を得ることが難しい一方で,GPT-4 で比較的高い精度が得られることを確認した. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
| 書誌情報 |
研究報告自然言語処理(NL)
巻 2023-NL-258,
号 9,
p. 1-4,
発行日 2023-11-25
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |