Item type |
Symposium(1) |
公開日 |
2014-12-06 |
タイトル |
|
|
タイトル |
古典中国語形態素解析による地名の自動抽出 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Extraction of Place Names from Classical Chinese Texts Using Morphological Analysis |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
文字情報;;コーパス |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
京都大学 |
著者所属 |
|
|
|
京都大学 |
著者所属 |
|
|
|
京都大学 |
著者所属 |
|
|
|
関西大学 |
著者所属 |
|
|
|
関西大学 |
著者所属 |
|
|
|
大阪大学 |
著者所属(英) |
|
|
|
en |
|
|
Center for Informatics in East Asian Studies, Institute for Research in Humanities Kyoto University |
著者所属(英) |
|
|
|
en |
|
|
Center for Informatics in East Asian Studies, Institute for Research in Humanities Kyoto University |
著者所属(英) |
|
|
|
en |
|
|
Center for Informatics in East Asian Studies, Institute for Research in Humanities Kyoto University |
著者所属(英) |
|
|
|
en |
|
|
Faculty of Foreign Language Studies Kansai University |
著者所属(英) |
|
|
|
en |
|
|
Faculty of Letters Kansai University |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Language and Culture Osaka University |
著者名 |
安岡, 孝一
守岡, 知彦
ウィッテルン, クリスティアン
山崎, 直樹
二階堂, 善弘
鈴木, 慎吾
|
著者名(英) |
Koichi, Yasuoka
Tomohiko, Morioka
Christian, Wittern
Naoki, Yamazaki
Yoshihiro, Nikaido
Shingo, Suzuki
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
MeCabを用いた古典中国語の形態素解析に際し,地名に特化した自動抽出法を提案する.具体的には,形態素解析に用いる古典中国語辞書に,地名を大量に追加する手法を提案する.ただし,そのような手法においては,「1 文字の地名」と同一の漢字が別の意味をも持ちうる場合,それら対抗用例に誤検出が生じる可能性がある.この問題に対し,我々は,地名用例を含む古典中国語形態素コーパスと,その対抗用例コーパスの両方を準備することで,誤検出を低く抑えることに成功した.合わせて,古典中国語辞書に含まれる地名の数と,F 値との関係を調べ,本稿の手法の定量的評価を試みた. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In this paper we propose a method to extract place names from classical Chinese texts. In the method, we use our original morphological analyzer based on MeCab with our digital dictionary, in which we especially added many place names. A place name with one character can be easily mistaken for another morpheme. We include many example sentences with place names in our digital corpus, and also include many counter-examples in the corpus, in order to reduce incorrect detection. Additionally, we evaluate the method quantitatively using F-measure, changing the number of place names in the dictionary. |
書誌情報 |
じんもんこん2014論文集
巻 2014,
号 3,
p. 63-68,
発行日 2014-12-06
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |