WEKO3
アイテム
古典中国語形態素解析のための品詞体系再構築
https://ipsj.ixsq.nii.ac.jp/records/87016
https://ipsj.ixsq.nii.ac.jp/records/870161abb843d-130c-4f5a-a934-9747a3b8b793
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Symposium(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-11-10 | |||||||
タイトル | ||||||||
タイトル | 古典中国語形態素解析のための品詞体系再構築 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Refactoring of Wordclasses for Morphological Analysis of Classical Chinese | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
資源タイプ | conference paper | |||||||
著者所属 | ||||||||
関西大学外国語学部 | ||||||||
著者所属 | ||||||||
京都大学人文科学研究所 | ||||||||
著者所属 | ||||||||
京都大学人文科学研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Foreign Language studies Kansai University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute for Research in Humanities Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute for Research in Humanities Kyoto University | ||||||||
著者名 |
山崎, 直樹
守岡, 知彦
安岡, 孝一
× 山崎, 直樹 守岡, 知彦 安岡, 孝一
|
|||||||
著者名(英) |
Naoki, Yamazaki
Tomohiko, Morioka
Koichi, Yasuoka
× Naoki, Yamazaki Tomohiko, Morioka Koichi, Yasuoka
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本研究は、古典中国語に対して形態素解析を行うことを目的とし、古典中国語の品詞体系の再構築を試みた過程と現時点での形態素解析の結果報告である。本研究で用いる形態素解析エンジンは、オープンソースのMeCab である。MeCab は最低限、辞書があれば動作するが、形態素情報をもたせた学習用コーパスがあればより精度を高められる。しかし、古典中国語の解析用に作られた辞書も学習用コーパスもこれまでには存在しないため、本研究では、専用辞書の設計を行い、同時にそれに合わせて古典中国語の品詞体系の再構築を行った。この品詞体系の特徴は、(1) 形態的な特徴を手がかりとせず、個々の語彙の意味範疇を細分化した素性を用いること、(2) 作業者に複雑な判断を強いないように、コンテクストに依存した分類をできるだけ排除したことである。本論文では、この品詞体系構築の過程の報告と、それを用いた現段階での試行的な解析結果とを報告する。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper explains an overview of a refactoring of prototype morphological analyzer for Classical Chinese based on MeCab, especially it focuses on the redesigning of wordclasses for the morphological analyzer. The redesigned wordclasses are based on an analysis of morphological corpora developed with the prototype morphological analyzer. We are refactoring our dictionary based on the redesigned wordclasses, and we are also developing new corpora. The characteristics of the redesigned wordclasses use features: (1) that come from subcategorized word meaning, and (2) that are uniquely-determinable and context-free. This paper reports the policy and process of refactoring, and reports some results of test run. | |||||||
書誌情報 |
じんもんこん2012論文集 巻 2012, 号 7, p. 39-46, 発行日 2012-11-10 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |