WEKO3
アイテム
HMMによる日本語形態素解析システムのパラメータ学習
https://ipsj.ixsq.nii.ac.jp/records/49168
https://ipsj.ixsq.nii.ac.jp/records/491688f96a706-dc17-4667-b6f1-2e80b30f1115
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1995 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1995-07-20 | |||||||
タイトル | ||||||||
タイトル | HMMによる日本語形態素解析システムのパラメータ学習 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Learning Parameters of Japanease Morphological Analyzer based - on Hidden Markov Model | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者名 |
竹内, 孔一
× 竹内, 孔一
|
|||||||
著者名(英) |
Kouichi, Takeuchi
× Kouichi, Takeuchi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 日本語の形態素解析は自然言語処理を行なう上で最も基本的でかつ重要な処理である。我々の研究室で開発している形態素解析システムJUMANは、品詞の連接と単語に対してコストによる制約を与えることで曖昧性の絞り込みを行なっている。コスト値はJUMANの品質に大きな影響を与えるにも関わらず、人手で付与されるため最適化する機構は存在しなかった。そこで、本研究では、英語のタグづけなどで効果を発揮しているHMM (idden Markov Mode)を用いて、コーパスによる学習を行なうことでJUMANのコスト値、すなわちパラメータの最適化を行なう。HMM学習の結果、現在のJUMANの解析精度を改善する結果が得られた。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Morphological analysis is the first step toward the analysis of Japanese texts and one of the most important processes. So far, we have been developing the Japanease morphological analyzer JUMAN as a public-domain system. In JUMAN, ambiguities of morphological analysis are reduced by means of costs manually attached to the connectivity rules and words. The performance of JUMAN largely depends on those manually attached costs, while at present JUMAN has no facility to optimize the costs. This paper proposes a method for optimizing the costs (i.e. parameters) to be attached to the connectivity rules and words. The proposed method is based on hidden Markov model, which has proved effective in parameter estimation of English part-of-speech tagging. The result of experiments shows that the proposed optimization method improves the manually attached parameters. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 1995, 号 69(1995-NL-108), p. 13-19, 発行日 1995-07-20 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |