WEKO3
アイテム
CRF による係り受け解析の結果を反映させた日本語形態素解析
https://ipsj.ixsq.nii.ac.jp/records/61105
https://ipsj.ixsq.nii.ac.jp/records/611055a9514e2-3fbf-47c5-8222-23b0ac7110a1
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-01-15 | |||||||
タイトル | ||||||||
タイトル | CRF による係り受け解析の結果を反映させた日本語形態素解析 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Japanese Morphological Analysis Reflecting Result of Dependency Analysis Using CRFs | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
電気通信大学大学院電気通信学研究科情報通信工学専攻 | ||||||||
著者所属 | ||||||||
電気通信大学電気通信学部情報通信工学科 | ||||||||
著者所属 | ||||||||
電気通信大学電気通信学部情報通信工学科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Dept. of Informatin and Communication Engineering, Graduate school of Electro-Cmmunications | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Dept. of Information and Communication Engineering, The Univ. of Electro-Communications | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Dept. of Information and Communication Engineering, The Univ. of Electro-Communications | ||||||||
著者名 |
岸本, 貴之
高橋, 治久
堀田, 一弘
× 岸本, 貴之 高橋, 治久 堀田, 一弘
|
|||||||
著者名(英) |
Takayuki, Kishimoto
Haruhisa, Takahashi
Kazuhiro, Hotta
× Takayuki, Kishimoto Haruhisa, Takahashi Kazuhiro, Hotta
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,日本語形態素解析の精度を,条件付確率場 (CRF) による係り受け解析を用いて,改善する方法を提案する.従来の確率モデルによる形態素解析は,一般的に,1 個または 2 個前までの単語の品詞情報の相関関係によって,最適な候補を絞り込むというやり方を行っていた.しかし,それだけでは解析できない事例が存在しており,もっと広い範囲での単語の相関や,構文関係などを考慮に入れたモデルを考える必要がある.本稿では,形態素解析結果の候補に対し,係り受け解析を行い,その尤度を最大にする形態素解析結果により係り受け解析を選択する方法が,精度改善に有効であることを,従来法との比較実験により示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper presents a method of improving Japanese morphological analysis via Conditional Random Fields (CRFs) using the dependency analysis. Many existing probabilistic methods select a correct tokens by the correlation analysis between adjoining words and their part-of-speech. However, some instances cannot be correctly analyzed only with the correlation between adjoining words. In order to improve the accuracy, it would be needed to take into account correlation of words in wider range as well as syntactical features. We show that maximizing the likelihood of the dependency analysis for candidates of correct tokens improves the accuracy by computer experiments. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10114171 | |||||||
書誌情報 |
研究報告情報学基礎(FI) 巻 2009, 号 2(2009-FI-93), p. 27-32, 発行日 2009-01-15 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |