WEKO3
アイテム
点予測と系列予測の2段階化による品詞推定の精度向上
https://ipsj.ixsq.nii.ac.jp/records/72549
https://ipsj.ixsq.nii.ac.jp/records/72549a6221da8-da65-486a-81ae-5bfd7f4d23e4
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-01-21 | |||||||
タイトル | ||||||||
タイトル | 点予測と系列予測の2段階化による品詞推定の精度向上 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Improving Part-of-Speech Tagging by Combining Pointwise and Sequence-based Predictors | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | NL-1 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
京都大学情報学研究科 | ||||||||
著者所属 | ||||||||
京都大学情報学研究科 | ||||||||
著者所属 | ||||||||
京都大学情報学研究科 | ||||||||
著者所属 | ||||||||
京都大学情報学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Kyoto University, School of Informatics | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Kyoto University, School of Informatics | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Kyoto University, School of Informatics | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Kyoto University, School of Informatics | ||||||||
著者名 |
中田, 陽介
× 中田, 陽介
|
|||||||
著者名(英) |
Yosuke, Nakata
× Yosuke, Nakata
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では、点予測による形態素解析の推定結果に対して、品詞連接の傾向を用いた系列予測による品詞のリランキング手法を提案する。点予測とは、分類器の素性として対象とその周辺の文字列情報のみを用いる手法であり、この手法により高い分野適応性を実現している。しかし、点予測では品詞推定に有用な品詞連接の傾向を利用することができない。品詞連接の傾向は分野依存性が低いと考えられ、異なる分野で学習した品詞連接の傾向を利用できると考えられる。この品詞連接の傾向を用い、点予測の品詞推定結果に対してリランキングすることにより解析精度の向上を実現する。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes an approach to part-of-speech sequence reranking based on POS transition tendencies fot the result of morphological analysis with point-wise predictors. Pointwise prediction uses as its feature set only surface information about the surrounding character strings, without relying on predicted information such as surrounding POS tags or word boundaries. This allows for the flexible use of a variety of linguistic resources, making it possible to achieve domain adaptation with a minimum amount of annotation. But point-wise prediction cannot use POS transition information that is important in POS prediction. It can be assumed that the transition tendencies of POSs are not highly domain dependent, transition information learned in one domain can be used in another domain. By applying POS sequence reranking that considers POS transition information to the result of pointwise predictors, we were able to achieve an improvement in POS tagging accuracy. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
研究報告 自然言語処理(NL) 巻 2011-NL-200, 号 2, p. 1-8, 発行日 2011-01-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |