WEKO3
アイテム
点予測による形態素解析
https://ipsj.ixsq.nii.ac.jp/records/70316
https://ipsj.ixsq.nii.ac.jp/records/70316cf01668f-0115-4058-8f58-a34957bb5a31
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2010-09-09 | |||||||
| タイトル | ||||||||
| タイトル | 点予測による形態素解析 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Morphological Analysis with Pointwise Predictors | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 解析 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 京都大学情報学研究科 | ||||||||
| 著者所属 | ||||||||
| 京都大学情報学研究科 | ||||||||
| 著者所属 | ||||||||
| 京都大学情報学研究科 | ||||||||
| 著者所属 | ||||||||
| 京都大学情報学研究科 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Kyoto University, School of Informatics | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Kyoto University, School of Informatics | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Kyoto University, School of Informatics | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Kyoto University, School of Informatics | ||||||||
| 著者名 |
中田, 陽介
Neubig, Graham
森, 信介
河原, 達也
× 中田, 陽介 Neubig, Graham 森, 信介 河原, 達也
|
|||||||
| 著者名(英) |
Yosuke, Nakata
Graham, Neubig
Shinsuke, Mori
Tatsuya, Kawahara
× Yosuke, Nakata Graham, Neubig Shinsuke, Mori Tatsuya, Kawahara
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 本論文では、形態素解析の問題を単語分割と品詞推定に分解し、それぞれの処理で点予測を用いる手法を提案する。点予測とは、分類器の素性として、周囲の単語境界や品詞等の推定値を利用せずに、周囲の文字列の情報のみを利用する方法である。点予測を用いることで、柔軟に言語資源を利用することができる。特に分野適応において、低い人的コストで、高い分野適応性を実現できる。提案手法の評価として、言語資源が豊富な一般分野において、既存手法である CRF と形態素 n-gram モデルと品詞 2-gram モデル (HMM) との解析精度の比較を行い、同程度の精度を得た。さらに、提案手法の分野適応性を評価するための評価実験を行い、高い分野適応性を示す結果を得た。 | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | This paper proposes an approach to Japanese morphological analysis that divides the prediction process into word segmentation and part-of- speech estimation, then solves each step with pointwise predictors. Pointwise prediction uses as its feature set only surface information about the surrounding character strings, without relying on predicted information such as surrounding POS tags or word boundaries. This allows for the flexible use of a variety of linguistic resources, making it possible to achieve domain adaptation with a minimum amount of annotation. An evaluation was performed on a well-resourced general domain morphological task, and it was found that the proposed method achieved results comparable to those of existing methods such as CRFs, morpheme n-gram models, and POS 2-gram models (HMM). In addition, a domain adaptation experiment found that the proposed method was able to achieve effective domain adaptation with a smaller amount of annotation. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10115061 | |||||||
| 書誌情報 |
研究報告自然言語処理(NL) 巻 2010-NL-198, 号 8, p. 1-7, 発行日 2010-09-09 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||