WEKO3
アイテム
係り受け解析器の部分解析精度評価とその利用
https://ipsj.ixsq.nii.ac.jp/records/61107
https://ipsj.ixsq.nii.ac.jp/records/61107488cfaef-ee85-46ac-99d1-0cfb9f8b7ba7
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-01-15 | |||||||
タイトル | ||||||||
タイトル | 係り受け解析器の部分解析精度評価とその利用 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Partial Accuracy Evaluation of Dependency Parsers and Its Application | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Nara Institute of Science and Technology | ||||||||
著者名 |
岩立, 将和
浅原, 正幸
松本, 裕治
× 岩立, 将和 浅原, 正幸 松本, 裕治
|
|||||||
著者名(英) |
Masakazu, Iwatate
Masayuki, Asahara
Yuji, Matsumoto
× Masakazu, Iwatate Masayuki, Asahara Yuji, Matsumoto
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では SVM に基づく 3 種類の日本語係り受け解析器 (Shift-Reduce モデル,Cascaded Chunking モデル,トーナメントモデル) の部分解析精度の評価を行う.まず,SVM の出力する分離平面からの距離をスコアと見なし,このスコアと部分解析精度と関連を調査する.次に SVM のスコアに基づき,被覆率-正解率曲線を調査した.京大コーパスを用いた実験結果では,トーナメントモデルによる手法が最も高性能であり,SVM のスコア順に係り受け関係を選択することで 99% の正解率で 60% の被覆率を達成できることがわかった.この結果に基づき,SVM のスコアを用いた日本語係り受け解析器の能動学習の予備実験を行った.予備実験結果により,人手によるタグ付けコストを削減しながら,高性能な係り受け解析器を構築できることが確認された. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper investigates the accuracy of partial parsing of three SVM-based Japanese dependency parsing models: the shift-reduce model, the cascaded chunking model, and the tournament model. First, we show the relationship between the partial parsing accuracy and the scores produced by SVMs. Second, we show coverage-accuracy curves based on the SVM scores. Performance evaluation with the Kyoto Text Corpus shows that the partial parsing accuracy of the tournament model is the highest among the three dependency parsing methods. The tournament model achieves 99% accuracy with 60% bunsetsu-based coverage. We also explore the usage of the SVM scores for active sampling. Preliminary experiments show that SVM score-based active sampling can be used to collect effective training examples for Japanese dependency parsing with less manual effort. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10114171 | |||||||
書誌情報 |
研究報告情報学基礎(FI) 巻 2009, 号 2(2009-FI-93), p. 41-48, 発行日 2009-01-15 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |