WEKO3
アイテム
機械学習を用いた日本語複合辞のチャンキング
https://ipsj.ixsq.nii.ac.jp/records/47983
https://ipsj.ixsq.nii.ac.jp/records/47983240f5b56-5232-4268-98fe-bdff100ea9c3
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-11-22 | |||||||
タイトル | ||||||||
タイトル | 機械学習を用いた日本語複合辞のチャンキング | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Chunking Japanese Compound Functional Expressions by Machine Learning | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
京都大学大学院情報学研究科 | ||||||||
著者所属 | ||||||||
情報通信研究機構 | ||||||||
著者所属 | ||||||||
豊橋技術科大学 情報メディア基盤センター | ||||||||
著者所属 | ||||||||
京都大学工学部 | ||||||||
著者所属 | ||||||||
京都大学大学院情報学研究科 | ||||||||
著者所属 | ||||||||
名古屋大学大学院 工学研究科 | ||||||||
著者所属 | ||||||||
情報通信研究機構 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Information and Communications Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Information and Media Center, Toyohashi University of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Kyoto University, Faculty of Engineering | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information, Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Information and Communications Technology | ||||||||
著者名 |
注連, 隆夫
内元, 清貴
土屋雅稔
高木, 俊宏
宇津呂, 武仁
佐藤理史
井佐原, 均
× 注連, 隆夫 内元, 清貴 土屋雅稔 高木, 俊宏 宇津呂, 武仁 佐藤理史 井佐原, 均
|
|||||||
著者名(英) |
Takao, SHIME
KiyotakaUCHIMOTO
MasatoshiTSUCHIYA
ToshihiroTAKAGI
TakehitoUTSURO
SatoshiSATO
HitoshiISAHARA
× Takao, SHIME KiyotakaUCHIMOTO MasatoshiTSUCHIYA ToshihiroTAKAGI TakehitoUTSURO SatoshiSATO HitoshiISAHARA
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,Support Vector Machine(SVM) を用いたチャンカーYamCha を利用して,日本語複合辞の検出器を学習し,その性能評価を行った.SVM は従来からある学習モデルと比較して,入力次元数に依存しない高い汎化能力を持ち,Kernel 関数を導入することで効率良く素性の組合わせを考慮しながら分類問題を学習することが可能である.SVMを日本語複合辞の検出に適用し,実際のタグ付きデータを用いて解析を行った結果,日本語複合辞を構成している形態素の数の情報,形態素の日本語複合辞における位置情報を考慮した場合,交差検定によりF 値で約94 という高精度の結果が得られた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes to learn a detector of Japanese compound functional expressions using the chunker YamCha based on Support Vector Machines (SVMs), and presents the result of evaluating the performance of the detector. It is well-known that SVMs achieve high generalization performance, and furthermore, by introducing the Kernel principle, SVMs can carry out training with smaller computational cost independent of the dimensionality of the feature space. As features of SVM learning, we consider the number of morphemes constituting a compound functional expression, and the position of each morpheme within a functional expression. We achieve the cross validation result of the F-value as 94, which shows the effectiveness the proposed method. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2005, 号 117(2005-NL-170), p. 135-142, 発行日 2005-11-22 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |