| Item type |
SIG Technical Reports(1) |
| 公開日 |
2003-11-06 |
| タイトル |
|
|
タイトル |
偽似訓練データを用いた語義曖昧性解消の改善 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Improving Word Sense Disambiguation by Pseudo Training Data |
| 言語 |
|
|
言語 |
jpn |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
奈良先端科学技術大学院大学情報科学研究科 |
| 著者所属 |
|
|
|
奈良先端科学技術大学院大学情報科学研究科 |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science, Nara Institute of Science and Technology |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science, Nara Institute of Science and Technology |
| 著者名 |
王, 小捷
松本, 裕治
|
| 著者名(英) |
Wang, Xiaojie
Matsumoto, Yuji
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
この論文は、語義曖昧性解消性脳を改善する方法を提案する。教師付分類器の特徴スペースを、語義が付けられたサンプルおよび偽似訓練データの両方からの特徴を組み合わせることにより拡張する。偽似訓練データを自動的に集めることができる方法を提案し,特徴スペースが十分に大きな規模まで拡張することができることを示す。また、語義が付けられたサンプル中に見えない単語の確率は偽似訓練データ中のその頻度によって平滑されるので、見えない特徴を区別することが出来る。実験は、この方法によってもたらされた著しい改善を示した。 |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
This paper suggests a method to improve quality for word sense disambiguation. Feature spaces of supervised classifiers are extended and enhanced by combining features both from tagged samples and pseudo samples. Since pseudo samples can be collected automatically, feature spaces can be extended to a scale large enough, and probabilities for unseen words in tagged samples are smoothed according to its frequency in pseudo samples, which enable distinguishing between features unseen in tagged samples. Experiments have shown a significant improvement brought by this method. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
| 書誌情報 |
情報処理学会研究報告自然言語処理(NL)
巻 2003,
号 108(2003-NL-158),
p. 115-120,
発行日 2003-11-06
|
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |