WEKO3
アイテム
部分木に基づくマルコフ確率場と言語解析への適用
https://ipsj.ixsq.nii.ac.jp/records/48256
https://ipsj.ixsq.nii.ac.jp/records/48256c85dc722-8230-4264-9c29-072d154b6c18
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2003 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2003-09-29 | |||||||
タイトル | ||||||||
タイトル | 部分木に基づくマルコフ確率場と言語解析への適用 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Subtree - based Markov Random Fields and Its application to Natural Language Analysis | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者名 |
工藤, 拓
× 工藤, 拓
|
|||||||
著者名(英) |
Taku, Kudo
× Taku, Kudo
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年 統計的言語処理の分野において 分類アルゴリズムを順次適用して結果を得る History-based Methods に代わり 解析木 解析タグ列 1つを学習データとみなし 大域的な最適解を導出できるモデル(マルコフ確率場 (MRF) 条件付き確率場(CRF))が注目を浴びている.しかし 素性の設計は任意であり 恣意的に設計されることが多かった. 本稿では MRFに基づく言語解析のための 一般的で 効率よい素性選択手法を提案する. 具体的には 全部分木を素性候補とし 統計的な相関性に基づき 有益な素性を選択する. 英語の品詞タグ付け 英語の基本句同定を用いて有効性を検証したところ 従来手法に比べ 高精度を示した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Global discriminative models, such as Markov Random Fields, (MRF) and Conditional Random Fields (CRF), have gained a great attention in the statistical natural language analysis. These models are shown to outperform the history-based approaches, where a parsed-tree can be generated by a sequential process of classifications. In the global optimization with MRF/CRF, the feature set can be selected heuristically. In this paper, we propose a subtree-based log-linear model, where statistically-useful subtrees are used as a feature set. Experiments with POS-Tagging and Base-Phrase Chunking show that our approaches outperform the previous heuristic selections. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2003, 号 98(2003-NL-157), p. 33-40, 発行日 2003-09-29 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |