WEKO3
アイテム
統計的日本語固有表現抽出における固有表現まとめ上げ手法とその評価
https://ipsj.ixsq.nii.ac.jp/records/48607
https://ipsj.ixsq.nii.ac.jp/records/48607f4dfb5ae-de30-4bf4-8cd2-4b38d4a42708
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2000-09-21 | |||||||
タイトル | ||||||||
タイトル | 統計的日本語固有表現抽出における固有表現まとめ上げ手法とその評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Named Entity Chunking Techniques and their Evaluation in Japanese Statistical Named Entity Recognition | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
富士通研究所 | ||||||||
著者所属 | ||||||||
豊橋技術科学大学情報工学系 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Fujitsu Laboratories, Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information and Computer Sciences, Toyohashi University of Technology | ||||||||
著者名 |
颯々野, 学
× 颯々野, 学
|
|||||||
著者名(英) |
Manabu, Sassano
× Manabu, Sassano
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,統計的手法に基づく日本語固有表現のまとめ上げの問題に対して,性能を大きく左右する四つの要因,i)固有表現まとめ上げ状態の表現法,ii)現在位置の周囲の形態素を何個まで考慮するか,iii)個々の形態素の素性,iv)統計的学習法,について,これまで日本語固有表現のまとめ上げにおいてはその有効性が確認されていない幾つかの方式を実験的に評価し,その得失について報告する.特に,ii)について,現在位置の形態素が,いくつの形態素から構成される固有表現の一部であるかを考慮して学習を行なう可変長モデルを新たに提案する.実験の結果,先行研究で用いられた固定長モデルの性能を大きく上回る結果が得られ,可変長モデルの有効性が確認できた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper focuses on the issue of named entity chunking in Japanese named entity recognition. We discuss the issues of i)encoding schemes of named entity chunking states, ii)models of preceding/subsequent morphemes as contextual clues, iii)features of each morpheme, and iv)statistical learning techniques. Especially, as for ii), we propose a novel model, namely the variable length model, which incorporates richer contextual information as well as patterns of constituent morphemes within a named entity. We also show that that the proposed model outperforms previous approaches. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2000, 号 86(2000-NL-139), p. 1-8, 発行日 2000-09-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |