WEKO3
アイテム
トピックと属性を用いたブートストラップ法に基づく語彙獲得
https://ipsj.ixsq.nii.ac.jp/records/71036
https://ipsj.ixsq.nii.ac.jp/records/71036912e886e-9bf1-4580-a0f2-ba099ccdc9b5
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2010-11-11 | |||||||
タイトル | ||||||||
タイトル | トピックと属性を用いたブートストラップ法に基づく語彙獲得 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Entity Set Expansion based on Bootstrap Methods using the Topic Features and Attribute Constraints | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 語彙・知識獲得(2) | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
NTTサイバースペース研究所 | ||||||||
著者所属 | ||||||||
NTTサイバースペース研究所 | ||||||||
著者所属 | ||||||||
NTTサイバースペース研究所 | ||||||||
著者所属 | ||||||||
NTTサイバースペース研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Cyber Space Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Cyber Space Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Cyber Space Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Cyber Space Laboratories | ||||||||
著者名 |
貞光, 九月
× 貞光, 九月
|
|||||||
著者名(英) |
Kugatsu, Sadamitsu
× Kugatsu, Sadamitsu
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿ではコーパスからの語彙獲得を行う際に,トピック情報と属性情報を用いる手法を提案する.語彙が用いられている文書のトピックをトピックモデルを用いて推定し,新たな語彙獲得の際の素性として用いる.また,語彙が共通して持つ属性を文書中から選択し,それを語彙選択の制約条件として用いる.提案手法を用いることでセマンティックドリフトを軽減し,語彙の獲得精度が向上したことを示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes a bootstrapping entity set expansion method that utilizes the information of topics and attributes. In order to reduce the effect of semantic drifts, we introduce two distinctive features. The first is the topic of each document estimated by topic models. These topic features are used for the discriminative models. The second is the attributes occurring around entities. These attribute features are used as the constraints on candidate search of new entities. The experiments show that the accuracy of the extracted entities was improved. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2010-NL-199, 号 12, p. 1-8, 発行日 2010-11-11 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |