WEKO3
アイテム
固有表現抽出のための大規模訓練データの自動獲得
https://ipsj.ixsq.nii.ac.jp/records/74062
https://ipsj.ixsq.nii.ac.jp/records/7406231ae466d-292f-4b32-8bfc-f567c9c55cb3
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-05-09 | |||||||
タイトル | ||||||||
タイトル | 固有表現抽出のための大規模訓練データの自動獲得 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Automatic Acquisition of Huge Training Data for Named Entity Recognition | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 学生セッション(3) | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属 | ||||||||
東北大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
マイクロソフトリサーチアジア | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Sciences, Tohoku University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Microsoft Research Asia | ||||||||
著者名 |
宇佐美, 佑
× 宇佐美, 佑
|
|||||||
著者名(英) |
Yu, Usami
× Yu, Usami
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 固有表現抽出は,質問応答や情報抽出などのアプリケーションにおいて基盤技術となっており,人名,地名,組織名,遺伝子名など,様々な意味クラスで試みられている.高い性能をもつ固有表現抽出器を構築するためには,あらかじめ意味クラスを付与した訓練データを用意し,機械学習アルゴリズムに基づいて構築するのが一般的である.しかしながら,訓練データの整備は,人手での作業に頼っているのが現状である.これでは,様々なドメイン・意味クラスで,広く固有表現抽出を利用しようにも,訓練データの入手性が固有表現抽出器構築のボトルネックになると考えられる.そこで,本研究では,より入手の容易な語彙データベースと生テキストを用いることで,固有表現抽出のための訓練データを人手に依らず自動的に獲得する手法を提案する.語彙データベースに含まれる豊富な情報を利用することで,高適合率な訓練データを自動獲得し,等位構造解析とself-trainingを適用することで,人手で作成した訓練データに迫る,高品質な訓練データを獲得した. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2011-SLP-86, 号 11, p. 1-8, 発行日 2011-05-09 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |