WEKO3
アイテム
ブートストラップによる低人手コスト日本語固有表現抽出
https://ipsj.ixsq.nii.ac.jp/records/48608
https://ipsj.ixsq.nii.ac.jp/records/4860887c82bdb-53a9-46fa-88d2-7b12c90602df
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2000-09-21 | |||||||
タイトル | ||||||||
タイトル | ブートストラップによる低人手コスト日本語固有表現抽出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Low Manual Cost Japanese Named Entity Recognition by Bootstrapping | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
豊橋技術科学大学情報工学系 | ||||||||
著者所属 | ||||||||
富士通研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information and Computer Sciences, Toyohashi University of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Fujitsu Laboratories, Ltd. | ||||||||
著者名 |
宇津呂, 武仁
× 宇津呂, 武仁
|
|||||||
著者名(英) |
Takehito, Utsuro
× Takehito, Utsuro
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,人手によって作成された少量の初期固有表現リストと大量の人手未解析コーパスから,ブートストラップにより日本語固有表現抽出規則を学習する手法を提案し,その実験的評価結果を報告する.実験の結果,ブートストラップのサイクルを経るにしたがって,初期固有表現リストによる固有表現抽出の性能(F値)が徐々に改善されるという結果が得られた.この結果により,少量の初期知識と大量の人手未解析コーパスを用いたブートストラップ法のアプローチが,日本語の固有表現のまとめ上げの問題においても,ある程度有効に機能することが確認できた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Approaches to named entity recognition that rely on hand-crafted rules and/or supervised learning techniques have limitations in terms of their portability into new domains as well as in the robustness over time. For the purpose of overcoming those limitations, this paper evaluates named entity chunking and classification techniques in Japanese named entity recognition in the context of minimally supervised learning. This experimental evaluation demonstrates that the minimally supervised learning method proposed here improved the performance of the seed knowledge on named entity chunking and classification. We also investigated the correlation between performance of the minimally supervised learning and the sizes of the training resources such as the seed set as well as the unlabeled training data. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2000, 号 86(2000-NL-139), p. 9-16, 発行日 2000-09-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |