WEKO3
アイテム
カテゴリ階層を考慮した構造化パーセプトロンによる固有表現抽出
https://ipsj.ixsq.nii.ac.jp/records/96966
https://ipsj.ixsq.nii.ac.jp/records/969668116dc6c-f1d6-488f-af86-7e35476cdf23
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Trans(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-12-27 | |||||||
タイトル | ||||||||
タイトル | カテゴリ階層を考慮した構造化パーセプトロンによる固有表現抽出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Named Entity Recognition Exploiting Category Hierarchy Using Structured Perceptron | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | [オリジナル論文] 固有表現抽出,コスト考慮型学習,構造化パーセプトロン,GENIAコーパス | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
神戸大学大学院システム情報学研究科 | ||||||||
著者所属 | ||||||||
神戸大学大学院システム情報学研究科/現在,NTTコミュニケーション科学基礎研究所 | ||||||||
著者所属 | ||||||||
神戸大学大学院システム情報学研究科 | ||||||||
著者所属 | ||||||||
神戸大学大学院システム情報学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of System Informatics, Kobe University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of System Informatics, Kobe University / Presently with NTT Communication Science Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of System Informatics, Kobe University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of System Informatics, Kobe University | ||||||||
著者名 |
東山, 翔平
× 東山, 翔平
|
|||||||
著者名(英) |
Shohei, Higashiyama
× Shohei, Higashiyama
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 固有表現抽出は,テキスト中に現れる人名などの語句の同定を目的とする自然言語処理の基本的な問題である.抽出する固有表現は,人名や組織名など数種類を対象とすることが一般的であり,これらのカテゴリの間の関係は考慮しないことが多い.しかし,これらのカテゴリは階層性を有する場合があり,その場合,階層的に近い(遠い)という情報は抽出の際に活用できる可能性がある.本研究では,階層構造が定義された固有表現を対象に,階層的な近さの値を与えるコスト関数を定義する.機械学習手法である構造化パーセプトロンにコスト関数を導入し,カテゴリの階層性を考慮した固有表現抽出法を提案する.GENIAコーパスを用いて階層構造を持つ固有表現の抽出実験を行い,提案手法により,抽出の誤りの程度を小さくするとともに,正しい固有表現の抽出精度を高めることが可能になることを示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Named Entity Recognition (NER) is a fundamental natural language processing task concerned with the identification and classification of expressions into predefined categories (e.g., person, organization, location, etc). Existing NER systems usually target around ten categories and do not take into account category relations. However, it is often the case that categories naturally belong to some predefined hierarchy. When such is the case, the distance between categories in the hierarchy becomes a rich source of information which can be exploited and is intuitvely particularly useful when the categories are numerous. In this paper, we propose an NER system which can leverage category hierarchy information by introducing, in the structured perceptron framework, a cost function that penalizes more strongly category predictions which are far in the hierarchy from the correct category. We demonstrate the effectiveness of the proposed method through experiments on the GENIA biomedical text corpus, in particular in comparison to methods which do not take into account category hierarchy. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11464803 | |||||||
書誌情報 |
情報処理学会論文誌数理モデル化と応用(TOM) 巻 6, 号 3, p. 43-52, 発行日 2013-12-27 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7780 | |||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |