ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング


インデックスリンク

インデックスツリー

  • RootNode

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. バイオ情報学(BIO)
  3. 2012
  4. 2012-BIO-032

カテゴリ階層を考慮した構造化パーセプトロンによる固有表現抽出

https://ipsj.ixsq.nii.ac.jp/records/87218
https://ipsj.ixsq.nii.ac.jp/records/87218
bdd67ed7-177a-4fbd-be1a-d017a74b5192
名前 / ファイル ライセンス アクション
IPSJ-BIO12032025.pdf IPSJ-BIO12032025.pdf (427.4 kB)
Copyright (c) 2012 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2012-11-29
タイトル
タイトル カテゴリ階層を考慮した構造化パーセプトロンによる固有表現抽出
タイトル
言語 en
タイトル Named Entity Recognition Exploiting Category Hierarchy Using Structured Perceptron
言語
言語 jpn
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
神戸大学大学院システム情報学研究科
著者所属
神戸大学大学院システム情報学研究科
著者所属
神戸大学大学院システム情報学研究科
著者所属
神戸大学大学院システム情報学研究科
著者所属(英)
en
Graduate School of System Informatics, Kobe University
著者所属(英)
en
Graduate School of System Informatics, Kobe University
著者所属(英)
en
Graduate School of System Informatics, Kobe University
著者所属(英)
en
Graduate School of System Informatics, Kobe University
著者名 東山, 翔平 ブロンデル, マチュー 関, 和広 上原, 邦昭

× 東山, 翔平 ブロンデル, マチュー 関, 和広 上原, 邦昭

東山, 翔平
ブロンデル, マチュー
関, 和広
上原, 邦昭

Search repository
著者名(英) Shohei, Higashiyama Blondel, Mathieu Kazuhiro, Seki Kuniaki, Uehara

× Shohei, Higashiyama Blondel, Mathieu Kazuhiro, Seki Kuniaki, Uehara

en Shohei, Higashiyama
Blondel, Mathieu
Kazuhiro, Seki
Kuniaki, Uehara

Search repository
論文抄録
内容記述タイプ Other
内容記述 固有表現抽出は,テキスト中に現れる人名などの語句の同定を目的とする自然言語処理の基本的な問題である.抽出する固有表現は,人名や組織名など 10 種類程度を対象とすることが一般的であり,これらのカテゴリの間の関係は考慮しないことが多い.しかし,これらのカテゴリは階層性を有する場合があり,その場合,階層的に近い (遠い) という情報は抽出の際に活用できる可能性がある.本研究では,階層構造が定義された固有表現を対象に,階層的な近さの値を与えるコスト関数を定義する.機械学習手法である構造化パーセプトロンにコスト関数を導入し,カテゴリの階層性を考慮した固有表現抽出法を提案する. GENIA コーパスを用いて階層構造を持つ固有表現の抽出実験を行い,提案手法により,抽出の誤りの程度を小さくするとともに,抽出の精度を高めることが可能になることを示した.
論文抄録(英)
内容記述タイプ Other
内容記述 Named Entity Recognition (NER) is a fundamental natural language processing task concerned with the identification and classification of expressions into predefined categories (e.g., person, organization, location, etc). Existing NER systems usually target around ten categories and do not take into account category relations. However, it is often the case that categories naturally belong to some predefined hierarchy. When such is the case, the distance between categories in the hierarchy becomes a rich source of information which can be exploited and is intuitvely particularly useful when the categories are numerous. In this paper, we propose a NER system which can leverage category hierarchy information by introducing, in the structured perceptron framework, a cost function that penalizes more strongly category predictions which are far in the hierarchy from the correct category. We demonstrate the effectiveness of the proposed method through experiments on the GENIA biomedical text corpus, in particular in comparison to methods which do not take into account category hierarchy.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA12055912
書誌情報 研究報告バイオ情報学(BIO)

巻 2012-BIO-32, 号 25, p. 1-6, 発行日 2012-11-29
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-21 17:19:19.993589
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

上原, 邦昭, 2012: 情報処理学会, 1–6 p.

Loading...

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3