WEKO3
アイテム
Wikipedia カテゴリ階層構造の固有名詞分類実験における効果
https://ipsj.ixsq.nii.ac.jp/records/61109
https://ipsj.ixsq.nii.ac.jp/records/61109006389b0-4342-4b61-addd-aef0d36258be
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-01-15 | |||||||
タイトル | ||||||||
タイトル | Wikipedia カテゴリ階層構造の固有名詞分類実験における効果 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Effect of hierarchical category structures of Wikipedia in experiments for named entity categorization | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
富士ゼロックス株式会社研究技術開発本部 | ||||||||
著者所属 | ||||||||
富士ゼロックス株式会社研究技術開発本部 | ||||||||
著者所属 | ||||||||
富士ゼロックス株式会社研究技術開発本部 | ||||||||
著者所属 | ||||||||
富士ゼロックス株式会社研究技術開発本部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Research &, Technology Group, Fuji Xerox Co., Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Research &, Technology Group, Fuji Xerox Co., Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Research &, Technology Group, Fuji Xerox Co., Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Research &, Technology Group, Fuji Xerox Co., Ltd. | ||||||||
著者名 |
杉原, 大悟
× 杉原, 大悟
|
|||||||
著者名(英) |
Daigo, Sugihara
× Daigo, Sugihara
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,Wikipedia の記事タイトルを機械学習手法を用いて固有名詞クラスへと分類する際に Wikipedia のカテゴリ階層を分類器の素性として用いた場合の効果について報告する.ある記事タイトルに関連する Wikipedia のカテゴリネットワーク情報を分類器の素性として用いるために,あるカテゴリのカテゴリ階層構造をシンプルな基準 「主要カテゴリからの最短経路」 によって Wikipedia のカテゴリネットワークから抽出した.Wikipedia の語を関根の拡張固有名詞階層へ機械学習手法を用いて分類する実験において,得られたカテゴリ階層構造の効果を確認した.固有名詞クラスの粒度は荒いクラス分類 (固有名詞階層の深さ 2 ) と細かいクラス分類 (固有名詞階層の深さ 4 ) の 2 種類を用意し,荒い固有名詞分類においては 7 クラスおよび 15 クラスへと分類する実験,細かい固有名詞分類においては 118 クラスへと分類する実験を行った.カテゴリ階層構造を用いない場合と比較して,カテゴリ階層構造を用いた場合に,より良い F 値が得られた.最良の分類器による精度はそれぞれ F 値 91.33,F 値 89.68,F 値 84.06 であった.また,カテゴリ階層構造は Recall の向上に特に効果的であり,その効果は分類先の固有名詞分類の粒度が細かくなれば減少することが分かった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We consider the effect of hierarchical category structures of Wikipedia in experiments for named entity categorization based on machine learning methods. We extracted hierarchical category structures of each category simply based on the shortest path from " Category:Main Category" of Wikipedia. We checked the effect of the hierarchical category structure in categorization of term of Wikpedia to named entity class defined by Sekine's Extended Named Entity Hierarchy. We prepared 3 types of experimental settings on the number and granularity of named entity classes: The first one is categorization to rough-grained 7 classes of named entity, the second is categorization to rough-grained 15 classes of named entity and the third is categorization to fine-grained 118 classes of named entity. The classifier learned with the hierarchical category structure got better than those without hierarchical category structure in F-measure. The F-measures of our best classifier are respectively 91.33%, 89.68% and 84.06% in above 3 experimental settings. Our study found that hierarchical category structures are especially effective in the recognition of named entities in categorization to rough-grained classes of named entity and its effect declines in categorization to fine-grained classes of named entity. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10114171 | |||||||
書誌情報 |
研究報告情報学基礎(FI) 巻 2009, 号 2(2009-FI-93), p. 57-64, 発行日 2009-01-15 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |