| Item type |
SIG Technical Reports(1) |
| 公開日 |
2016-12-14 |
| タイトル |
|
|
タイトル |
日本語Wikificationコーパスを用いたアンカー抽出性能評価に関する検討 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Performance Evaluation of Anchor Extraction Using the Japanese Wikification Corpus |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
言語資源の構築と利用 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
静岡大学 |
| 著者所属 |
|
|
|
静岡大学 |
| 著者所属 |
|
|
|
静岡大学 |
| 著者所属 |
|
|
|
静岡大学 |
| 著者所属(英) |
|
|
|
en |
|
|
Shizuoka University |
| 著者所属(英) |
|
|
|
en |
|
|
Shizuoka University |
| 著者所属(英) |
|
|
|
en |
|
|
Shizuoka University |
| 著者所属(英) |
|
|
|
en |
|
|
Shizuoka University |
| 著者名 |
小谷, 亮太
綱川, 隆司
西田, 昌史
西村, 雅史
|
| 著者名(英) |
Ryota, Kotani
Takashi, Tsunakawa
Masafumi, Nishida
Masafumi, Nishimura
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
一般の文書から Wikipedia 記事へ自動的にリンクを貼る wikification の研究が現在注目されており,日本語においては日本語 Wikification コーパスが公開されている.Wikification にはリンクを貼るべき語句 (アンカー) の選定と,選定したアンカーのリンク先記事決定の 2 つの課題が挙げられる.前者の課題では wikification タスクをどう定義するかによってさまざまな選定方法が考えられることから,日本語 Wikification コーパスではアンカー選定の対象を固有表現に限定してリンク先記事のアノテーションを実施している.しかし,Wikipedia では記事において重要な一般名詞等がアンカーとして選択されるケースも多く,また,重要でない自明な固有名詞はアンカーとして選択されないこともあり,一般の文書に対するアンカー抽出の評価を行うには不十分である.本研究では一般名詞等を含むより広範囲なアンカー抽出の評価を行うため,日本語 Wikification コーパスに対して新たに人手でアンカー選定作業を行った.また,Wikipedia のリンクデータとこのコーパスを学習データとして用いて SVM によるアンカー抽出器を作成し,性能を評価した |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
| 書誌情報 |
研究報告自然言語処理(NL)
巻 2016-NL-229,
号 14,
p. 1-5,
発行日 2016-12-14
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |