Item type |
Journal(1) |
公開日 |
2018-02-15 |
タイトル |
|
|
タイトル |
日本語Wikificationにおけるアンカー抽出器および評価用コーパスの構築 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Building Anchor Extractor and Evaluation Corpus for Japanese Wikification |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[特集:人文科学とコンピュータ] Wikification,エンティティ・リンキング,アンカー抽出 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
静岡大学 |
著者所属 |
|
|
|
静岡大学 |
著者所属 |
|
|
|
静岡大学 |
著者所属 |
|
|
|
静岡大学 |
著者所属(英) |
|
|
|
en |
|
|
Shizuoka University |
著者所属(英) |
|
|
|
en |
|
|
Shizuoka University |
著者所属(英) |
|
|
|
en |
|
|
Shizuoka University |
著者所属(英) |
|
|
|
en |
|
|
Shizuoka University |
著者名 |
小谷, 亮太
綱川, 隆司
西田, 昌史
西村, 雅史
|
著者名(英) |
Ryota, Kotani
Takashi, Tsunakawa
Masafumi, Nishida
Masafumi, Nishimura
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,日本語文書中の語句に,Wikipedia記事へのリンクを付与するwikificationタスクにおいて,リンク付与に値する重要な語句等を選択するアンカー抽出器について検討を行う.本研究ではWikipediaにおけるリンクのガイドラインに準じたアンカー抽出基準をベースに,文書に適度にリンクを付与してWikipedia記事と結び付けることにより,文書の理解の可能性を高めることをねらいとする.日本語におけるアンカー抽出に有効と考えられる素性として,アンカーの前接語・後接語との関係をとらえた素性,および共起するアンカーの条件付きkeyphraseness素性の利用を提案する.また,一般的な日本語文書に対するアンカー抽出器の性能評価を行うため,日本語Wikificationコーパスに対して本研究で定めたアンカー抽出基準に従ってアンカー抽出作業を行い,評価用コーパスを構築した.評価実験により,提案した素性を既存手法に加えることで性能が改善することが示された.また,評価用コーパスを用いた実験では,正解率においてアンカー抽出作業者の2者間一致率の平均と同程度の性能が得られていることを確認した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
This paper proposes a novel method for anchor extraction, which is to identify words/phrases worthy linking to the corresponding Wikipedia articles, in Japanese wikification. The aim of this study is to enhance understandability of a document by connecting the document and Wikipedia articles with appropriate links annotated on the basis of anchor extraction criteria that we defined according to the Wikipedia linking guideline. We build a Japanese anchor extractor with using two proposed new features: one is preceding/succeeding words of the target anchor and the other is keyphraseness conditioned with cooccurring anchors. In addition, we build an evaluation corpus for anchor extractor in Japanese text, which is manually annotated to the Japanese Wikification Corpus, according to our anchor extraction criteria. The experimental result shows that the proposed features are effective for improving the performance by introducing them into the existing method. We confirm that the proposed method achieves anchor detection accuracy similar to the mean agreement rate of two human annotators of the evaluation corpus. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
書誌情報 |
情報処理学会論文誌
巻 59,
号 2,
p. 306-314,
発行日 2018-02-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |