WEKO3
アイテム
CRFによる和英文の参考文献文字列からの自動書誌要素抽出
https://ipsj.ixsq.nii.ac.jp/records/87374
https://ipsj.ixsq.nii.ac.jp/records/873747ecb78ba-191f-466c-9d16-b304800edb50
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2012-12-05 | |||||||
| タイトル | ||||||||
| タイトル | CRFによる和英文の参考文献文字列からの自動書誌要素抽出 | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 情報抽出と情報検索 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 岡山大学大学院自然科学研究科 | ||||||||
| 著者所属 | ||||||||
| 岡山大学大学院自然科学研究科 | ||||||||
| 著者所属 | ||||||||
| 国立情報学研究所 | ||||||||
| 著者所属 | ||||||||
| 国立情報学研究所 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Natural Science and Technology, Okayama University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Natural Science and Technology, Okayama University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| National Institute of Informatics | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| National Institute of Informatics | ||||||||
| 著者名 |
荒内大貴
太田学
高須淳宏
安達淳
× 荒内大貴 太田学 高須淳宏 安達淳
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 学術論文の参考文献に記述されている著者名や論文題目名といった書誌要素は,検索等で利用されるため非常に重要である.本稿では,この参考文献の文字列から自動で書誌要素を抽出する手法を提案する.提案手法では,参考文献文字列の様々な特徴を利用して, Conditional Random Fields (CRF) により,その文字列を分割したトークン列に対して,書誌要素ラベルを付与する.書誌要素抽出実験の結果,主要な書誌要素が和文で 96% 以上,英文で 93% 以上の精度で抽出できることが分かった. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10112482 | |||||||
| 書誌情報 |
研究報告データベースシステム(DBS) 巻 2012-DBS-156, 号 1, p. 1-8, 発行日 2012-12-05 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||