WEKO3
アイテム
オープンアクセスを想定した日本語学術論文ファイルの自動判定
https://ipsj.ixsq.nii.ac.jp/records/43011
https://ipsj.ixsq.nii.ac.jp/records/430114ab643fe-170c-4f3c-a5ad-3e816ccfcba5
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-03-22 | |||||||
タイトル | ||||||||
タイトル | オープンアクセスを想定した日本語学術論文ファイルの自動判定 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Automatic identification of academic articles in Japanese PDF files towards open-access | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
亜細亜大学 | ||||||||
著者所属 | ||||||||
駿河台大学 | ||||||||
著者所属 | ||||||||
大東文化大学 | ||||||||
著者所属 | ||||||||
作新学院大学 | ||||||||
著者所属 | ||||||||
鉄道総合技術研究所 | ||||||||
著者所属 | ||||||||
慶應義塾大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Asia University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Railway Technical Research Institute | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Daito Bunka Univ. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Sakushingakuin University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Surugadai University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Keio University | ||||||||
著者名 |
安形, 輝
× 安形, 輝
|
|||||||
著者名(英) |
Teru, AGATA
× Teru, AGATA
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | オープンアクセス環境が進展するにつれ、セルフアーカイビングの形式で自らの研究成果を公開する研究者が急増している。そのような成果は、従来のすべてのウェブを対象とする検索エンジンからもアクセスが可能であるが、検索結果中の他のものに埋没してしまうことが多い。そこで、本研究ではウェブコンテンツ中からの学術論文、あるいは論文に準ずるコンテンツを判定するシステム構築を目指し、SVMなど、多くの手法を用いて自動判定実験を行った。自動判定の手がかりとなる属性群としてはファイル中に出現する語と経験的なルール群を用いた。実験ではSVMでは高い精度、ナイーブベイズでは高い再現率が得られるなど、各手法の特性が明らかとなった。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | As open-access becomes common, many researchers deposit their research products in a publicly accessible web (i.e. self-archiving). Although they are accessible from general search engines, massive other contents tend to hide them. The purpose of this research is to identify academic articles or quasi-articles from the entire web automatically. In this paper we conduct experiments on the performance of various classifiers and compare in terms of precision, recall, F-value. The classifiers used such attributes as terms appeared in PDF files and empirical rules. The diverse performance of each classifier discloses its characteristics. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10539261 | |||||||
書誌情報 |
情報処理学会研究報告デジタルドキュメント(DD) 巻 2006, 号 33(2006-DD-054), p. 55-62, 発行日 2006-03-22 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |