WEKO3
アイテム
Web文書タイプ自動分類手法の比較評価と適用
https://ipsj.ixsq.nii.ac.jp/records/58201
https://ipsj.ixsq.nii.ac.jp/records/5820186989352-1cc5-4f60-a980-cdd34bb4a6c4
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-03-19 | |||||||
タイトル | ||||||||
タイトル | Web文書タイプ自動分類手法の比較評価と適用 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Comparative Evaluation and Applications of Automatic Web-based Document Classification Methods | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
京都大学大学院 情報学研究科 社会情報学専攻 | ||||||||
著者所属 | ||||||||
(株)野村総合研究所 | ||||||||
著者所属 | ||||||||
(株)野村総合研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Social Informatics Kyoto University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Nomura Research Institute Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Nomura Research Institute Ltd. | ||||||||
著者名 |
井筒, 清史
× 井筒, 清史
|
|||||||
著者名(英) |
Kiyoshi, Izutsu
× Kiyoshi, Izutsu
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Webの高度な利活用のニーズとして,社会的な出来事に関してWeb空間上でのWebページ数の反応の把握がある.このニーズに応える手段として,Webページをインデキシングする技術であるWebの自動分類手法を用いることにした.本稿では,Webの自動分類器を作成し,社会的な出来事を把握するために利用し,その技術の有効な利用シーンを提示する.Webの自動分類器を作成するために,判別分析,Rule base,Naive Bayesの代表的な3つの手法の応用領域での性質について調べた.Webの自動分類手法の有効な利用方法を提示するため,ここでは特にRule Base分類器によるスマトラ島沖地震とノートパソコンの新製品販売・発表に関する時系列分析の実験を行った.各出来事が起こる前後で,予め定めたカテゴリーごとにWebページの数に特徴的な反応があることが観測された. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Numbers of web pages about social incidents are expected to be a good index of how the incident is considered in web communities. Possibilities were shown in this study that automated web page classification method can help those numerical analysis of web space. Discriminant Analysis method, Rule-Based method and Naive Bayes method were compared by their classification accuracy, developers' cost, users' cost, processing time and scalability. Practical experiments about the Sumatran Earthquake/Tsunami and a new Note PC Product show communities response differently around the time of the incidents. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11238429 | |||||||
書誌情報 |
情報処理学会研究報告電子化知的財産・社会基盤(EIP) 巻 2005, 号 32(2004-EIP-027), p. 25-32, 発行日 2005-03-19 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |