WEKO3
アイテム
個別の詳細記事抽出のためのWebページ分割手法の提案
https://ipsj.ixsq.nii.ac.jp/records/98508
https://ipsj.ixsq.nii.ac.jp/records/9850889fffdc5-cf7f-43f2-85e2-ef0636c5ad24
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2014 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2014-02-15 | |||||||
タイトル | ||||||||
タイトル | 個別の詳細記事抽出のためのWebページ分割手法の提案 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Proposal Research of Web Page Segmentation Method for Extracting and Describing Each Article in Detail | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | [特集:ネットワークサービスと分散処理] Webマイニング,ネットパトロール,投稿記事抽出,有害情報,Webページ分割 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
関西大学大学院総合情報学研究科 | ||||||||
著者所属 | ||||||||
大阪経済大学情報社会学部 | ||||||||
著者所属 | ||||||||
関西大学総合情報学部 | ||||||||
著者所属 | ||||||||
関西大学大学院総合情報学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics, Kansai University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Information Technology and Social Sciences, Osaka University of Economics | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Informatics, Kansai University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics, Kansai University | ||||||||
著者名 |
山本, 雄平
中村, 健二
田中, 成典
安彦, 智史
× 山本, 雄平 中村, 健二 田中, 成典 安彦, 智史
|
|||||||
著者名(英) |
Yuhei, Yamamoto
Kenji, Nakamura
Shigenori, Tanaka
Satoshi, Abiko
× Yuhei, Yamamoto Kenji, Nakamura Shigenori, Tanaka Satoshi, Abiko
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | インターネットに流通する有害情報から青少年を守る取り組みとして,ネットパトロールが行われている.ネットパトロールでは,有害情報が含まれる投稿記事を目視により確認しており,この作業を軽減するネットパトロール支援の研究が注目されている.ネットパトロール支援の研究の1つに,投稿者の見守りを目的としたWebクローラ開発の研究がある.この研究では,Webページを解析することで,情報の抽出を行っており,その中でWebページをブロック単位に分割する手法が用いられている.しかし,Webページをブロック単位に分割する場合,投稿記事が複数のブロックに分割される場合や,1つのブロックに複数の投稿記事が含まれる場合がある.そのため,効率的なネットパトロールを実現するには,Webページを投稿記事ごとに分割し,投稿記事を詳細に確認する必要がある.そこで,本研究では,Webページを記事単位に分割できる汎用的なWebページの分割手法を提案する.そして,本提案手法の有用性を検証するため,既存手法との比較実験を実施した.その結果,本提案手法が有用であることを証明した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | An Internet monitoring effort called “Net Patrol” is conducted to protect young people from harmful materials circulating on the Internet. In carrying out Net Patrol, post content that contains harmful materials is checked by visual inspection. Researches of supporting Net Patrol to reduce this work are attracting attention. One of the researching of supporting Net Patrol is a research of developing a web crawler for the purpose of watching contributors who submit posts. In this research, materials are extracted by analyzing web pages, using a method of dividing a web page on a block-by-block basis. However, when dividing a web page on a block-by-block basis, one post may be divided into multiple blocks in some cases, and multiple posts may be contained in one block in other cases. In order to patrol the Internet effectively, it is necessary to split a web page on a post-by-post basis and check the post content in detail. In this research, we propose a universal method of dividing a web page on a post-to-post basis. We conducted comparative experiments with the exiting method to verify the usefulness of the proposed method. The results proved that the proposed method is useful. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 55, 号 2, p. 874-891, 発行日 2014-02-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |