@article{oai:ipsj.ixsq.nii.ac.jp:00098508,
 author = {山本, 雄平 and 中村, 健二 and 田中, 成典 and 安彦, 智史 and Yuhei, Yamamoto and Kenji, Nakamura and Shigenori, Tanaka and Satoshi, Abiko},
 issue = {2},
 journal = {情報処理学会論文誌},
 month = {Feb},
 note = {インターネットに流通する有害情報から青少年を守る取り組みとして,ネットパトロールが行われている.ネットパトロールでは,有害情報が含まれる投稿記事を目視により確認しており,この作業を軽減するネットパトロール支援の研究が注目されている.ネットパトロール支援の研究の1つに,投稿者の見守りを目的としたWebクローラ開発の研究がある.この研究では,Webページを解析することで,情報の抽出を行っており,その中でWebページをブロック単位に分割する手法が用いられている.しかし,Webページをブロック単位に分割する場合,投稿記事が複数のブロックに分割される場合や,1つのブロックに複数の投稿記事が含まれる場合がある.そのため,効率的なネットパトロールを実現するには,Webページを投稿記事ごとに分割し,投稿記事を詳細に確認する必要がある.そこで,本研究では,Webページを記事単位に分割できる汎用的なWebページの分割手法を提案する.そして,本提案手法の有用性を検証するため,既存手法との比較実験を実施した.その結果,本提案手法が有用であることを証明した., An Internet monitoring effort called “Net Patrol” is conducted to protect young people from harmful materials circulating on the Internet. In carrying out Net Patrol, post content that contains harmful materials is checked by visual inspection. Researches of supporting Net Patrol to reduce this work are attracting attention. One of the researching of supporting Net Patrol is a research of developing a web crawler for the purpose of watching contributors who submit posts. In this research, materials are extracted by analyzing web pages, using a method of dividing a web page on a block-by-block basis. However, when dividing a web page on a block-by-block basis, one post may be divided into multiple blocks in some cases, and multiple posts may be contained in one block in other cases. In order to patrol the Internet effectively, it is necessary to split a web page on a post-by-post basis and check the post content in detail. In this research, we propose a universal method of dividing a web page on a post-to-post basis. We conducted comparative experiments with the exiting method to verify the usefulness of the proposed method. The results proved that the proposed method is useful.},
 pages = {874--891},
 title = {個別の詳細記事抽出のためのWebページ分割手法の提案},
 volume = {55},
 year = {2014}
}