WEKO3
アイテム
コンテンツ間距離の標準偏差に基づくWebページ動的分割方式
https://ipsj.ixsq.nii.ac.jp/records/17472
https://ipsj.ixsq.nii.ac.jp/records/1747223da21e4-cee9-4146-a166-e6ef9206d8bc
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Trans(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-06-15 | |||||||
タイトル | ||||||||
タイトル | コンテンツ間距離の標準偏差に基づくWebページ動的分割方式 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Dynamic Segmentation of a Web Page Based on Standard Deviation of Content-distances | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 研究論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
株式会社KDDI研究所 | ||||||||
著者所属 | ||||||||
株式会社KDDI研究所 | ||||||||
著者所属 | ||||||||
株式会社KDDI研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
KDDI R&D Laboratories Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
KDDI R&D Laboratories Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
KDDI R&D Laboratories Inc. | ||||||||
著者名 |
服部, 元
× 服部, 元
|
|||||||
著者名(英) |
Gen, Hattori
× Gen, Hattori
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 携帯電話を利用してインターネット上のPC向けのWebページを効率的に閲覧する要求が高まっている.しかしながら,WebページのほとんどはPCで閲覧することを想定して作成されており,携帯電話で閲覧可能なWebページはごく一部である.そのためWebページ中の個々の情報を分割して階層的にする等,情報量の多いWebページを携帯電話向けに再構築する必要がある.我々はこれまで,アンカや写真等のコンテンツの間にあるHTMLタグの深さと数を利用して算出したコンテンツ間距離に基づくWebページ自動分割方式について検討し,携帯電話の小画面でもPC向けのWebページを効率的に閲覧可能とした.しかしながら,Webページによりコンテンツ間距離の分布が大きく異なるため,すべてのWebページに最適となる分割閾値を固定的に設定することが困難であった.そこで本稿では,Webページごとに適切な分割閾値をコンテンツ間距離の標準偏差に基づき動的に決定する方式を提案する.既存の方式と比較する評価実験を行い,有効性を確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The demand of retrieving information from general Web pages using a mobile phone is increasing. However, since most of the general Web pages in the Internet are produced for PC users, mobile phone users cannot retrieve plenty information from Web. Therefore, we have to divide a Web page into articles and rebuild the tree structure of Web pages. In the previous work, we examined the automatic Web page segmentation scheme which uses the distance between contents based on the relative HTML tag hierarchy, which is the number and depth of HTML tags in Web pages. The system makes it possible to display a PC-oriented Web page on the small screen of a cellular phone efficiently. However, since the distribution of the distance between contents was unique for every Web page, it was difficult for us to set a suitable threshold for segmentation of all Web pages. In this paper, we propose a new dynamic scheme to dicide the threshold for every Web page, based on the standard deviation of the distance between adjacent contents. We conduct the evaluation experiment in comparison with the existing schemes, and show the effectiveness of our proposed scheme. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11464847 | |||||||
書誌情報 |
情報処理学会論文誌データベース(TOD) 巻 47, 号 SIG8(TOD30), p. 81-89, 発行日 2006-06-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7799 | |||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |