WEKO3
アイテム
繰り返し構造の検出に基づくWebページの見出しの階層構造の解析
https://ipsj.ixsq.nii.ac.jp/records/68099
https://ipsj.ixsq.nii.ac.jp/records/68099d0410911-a6eb-402d-8a6b-3d74b396a16d
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2010-02-25 | |||||||
タイトル | ||||||||
タイトル | 繰り返し構造の検出に基づくWebページの見出しの階層構造の解析 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Analysis of Hierarchy of Headlines in Web pages Based on Detecting Repeated Structure | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | マルチメディア・多言語処理 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
静岡大学 | ||||||||
著者所属 | ||||||||
青山学院大学 | ||||||||
著者所属 | ||||||||
静岡大学 | ||||||||
著者所属 | ||||||||
言語情報処理研究所 | ||||||||
著者所属 | ||||||||
国立情報学研究所 | ||||||||
著者所属 | ||||||||
中京大学 | ||||||||
著者所属 | ||||||||
静岡大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Shizuoka University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Aoyama Gakuin University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Shizuoka University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NLP Research Laboratory | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Informatics | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Chukyo University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Shizuoka University | ||||||||
著者名 |
沙鵬
× 沙鵬
|
|||||||
著者名(英) |
Peng, Sha
× Peng, Sha
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 文書中には類似した特徴を持つ見出しが反復的に現れる構造(繰り返し構造)がみられる.繰り返し構造を構成する見出し群は,文書の階層構造上では同一レベルに属すると考えられる.我々は先行研究において,Webページ中の繰り返し構造を検出することにより見出しの階層構造を解析する手法を提案しているが,本稿では繰り返し構造の検出手法を改善することにより,見出しの階層構造の解析精度の向上を試みる.また提案手法の効果を実験的に評価した結果を報告する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We have proposed a method to analyze a hierarchy of headlines in Web pages by detecting repeated structures. Our method can analyze the structure of Web pages that is not well structured. In this paper, we extend the method detecting repeated structures. In addition, we show an experimental evaluation of our method. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10114171 | |||||||
書誌情報 |
研究報告情報学基礎(FI) 巻 2010-FI-98, 号 6, p. 1-8, 発行日 2010-02-25 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |