WEKO3
アイテム
文書構造情報を利用した Web 情報検索
https://ipsj.ixsq.nii.ac.jp/records/42883
https://ipsj.ixsq.nii.ac.jp/records/42883fe4db079-13c4-41a7-afe8-724a13c99f0a
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2008 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2008-03-28 | |||||||
| タイトル | ||||||||
| タイトル | 文書構造情報を利用した Web 情報検索 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | A Web Search Engine Considering Document Structure Information | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 奈良先端科学技術大学院大学情報科学研究科 | ||||||||
| 著者所属 | ||||||||
| 奈良先端科学技術大学院大学情報科学研究科 | ||||||||
| 著者所属 | ||||||||
| 奈良先端科学技術大学院大学情報科学研究科 | ||||||||
| 著者所属 | ||||||||
| 奈良産業大学情報学部 | ||||||||
| 著者所属 | ||||||||
| 奈良先端科学技術大学院大学情報科学研究科 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Faculty of Informatics, Nara Sangyo University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
| 著者名 |
伊藤智博
宮崎, 純
中島, 伸介
植村, 俊亮
加藤, 博一
× 伊藤智博 宮崎, 純 中島, 伸介 植村, 俊亮 加藤, 博一
|
|||||||
| 著者名(英) |
Chihiro, Ito
Jun, Miyazaki
Shinsuke, Nakajima
Shunsuke, Uemura
Hirokazu, Kato
× Chihiro, Ito Jun, Miyazaki Shinsuke, Nakajima Shunsuke, Uemura Hirokazu, Kato
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 本論文では膨大な情報にあふれる現代社会において、Web 検索エンジンの検索単位を Web ページからその部分文書にすることにより、ユーザの負担を減らすことを目的とする。現在の検索エンジンによって作成される検索結果一覧に含まれる要約は、すぐに内容を理解できない場合が多い。そのため検索対象の語が Web ページ内のどこで出現しているかをユーザ自身が確認し、ページの適合性を判断しなければならない。さらに、Web ページ内には複数の話題を取り扱っていることも多く、情報量が膨大である。これらを解決するために、我々は Web ページを検索としての単位とするのではなく、ページ内の部分文書を検索単位とすることにより、単位あたりの情報を絞ることが可能な検索手法を提案する。 | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | We propose a high precision Web page retrieval method by decomposing Web pages into partial documents which are regarded as a unit of information. It is not easy to understand the contents of the retrieved Web pages obtained by a existing Web search engines because the contents of most of obtained Web pages cannot intuitively be captured even by reading their abstracts and/or snippets. Therefore, we must manually ensure where query terms are appeared in a page and whether the page is really relevant or not by reading each page. In addition, a Web page may contain several topics which might be irrelevant to user's information needs. To deal with these problems, we treat a partial document which has one topic, instead of a page, as a unit of information, and then, we propose an improved Web page search method based on the partial document search. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10539261 | |||||||
| 書誌情報 |
情報処理学会研究報告デジタルドキュメント(DD) 巻 2008, 号 34(2008-DD-065), p. 39-45, 発行日 2008-03-28 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||