@techreport{oai:ipsj.ixsq.nii.ac.jp:00042883, author = {伊藤智博 and 宮崎, 純 and 中島, 伸介 and 植村, 俊亮 and 加藤, 博一 and Chihiro, Ito and Jun, Miyazaki and Shinsuke, Nakajima and Shunsuke, Uemura and Hirokazu, Kato}, issue = {34(2008-DD-065)}, month = {Mar}, note = {本論文では膨大な情報にあふれる現代社会において、Web 検索エンジンの検索単位を Web ページからその部分文書にすることにより、ユーザの負担を減らすことを目的とする。現在の検索エンジンによって作成される検索結果一覧に含まれる要約は、すぐに内容を理解できない場合が多い。そのため検索対象の語が Web ページ内のどこで出現しているかをユーザ自身が確認し、ページの適合性を判断しなければならない。さらに、Web ページ内には複数の話題を取り扱っていることも多く、情報量が膨大である。これらを解決するために、我々は Web ページを検索としての単位とするのではなく、ページ内の部分文書を検索単位とすることにより、単位あたりの情報を絞ることが可能な検索手法を提案する。, We propose a high precision Web page retrieval method by decomposing Web pages into partial documents which are regarded as a unit of information. It is not easy to understand the contents of the retrieved Web pages obtained by a existing Web search engines because the contents of most of obtained Web pages cannot intuitively be captured even by reading their abstracts and/or snippets. Therefore, we must manually ensure where query terms are appeared in a page and whether the page is really relevant or not by reading each page. In addition, a Web page may contain several topics which might be irrelevant to user's information needs. To deal with these problems, we treat a partial document which has one topic, instead of a page, as a unit of information, and then, we propose an improved Web page search method based on the partial document search.}, title = {文書構造情報を利用した Web 情報検索}, year = {2008} }