2024-03-29T17:08:03Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000186752024-03-29T05:26:34Z01164:01165:01166:01167
Wikipediaのリンク構造とカテゴリ構造を用いた検索語からの専門語の抽出Extraction of Technical Terms for Query Keywords by Link and Category Structure of Wikipediajpnhttp://id.nii.ac.jp/1001/00018675/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=18675&item_no=1&attribute_id=1&file_no=1Copyright (c) 2008 by the Information Processing Society of Japan京都大学情報学研究科社会情報学専攻京都大学情報学研究科社会情報学専攻京都大学情報学研究科社会情報学専攻京都大学情報学研究科社会情報学専攻中谷, 誠AdamJatowt大島, 裕明田中, 克己検索語が属する分野における専門語は,ユーザが検索結果に含まれるウェブページの内容を理解する上で重要な役割を持っている.専門語が多く含まれるウェブページは,非専門家ユーザにとっては理解しづらいが,一方で専門家ユーザにとっては読みやすく詳細な情報を得る上で有用である.本研究では, Wikipedia のリンク構造とカテゴリ構造を用いて,ユーザの入力した検索語からその語に関する専門語を抽出する手法について述べる. Wikipedia 中で検索語が含まれている記事のカテゴリ情報を集約することによって検索語の属する専門領域を検出し,その領域の内外でリンクの出現頻度を分析することによって専門語を抽出する.本研究の提案手法は幅広い分野を網羅しており多言語対応している Wikipedia を用いているので,検索語の分野や言語に関係なく専門語を取得することができる.Technical terms for query keywords are important for users to grasp the meaning of the contents of Web pages included in search results. In particular, Web pages with many technical terms are difficult to be understood by non-expert users, yet, they are rather readable and useful for expert users who can acquire detailed information from them. This paper proposes a method for extracting technical terms for query keywords by using link and category structure of Wikipedia. We detect technical domains of query keywords by aggregating category information of Wikipedia articles and we extract technical terms by analyzing link frequency in inside and outside of the domains. Since our proposed method uses Wikipedia, thus it is domain-independent covering many different topics and it does not depend on particular language of query keywords.AN10112482情報処理学会研究報告データベースシステム(DBS)200888(2008-DBS-146)2532582008-09-142009-06-30