@techreport{oai:ipsj.ixsq.nii.ac.jp:00040663, author = {石田, 栄美 and 石塚, 英弘 and 根岸, 正光 and 山本, 毅雄 and Emi, Ishida and Hidehiro, Ishizuka and Masamitsu, Negishi and Takeo, Yamamoto}, issue = {86(1997-FI-047)}, month = {Sep}, note = {先に発表した、大きな分野を対象とする大量の自然語テキストデータの検索・分類のための単語リスト作成方法を詳しく検討した。情報処理学・農芸化学・土木学などの学会予稿抄録の一部を単語リスト作成用データとし、他を検索・分類用データとした。単語リストの選択基準に含まれる二つのパラメタを変えて検討したが、単語リストの大きさや内容は大きく変わるものの、互いに離れている上記3分野間では、分野推定の結果は安定していることがわかった。さらに、分野に重なりのある電子情報通信学を加えて影響を調べた。また、これらの単語リストを応用して文献の分野関連度、文献集合の分野関連度などを求める方法を示した。, A formerly developed method for statistically formulating word lists for large fields, which can be used for classification and retrieval of Japanese texts, is examined in detail. Two parameters studied, used for the selection of words in the list, were found not to influence assignments of abstract texts into three mutually independent separate areas: information processing, agricultural chemistry and civil engineering. The effect of adding the fourth field, electronics, information and communication engineering, was also examined. Formulas for calculating affinity to each field of an individual text and also of a body of texts were given.}, title = {分野判定のために用いられる単語リストの作成と応用}, year = {1997} }