WEKO3
アイテム
分野判定のために用いられる単語リストの作成と応用
https://ipsj.ixsq.nii.ac.jp/records/40663
https://ipsj.ixsq.nii.ac.jp/records/406638cbb79ca-47b0-4fb9-a07d-8c17bdef0b3d
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1997 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1997-09-11 | |||||||
タイトル | ||||||||
タイトル | 分野判定のために用いられる単語リストの作成と応用 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Formulation and Application of Word Lists for Classifying Texts into Large Fields | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
図書館情報大学 | ||||||||
著者所属 | ||||||||
図書館情報大学 | ||||||||
著者所属 | ||||||||
学術情報センター | ||||||||
著者所属 | ||||||||
図書館情報大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Library and Information Science | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Library and Information Science | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Center for Science Information Systems | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Library and Information Science | ||||||||
著者名 |
石田, 栄美
× 石田, 栄美
|
|||||||
著者名(英) |
Emi, Ishida
× Emi, Ishida
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 先に発表した、大きな分野を対象とする大量の自然語テキストデータの検索・分類のための単語リスト作成方法を詳しく検討した。情報処理学・農芸化学・土木学などの学会予稿抄録の一部を単語リスト作成用データとし、他を検索・分類用データとした。単語リストの選択基準に含まれる二つのパラメタを変えて検討したが、単語リストの大きさや内容は大きく変わるものの、互いに離れている上記3分野間では、分野推定の結果は安定していることがわかった。さらに、分野に重なりのある電子情報通信学を加えて影響を調べた。また、これらの単語リストを応用して文献の分野関連度、文献集合の分野関連度などを求める方法を示した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A formerly developed method for statistically formulating word lists for large fields, which can be used for classification and retrieval of Japanese texts, is examined in detail. Two parameters studied, used for the selection of words in the list, were found not to influence assignments of abstract texts into three mutually independent separate areas: information processing, agricultural chemistry and civil engineering. The effect of adding the fourth field, electronics, information and communication engineering, was also examined. Formulas for calculating affinity to each field of an individual text and also of a body of texts were given. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10114171 | |||||||
書誌情報 |
情報処理学会研究報告情報学基礎(FI) 巻 1997, 号 86(1997-FI-047), p. 109-116, 発行日 1997-09-11 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |