WEKO3
アイテム
教員データにおける高頻度語
https://ipsj.ixsq.nii.ac.jp/records/48052
https://ipsj.ixsq.nii.ac.jp/records/4805249c22e8b-1910-44e2-9278-1cad9c241a6d
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-03-10 | |||||||
タイトル | ||||||||
タイトル | 教員データにおける高頻度語 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Frequent Words in Research Activities of University Researchers | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
九州大学大学評価情報室 | ||||||||
著者所属 | ||||||||
九州大学大学院システム情報科学府 | ||||||||
著者所属 | ||||||||
九州大学情報基盤センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Office for Information of University Evaluation Kyushu University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Electrical Engineering Kyushu University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Computing and Communications Center Kyushu University | ||||||||
著者名 |
関, 隆宏
× 関, 隆宏
|
|||||||
著者名(英) |
Takahiro, Seki
× Takahiro, Seki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | キーワードの重要度をどのように設定するかは,検索システムの実現において重要な課題である.本稿では各大学教員が書いた研究活動概要の文書を対象として,重要なキーワードがどのようなものであるかについて,単語の出現頻度に基づき分析を行った.Web 文書のように文書が多種多様な場合には,単純な出現頻度よりtfidf のような値が標準的に用いられる.しかし,同種の文書群を対象とする場合には,共通に現れる高頻出の単語も特徴的な単語として考えなければならない.本稿では,筆者らが開発している九州大学研究者データベースに蓄積された約2000人の教員情報を具体的対象として,単語の出現頻度,使用者数,複数回使用者数の3 つの尺度が分野特定性の識別に有効であることを示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | It is an important problem in the search engine how to set the degree of importance to each key word. In this report, we will analyze the frequent words that appear in the documents of outline for university researchers. We consider the DF (document frequency) and TF (term frequency) instead of other standard evaluation, e.g., tfidf. The evaluation tfidf is useful for a variety of documents like Web documents to eliminate frequent words that commonly appear in any sentences. Nevertheless, such frequent words are important to the documents in specific area as this report considers. We analyzed frequent words in documents of more than 2000 university researchers in Kyushu University. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2005, 号 22(2004-NL-166), p. 1-8, 発行日 2005-03-10 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |