WEKO3
アイテム
日本人のオンライン・コミュニケーション上での平均使用語彙数は8,000語である
https://ipsj.ixsq.nii.ac.jp/records/83603
https://ipsj.ixsq.nii.ac.jp/records/836034ba3e200-7ac6-4104-972f-45f8a9811daf
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-08-26 | |||||||
タイトル | ||||||||
タイトル | 日本人のオンライン・コミュニケーション上での平均使用語彙数は8,000語である | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Average Japanese Vocabulary for Online Communication is 8,000 words | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 応用・調査 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学知の構造化センター/科学技術振興機構さきがけ | ||||||||
著者所属 | ||||||||
東京大学知の構造化センター | ||||||||
著者所属 | ||||||||
東京大学知の構造化センター | ||||||||
著者所属 | ||||||||
東京大学知の構造化センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Center for Knowledge Structuring, University of Tokyo. / JST PRESTO | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Center for Knowledge Structuring, University of Tokyo. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Center for Knowledge Structuring, University of Tokyo. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Center for Knowledge Structuring, University of Tokyo. | ||||||||
著者名 |
荒牧, 英治
× 荒牧, 英治
|
|||||||
著者名(英) |
Eiji, Aramaki
× Eiji, Aramaki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | これまで言語学で高い関心を集めている問題の1つに人間の語彙数がある.数々の調査がなされてきたが,その多くは,理解できる語彙(理解語彙)の調査にとどまり,実際に使用する語彙(使用語彙)についてはどのくらいのものか,いっこうにわからないとされてきた.本研究では,ウェブ上の発言データを利用し,10万人という大規模な人数で使用語彙調査を行った.調査の結果,使用語彙は平均8,000語であることが明らかになった.さらに,同データを用いて,語のユーザ数の調査を行った.この結果,ユーザに偏りがある語や偏りがない語のリストが得られた.このようなユーザ数にもとづいたリストは本研究で初めて得られたものである. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The active vocabulary size - the number of words that we can use- is one of the biggest issues in linguistics. Although various studies had been challenged this issue, the precise size of our active vocabulary is still unknown. To solve this issue, this study utilized an online communication text produce by 100,000 people. The result revealed that the average vocabulary consists of 8,000 words. Furthermore, this study also presents a method to estimate the number of users for each word. By using this method, this paper presents a user size based word list. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2012-NL-208, 号 9, p. 1-8, 発行日 2012-08-26 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |