WEKO3
アイテム
日本語圏ブログの自動分類
https://ipsj.ixsq.nii.ac.jp/records/47965
https://ipsj.ixsq.nii.ac.jp/records/479657710c013-5abb-4c15-89b7-d2cfbf6283ba
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-11-21 | |||||||
タイトル | ||||||||
タイトル | 日本語圏ブログの自動分類 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Text Categorization for Japanese Blog Entries | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
NRI Pacific Inc. | ||||||||
著者所属 | ||||||||
株式会社野村総合研究所 情報技術本部 | ||||||||
著者所属 | ||||||||
株式会社野村総合研究所 情報技術本部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NRI Pacific, Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Nomura Research Institute, Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Nomura Research Institute, Ltd. | ||||||||
著者名 |
平野, 耕一
× 平野, 耕一
|
|||||||
著者名(英) |
Koichi, HIRANO
× Koichi, HIRANO
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 消費者の個別のニーズや文脈を検出することは、ネットビジネス企業にとってだけでなく、消費者自身の生活者の質向上のためにも非常に重要である。最近のブログの流行によって、消費者の日常生活についての情報や日々考えていることを低コストかつリアルタイムに取得することが可能になった。本論文では、ナイーブベイズ法に基づく多重トピック分類などの自然言語処理技術を、日本語圏ブログのリアルタイム分類とトピック定量化に適用した最初の試みを報告する。本論文で提案した方法によって、ブログエントリのリアルタイム多重トピック自動分類と、ブログ圏における多重トピックの強度の定量化が可能であることを実証した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Identifying individual’s needs and context is of paramount importance not only from the net business player's perspective but also for improving consumers' quality of life. The recent blogging boom provides consumers' everyday life information and thinking accessible at a low cost in real time. This paper discusses the first attempt to apply some NLP techniques, such as multi-class document classification build upon the naive bayes method, to a real-time classification and quantification of their topics in the Japanese blogosphere. The results show that the proposed method is capable of classifying blog entries in real-time and is also capable of quantifying the intensity of multi-topics in the blogosphere. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2005, 号 117(2005-NL-170), p. 21-26, 発行日 2005-11-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |