WEKO3
アイテム
レビュー文分類器を用いたレビュー文含有比率によるレビュー文書判定
https://ipsj.ixsq.nii.ac.jp/records/80100
https://ipsj.ixsq.nii.ac.jp/records/8010011b948ec-84b8-497f-b742-d817985f1c9b
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-01-13 | |||||||
タイトル | ||||||||
タイトル | レビュー文分類器を用いたレビュー文含有比率によるレビュー文書判定 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Review decision about the documents by the ratio of a review sentence by classifier using a sentence review | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 評価分析・分類 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
NTTサイバースペース研究所 | ||||||||
著者所属 | ||||||||
NTTサイバースペース研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Nara Institute of Science and Technology Graduate School of Information Science | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Cyber Space Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Cyber Space Laboratories | ||||||||
著者名 |
江崎, 大嗣
× 江崎, 大嗣
|
|||||||
著者名(英) |
Hirotsugu, Esaki
× Hirotsugu, Esaki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | レビューなどの口コミ情報が消費者の購買活動の意思決定に利用されており,商品のレビューを集めて公開したいというニーズが高まっている.しかし,消費者にレビューを書いてもらうには時間とコストを要する.このようなことから,ブログ等のCGMからレビューとして利用できる文書を自動で収集できることが望まれている.従来,このような文書分類のタスクでは,分類学習を用いた文書単位での分類が行われてきた.しかし,ブログ記事がレビュー文書か否かを判断することは,日記などのその他の情報が多く混在しているため難しい.そこで,本研究ではレビューとそれ以外の情報をより細かく見ることができるように,文単位でレビューかどうかを判定して,ブログ記事内に含まれるレビュー文の比率によって,文書がレビューかどうかを判定する.その結果,F-measureで72.3となり,我々の提案手法は従来の手法に比べて26.4上回った. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Reviews are used in purchasing decision. The need is growing to collect and publish reviews. However, it cost a lot of time and money to make them write reviews. So it is hoped that the documents which are available for reviews can be collected automatically from the CGM such as blog. Such a document classification task has been performed by using classification learning in a document level. But it is difficult to determine whether a blog is a review or not because many other information are mixed. Therefore we have done classification in a sentence level in order to classify fine-grained. And then classification is done by the ratio of a review sentence. As the result, we achieve 72.3 in F-measure. Our method is superior to conventional methods by 26.4. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10114171 | |||||||
書誌情報 |
研究報告情報基礎とアクセス技術(IFAT) 巻 2012-IFAT-105, 号 2, p. 1-5, 発行日 2012-01-13 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |