Item type |
Trans(1) |
公開日 |
2021-07-13 |
タイトル |
|
|
タイトル |
ホテルの評価値予測のためのカテゴリ特化型感情極性辞書 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Category-oriented Japanese Sentiment Polarity Dictionary for Rating Prediction of Hotels |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[研究論文] 評価値予測,自然言語処理,感情極性,BERT |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
ジェイアール東海情報システム株式会社 |
著者所属 |
|
|
|
広島大学大学院先進理工系科学研究科 |
著者所属 |
|
|
|
広島大学大学院先進理工系科学研究科 |
著者所属(英) |
|
|
|
en |
|
|
JR TOKAI Information Systems Company |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Advanced Science and Engineering, Hiroshima University |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Advanced Science and Engineering, Hiroshima University |
著者名 |
柴田, 諒人
亀井, 清華
中野, 浩嗣
|
著者名(英) |
Akito, Shibata
Sayaka, Kamei
Koji, Nakano
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
ホテル予約サイトでは,ホテルの宿泊客から投稿された各ホテルに対する評価が提供される.各評価には,自然言語テキストによるレビューと,「サービス」や「立地」,「部屋」などの複数のカテゴリのそれぞれに対する数値による評価値が含まれる.しかし評価の中には,一部の評価値がレビューの内容と矛盾しているものが存在する.そのような評価は,サイト利用者を混乱させる可能性がある.このような問題を解決するために,レビューの文章から各カテゴリに対する評価値を予測する手法を提案する.本提案手法では,楽天トラベルのレビューデータベースを利用して,カテゴリ特化型感情極性辞書を構築し,それを元に評価値を予測する.カテゴリ特化型感情極性辞書は,「悪い」,「軽い」,「美味しい」などの各感情語について,カテゴリごとに感情極性値(ポジティブまたはネガティブの度合い)を与える.我々の実験では,BERTを用いて各レビューをベクトル化したレビューベクトルとカテゴリ特化型感情極性値を組み合わせることで,BERTを単体で用いる場合や既存辞書の感情極性値を組み合わせる場合よりも高い精度で評価値予測を行うことができた.さらに,カテゴリを細分化したサブカテゴリに対しても,カテゴリ特化型感情極性値とBERTとを組み合わせることの有用性を示した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Hotel booking sites provide us hotel evaluations, each of which includes a textual review and numeric ratings for multiple categories such as “Service”, “Location”, “Rooms”, etc., submitted by a hotel guest. However, textual reviews and numeric ratings of some evaluations are inconsistent. For example, a textual review which praises the hotel is submitted with low ratings. Such evaluations may confuse site users. To resolve such problems, we propose a high accuracy method to predict a numeric rating for each category from a textual review. Our new idea is to use Category-oriented Sentiment Polarity Dictionaries (CSPD), each of which is automatically compiled for each category using a Rakuten Travel review database in advance. The CSPD gives the sentiment polarity value (i.e., the positivity/negativity value) for each sentiment word such as “bad”, “light”, and “delicious” for each category. In our experiments, we combine the sentiment polarity value by CSPD and word vectors derived by BERT to obtain an expected rating value from a textual review. Our experimental results show that the combined method with CSPD attains higher accuracy than the case using only BERT vectors and the case using existing dictionaries. Additionally, when we apply CSPD and BERT to sub-categories obtained by segmenting each category further, our method is effective against the rating prediction from reviews. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11464847 |
書誌情報 |
情報処理学会論文誌データベース(TOD)
巻 14,
号 3,
p. 16-29,
発行日 2021-07-13
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7799 |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |