| Item type |
SIG Technical Reports(1) |
| 公開日 |
2016-07-22 |
| タイトル |
|
|
タイトル |
重み付き木構造カーネルと共起重みによるTwitterの自動分類手法 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Automatic classification of Twitter by and weighted tree kernel and co-occurrence weight |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
Twitter分析 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
岡山理科大学大学院総合情報研究科 |
| 著者所属 |
|
|
|
岡山理科大学総合情報学部 |
| 著者所属 |
|
|
|
山陽学園大学総合人間部 |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate school of Informatics, Okayama University of Science |
| 著者所属(英) |
|
|
|
en |
|
|
Okayama University of Science |
| 著者所属(英) |
|
|
|
en |
|
|
Sanyo Gakuen University |
| 著者名 |
武田, 昌大
椎名, 広光
小林, 伸行
|
| 著者名(英) |
Masahiro, Takeda
Hiromitsu, Shiina
Nobuyuki, Kobayashi
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
観光施設や商品のレビューや Twitter のような短いコメントを投稿する Web サービスの盛り上がりから,コーパスの作成等の手間を抑えつつ,自動的かつ正確に文章を識別する手法を求める要求が高まっている.また,大学の講義で利用される講義アンケートについても,自由回答記述は、ほとんど短文であり,短文の分類が講義評価に利用できると考えられる.これまでの多くは,文章分類に関する基本的な手法としては,Bag-of-Words による単語の出現頻度を利用している.それに対して本研究では,Tweet などのショートコメントをカテゴリ分類を行う木構造データに変換し,更に木構造カーネルの上で木のノードの部分に重みを置く重み付き木構造カーネルによる分類を行った.また,Tweet の修飾語の包含関係から重みを計算し重み付き木構造カーネルに加えることで,分類精度の向上を試みた. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Many web services posting short comments such as product reviews and Twitter have been provided. In addition, for the lecture questionnaire at universities, comment is mostly short in free answer column. The short classification is considered to be available for lectures evaluation. We consider that automatic and accurate text classification may lead to develop new web services and system. In the past, the frequency of appearance of words by bag-of-words have been often used for text classification as a basic technique. In contrast, we propose a technique to classify tweets using tree kernels created by the categories of Wikipedia in this study. In addition, we extened classification by weighted tree kernel. As evaluation experiment, we developed a retrieval system for tourism videos by applying the technique to tweets related to tourism. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
| 書誌情報 |
研究報告自然言語処理(NL)
巻 2016-NL-227,
号 15,
p. 1-6,
発行日 2016-07-22
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |