Item type |
SIG Technical Reports(1) |
公開日 |
2016-12-14 |
タイトル |
|
|
タイトル |
係り受け構造を用いたWeb議論掲示板における投稿への自動分類 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Automatic labeling to posts in Web discussion bulletin board using dependency structures |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
言語解析・文脈処理 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
東京農工大学工学部情報工学科 |
著者所属 |
|
|
|
東京農工大学工学部情報工学科/東京農工大学工学研究院先端情報科学部門 |
著者所属(英) |
|
|
|
en |
|
|
Department of Computer and Information Sciences, Faculty of Engineering, Tokyo University of Agriculture and Technologyd |
著者所属(英) |
|
|
|
en |
|
|
Department of Computer and Information Sciences, Faculty of Engineering, Tokyo University of Agriculture and Technology / Division of Advanced Information Technology and Computer Sciences, Institute of Engineering, Tokyo University of Agriculture and Technology |
著者名 |
岩佐, 幸翠
藤田, 桂英
|
著者名(英) |
Kosui, Iwasa
Katsuhide, Fujita
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,タウンミーティングのように時間的,物理的な制約に囚われる事がない,Web 上での大規模な議論のしくみが求められている.大規模な議論のしくみを実現するために,膨大な意見集約,合意形成支援などファシリテートが重要となる.しかし,参加者数や投稿数が増えるにつれ,ファシリテータが各参加者が議論の概観や議論構造を短時間で把握することは難しくなる.そこで,我々は参加者からの投稿に対して質問,意見,情報,同意,反対,経験といった分類を自動的に行い,議論の構造化支援する手法を提案する.本論文の提案手法では,係り受け木の刈り込みにより短縮された各投稿の文,および各形態素に対して係り受け木における深さを付与された文から各形態素 N-gram の出現回数を求め,これを素性として各ラベルごとにランダムフォレストによって学習,分類する.さらに,実際の大規模議論データに対して人手でアノテーションしたものを正解データとして,分類の精度などの評価を実施する. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Web based Large-scale discussion platform not depending on time and physical constraints like the town meeting is required recently. In order to realize a large-scale discussion, facilitators that collect huge opinions and lead the consensus are important. However, as the number of participants and postings increases, it is difficult for facilitators to grasp the overview of the discussion and the discussion structure in a short time. Therefore, we propose a method of labelling the posts such as questions, opinions, information, favor, opposition, and experiences. In the proposed method, we extract dependencies of sentences for each sentence by using dependency analysis, and find morpheme N-gram of Bag-of-words from the end of a sentence. After that, our proposed method employs random-forests method using their features to classify the labels. Furthermore, we evaluate the precisions, recalls and f-measures of classification by using manually annotated data on actual large-scale discussion corpus. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
書誌情報 |
研究報告自然言語処理(NL)
巻 2016-NL-229,
号 22,
p. 1-6,
発行日 2016-12-14
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |