Item type |
SIG Technical Reports(1) |
公開日 |
2022-07-01 |
タイトル |
|
|
タイトル |
機械学習モデルを使用したKyutechコーパスのトピック分類 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Topic Classification of Kyutech Corpus by Machine Learning |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
分析 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
九州工業大学大学院情報工学府情報創成工学専攻 |
著者所属 |
|
|
|
九州工業大学大学院情報工学研究院知能情報工学研究系 |
著者所属(英) |
|
|
|
en |
|
|
Department of Creative Informatics, Kyushu Institute of Technology |
著者所属(英) |
|
|
|
en |
|
|
Department of Artificial Intelligence, Kyushu Institute of Technology |
著者名 |
川嵜, 慎乃介
嶋田, 和孝
|
著者名(英) |
Shinnosuke, Kawasaki
Kazutaka, Shimada
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
複数人議論を行う際,議事録は決定事項の記録や非参加者への情報共有のために必要不可欠である.議論の自動議事録生成のためには,議論の文脈に沿った話題(トピック)を捉えることが第一に必要である.そこで,本研究では発話単位のトピック分類に取り組む.データセットには複数人議論コーパスである Kyutech コーパスを使用する.Kyutech コーパスでは 1 発話に複数のトピックタグが付与されている場合がある.したがって,トピック分類では,そのうち一つを正しく推定する多値分類と全てのタグを正しく推定するマルチラベル分類の 2 種類の問題を取り扱う.複数の機械学習技術を適用し,その有効性を比較,検証する. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Discussion summarization is one of the most important tasks for discussion analysis. Utterances in a discussion contains several topics, and the topics have an important role for the summarization. In this paper, we report a topic classification task of utterances in a multi-party discussion corpus: Kyutech corpus. In the corpus, each utterance contains one to three topic tags. We compare several machine learning methods for the topic tag classification task. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11135936 |
書誌情報 |
研究報告知能システム(ICS)
巻 2022-ICS-207,
号 6,
p. 1-6,
発行日 2022-07-01
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-885X |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |