WEKO3
アイテム
意味属性パターンを用いたマイクロブログ中の発言に対する自動対話行為付与
https://ipsj.ixsq.nii.ac.jp/records/95516
https://ipsj.ixsq.nii.ac.jp/records/955165df7adaf-a671-47c2-bb6a-5d18d19c506a
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-10-18 | |||||||
タイトル | ||||||||
タイトル | 意味属性パターンを用いたマイクロブログ中の発言に対する自動対話行為付与 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Dialogue act tagging for microblog utterances using semantic category patterns | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 一般講演+デベロッパーズフォーラム(I) | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
NTTコミュニケーション科学基礎研究所 | ||||||||
著者所属 | ||||||||
NTTメディアインテリジェンス研究所 | ||||||||
著者所属 | ||||||||
NTTコミュニケーション科学基礎研究所 | ||||||||
著者所属 | ||||||||
NTTコミュニケーション科学基礎研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Media Intelligence Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Communication Science Laboratories | ||||||||
著者名 |
目黒豊美
× 目黒豊美
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Twitter 等のマイクロブログには様々な情報があり,これらを分類する研究が多くされている.もし,マイクロブログに対話行為を付与することができれば,ユーザの間でのやり取りを分析したり,対話システムへの発話生成などに応用できる可能性がある.本稿では,マイクロブログ中の発言に教師あり学習の手法を用いて,対話行為を付与する手法を提案する.マイクロブログのデータは,対話データに比べ,多種多様な話題や語彙を含み,崩れた日本語が多い.そこで,我々は多種多様な語彙や崩れた日本語を補うために,シソーラスを用いて抽象化した単語 N-gram と文字 N-gram を特徴量として用いることを提案する.評価実験の結果,Bag-of-Ngrams を用いるベースライン手法に比べて,精度が高いことが分かった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we propose dialogue act tagging for utterances in microblogs. The dialogue act estimator is built by using support vector machines (SVMs). To cope with the variety of words and expressions in microblogs, the feature vector uses N-grams of characters and words. In addition, the feature vector of word N-grams are abstracted into semantic categories by using a thesaurus. In our experiment, the proposed model outperformed naive baselines based on word N-grams. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2013-SLP-98, 号 1, p. 1-6, 発行日 2013-10-18 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |