WEKO3
アイテム
リアルタイムクラウドソーシングとTwitter大規模コーパスを利用した対話システム
https://ipsj.ixsq.nii.ac.jp/records/81894
https://ipsj.ixsq.nii.ac.jp/records/81894b188d0cc-8943-4a06-8884-fc238a0efac7
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-05-03 | |||||||
タイトル | ||||||||
タイトル | リアルタイムクラウドソーシングとTwitter大規模コーパスを利用した対話システム | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Dialog System Using Real-Time Crowdsourcing and Two-Length Tweet Corpus | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学 | ||||||||
著者所属 | ||||||||
東京大学 | ||||||||
著者所属 | ||||||||
東京大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Tokyo | ||||||||
著者名 |
別所, 史浩
原田, 達也
國吉, 康夫
× 別所, 史浩 原田, 達也 國吉, 康夫
|
|||||||
著者名(英) |
Fumihiro, Bessho
Tatsuya, Harada
Yasuo, Kuniyoshi
× Fumihiro, Bessho Tatsuya, Harada Yasuo, Kuniyoshi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Twitter 大規模コーパスとリアルタイムクラウドソーシングの枠組みを利用した対話システムを提案する.我々のシステムは複雑な対話管理を行わず,ユーザ発話に対して最も近い発話をデータベース中から探し出し,それに対する応答をシステム応答として返す枠組みとなっている.またデータベース内に適切な応答が見つからなかったときには,その発言を即時に他ユーザにクラウドソースする.その際ユーザが匿名化され,かつクラウドソースをしていることを認知させないような仕組みを提案する.本論文ではまず,Twitter から日本語発話対を抽出し,内容を解析する.得られたデータの中で長さが 2 を超えるものは発話対全体の 58.3% であった.得られた発話対からの類似発話検索では,各種応答選択手法に対して AUC (Area Under the ROC Curve) を用いた性能の比較評価を行い,品詞フィルタリング,文書正規化,本研究における学習データの分類性能の向上に有効に働くことが示された.実装されたシステムの評価実験を通じて,システムの用いるデータ数の増加は,多くの場合システム性能の向上に寄与するが,一定の値において有意に性能が下落することが観測された.また,クラウドソースを含めた実験を通じて,クラウドソースの枠組みの導入でユーザがシステムとの対話の中に面白さを感じるようになることが示された. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We propose a dialog system that creates responses based on a 2-length tweets database and real-time crowdsourcing. Our system replies with the utterance from the database that is most similar to the user input. We also propose a real-time crowdsourcing framework for handling the case in which there is no adequate response in the database. The response scoring function is designed and evaluated using a survey, based on which positive/negative utterance pairs are created. We examine the effect of data size and real-time crowdsourcing on system response. Our results show that system performance improves with increasing amount of data in many case, but not always, and crowdsourcing framework enhances amusingness of the system. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2012-SLP-91, 号 13, p. 1-8, 発行日 2012-05-03 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |