@techreport{oai:ipsj.ixsq.nii.ac.jp:00081894, author = {別所, 史浩 and 原田, 達也 and 國吉, 康夫 and Fumihiro, Bessho and Tatsuya, Harada and Yasuo, Kuniyoshi}, issue = {13}, month = {May}, note = {Twitter 大規模コーパスとリアルタイムクラウドソーシングの枠組みを利用した対話システムを提案する.我々のシステムは複雑な対話管理を行わず,ユーザ発話に対して最も近い発話をデータベース中から探し出し,それに対する応答をシステム応答として返す枠組みとなっている.またデータベース内に適切な応答が見つからなかったときには,その発言を即時に他ユーザにクラウドソースする.その際ユーザが匿名化され,かつクラウドソースをしていることを認知させないような仕組みを提案する.本論文ではまず,Twitter から日本語発話対を抽出し,内容を解析する.得られたデータの中で長さが 2 を超えるものは発話対全体の 58.3% であった.得られた発話対からの類似発話検索では,各種応答選択手法に対して AUC (Area Under the ROC Curve) を用いた性能の比較評価を行い,品詞フィルタリング,文書正規化,本研究における学習データの分類性能の向上に有効に働くことが示された.実装されたシステムの評価実験を通じて,システムの用いるデータ数の増加は,多くの場合システム性能の向上に寄与するが,一定の値において有意に性能が下落することが観測された.また,クラウドソースを含めた実験を通じて,クラウドソースの枠組みの導入でユーザがシステムとの対話の中に面白さを感じるようになることが示された., We propose a dialog system that creates responses based on a 2-length tweets database and real-time crowdsourcing. Our system replies with the utterance from the database that is most similar to the user input. We also propose a real-time crowdsourcing framework for handling the case in which there is no adequate response in the database. The response scoring function is designed and evaluated using a survey, based on which positive/negative utterance pairs are created. We examine the effect of data size and real-time crowdsourcing on system response. Our results show that system performance improves with increasing amount of data in many case, but not always, and crowdsourcing framework enhances amusingness of the system.}, title = {リアルタイムクラウドソーシングとTwitter大規模コーパスを利用した対話システム}, year = {2012} }