リアルタイムクラウドソーシングとTwitter大規模コーパスを利用した対話システム

別所, 史浩; 原田, 達也; 國吉, 康夫; Fumihiro, Bessho; Tatsuya, Harada; Yasuo, Kuniyoshi

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

リアルタイムクラウドソーシングとTwitter大規模コーパスを利用した対話システム

https://ipsj.ixsq.nii.ac.jp/records/81894

名前 / ファイル	ライセンス	アクション
IPSJ-SLP12091013.pdf (1.2 MB)	Copyright (c) 2012 by the Information Processing Society of Japan
オープンアクセス

Item type

SIG Technical Reports(1)

公開日

2012-05-03

タイトル

リアルタイムクラウドソーシングとTwitter大規模コーパスを利用した対話システム

タイトル

言語

タイトル

Dialog System Using Real-Time Crowdsourcing and Two-Length Tweet Corpus

言語

jpn

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_18gh

資源タイプ

technical report

著者所属

東京大学

著者所属

東京大学

著者所属

東京大学

著者所属(英)

University of Tokyo

著者所属(英)

University of Tokyo

著者所属(英)

University of Tokyo

著者名

別所, 史浩原田, 達也國吉, 康夫

著者名(英)

Fumihiro, Bessho Tatsuya, Harada Yasuo, Kuniyoshi

論文抄録

内容記述タイプ

Other

内容記述

Twitter 大規模コーパスとリアルタイムクラウドソーシングの枠組みを利用した対話システムを提案する．我々のシステムは複雑な対話管理を行わず，ユーザ発話に対して最も近い発話をデータベース中から探し出し，それに対する応答をシステム応答として返す枠組みとなっている．またデータベース内に適切な応答が見つからなかったときには，その発言を即時に他ユーザにクラウドソースする．その際ユーザが匿名化され，かつクラウドソースをしていることを認知させないような仕組みを提案する．本論文ではまず，Twitter から日本語発話対を抽出し，内容を解析する．得られたデータの中で長さが 2 を超えるものは発話対全体の 58.3% であった．得られた発話対からの類似発話検索では，各種応答選択手法に対して AUC (Area Under the ROC Curve) を用いた性能の比較評価を行い，品詞フィルタリング，文書正規化，本研究における学習データの分類性能の向上に有効に働くことが示された．実装されたシステムの評価実験を通じて，システムの用いるデータ数の増加は，多くの場合システム性能の向上に寄与するが，一定の値において有意に性能が下落することが観測された．また，クラウドソースを含めた実験を通じて，クラウドソースの枠組みの導入でユーザがシステムとの対話の中に面白さを感じるようになることが示された．

論文抄録(英)

内容記述タイプ

Other

内容記述

We propose a dialog system that creates responses based on a 2-length tweets database and real-time crowdsourcing. Our system replies with the utterance from the database that is most similar to the user input. We also propose a real-time crowdsourcing framework for handling the case in which there is no adequate response in the database. The response scoring function is designed and evaluated using a survey, based on which positive/negative utterance pairs are created. We examine the effect of data size and real-time crowdsourcing on system response. Our results show that system performance improves with increasing amount of data in many case, but not always, and crowdsourcing framework enhances amusingness of the system.

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN10442647

書誌情報

研究報告音声言語情報処理（SLP）

巻 2012-SLP-91, 号 13, p. 1-8, 発行日 2012-05-03

Notice

SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-21 19:13:55.072931

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

リアルタイムクラウドソーシングとTwitter大規模コーパスを利用した対話システム

× 別所, 史浩原田, 達也國吉, 康夫

× Fumihiro, Bessho Tatsuya, Harada Yasuo, Kuniyoshi

Versions

Share

Cite as

エクスポート

インデックスリンク

インデックスツリー

アイテム

リアルタイムクラウドソーシングとTwitter大規模コーパスを利用した対話システム

× 別所, 史浩 原田, 達也 國吉, 康夫

× Fumihiro, Bessho Tatsuya, Harada Yasuo, Kuniyoshi

Versions

Share

Cite as

エクスポート

× 別所, 史浩原田, 達也國吉, 康夫