WEKO3
アイテム
アンドロイドERICAの音声対話システム~マルチモーダルチューリングテストへの挑戦~
https://ipsj.ixsq.nii.ac.jp/records/211513
https://ipsj.ixsq.nii.ac.jp/records/2115134bb8987d-1d88-4f0a-b3b1-9a180043857a
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2021 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
|
|
MUS:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2021-06-11 | |||||||
タイトル | ||||||||
タイトル | アンドロイドERICAの音声対話システム~マルチモーダルチューリングテストへの挑戦~ | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Spoken Dialogue System for Android ERICA–A Multimodal Turing Test Challenge– | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 招待講演 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
京都大学大学院情報学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Informatics, Kyoto University | ||||||||
著者名 |
井上, 昂治
× 井上, 昂治
|
|||||||
著者名(英) |
Koji, Inoue
× Koji, Inoue
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 人間のように会話ができる機械(ロボット)の実現は人工知能研究の大きな目標の一つである.深層学習の登場により音声言語処理技術が格段に進歩し,音声対話システムが様々な場面で実用化され,日常的なものになりつつある.ただし,現状のシステムでは一問一答の機械的かつ簡単なやりとりがほとんどであり,「人間レベルの深い会話」を実現しているとは言い難い.本講演では,自律型アンドロイド ERICA の研究において,これまでに構築してきた音声対話システムについて紹介する.本研究における究極の目標は,人間と遜色のない音声対話を実現することである.はじめに,人間レベルの対話を実現するための要素技術として,相槌やターンテイキングなどの予測モデルについて紹介する.次に,具体的な対話タスクとして傾聴,就職面接,研究室紹介を挙げ,これらの音声対話システムの実装や対話実験について述べる.特に傾聴では,人間による傾聴(Wizard-of-Oz)との比較(マルチモーダルチューリングテスト)を実施した.その結果,人間と同等のレベルを達成できた点や現状では人間に及ばない点が明らかになった.最後に,これまでの取り組みから得られた課題を振り返りつつ,今後の音声対話システムの研究開発が目指すべき点について提案する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | One of the major goals for artificial intelligence research is to realize machines (or robots) that can talk like human beings. Applying deep learning to spoken language processing has advanced its technology dramatically, with spoken dialogue systems being put to practical use in various situations and becoming more commonplace. However, since current dialogue systems are still rather mechanical and simple such as question and answering, it is hard to say that the systems have achieved “human-level deep conversation”. In this talk, I introduce a research project involving autonomous android ERICA and its spoken dialogue system. The ultimate goal of this research project is to realize spoken dialogue comparable to that done by human beings. Firstly, I explain basic prediction models of backchannels and turn-taking to improve human-level dialogue. Then I describe the implementation and dialogue experiments for three specific spoken dialogue tasks: attentive listening, job interview, and laboratory guide. For attentive listening, a multimodal Turing test was conducted to compare the system with human listeners (Wizard-of-Oz). The results showed that the system achieved the same level of performance as humans in some basic aspects of attentive listening but currently is not at the level of deeper conversation. Finally, reviewing the challenges found in this project, future directions for research on spoken dialogue systems are proposed. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10438388 | |||||||
書誌情報 |
研究報告音楽情報科学(MUS) 巻 2021-MUS-131, 号 4, p. 1-1, 発行日 2021-06-11 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 2188-8752 | |||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |