WEKO3
アイテム
音声・視覚・画像をもつインタラクションシステム
https://ipsj.ixsq.nii.ac.jp/records/57940
https://ipsj.ixsq.nii.ac.jp/records/579403375ca46-33a2-4183-8f35-6e0f7110ceb2
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1995 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1995-02-03 | |||||||
タイトル | ||||||||
タイトル | 音声・視覚・画像をもつインタラクションシステム | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Multi - modal Interaction System which has Speech I/O and Visual I/O | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
電子技術総合研究所 | ||||||||
著者所属 | ||||||||
電子技術総合研究所 | ||||||||
著者所属 | ||||||||
電子技術総合研究所 | ||||||||
著者所属 | ||||||||
電子技術総合研究所 | ||||||||
著者所属 | ||||||||
電子技術総合研究所 | ||||||||
著者所属 | ||||||||
電子技術総合研究所 | ||||||||
著者所属 | ||||||||
電子技術総合研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Electrotechnical Laboratory | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Electrotechnical Laboratory | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Electrotechnical Laboratory | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Electrotechnical Laboratory | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Electrotechnical Laboratory | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Electrotechnical Laboratory | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Electrotechnical Laboratory | ||||||||
著者名 |
伊藤, 克亘
× 伊藤, 克亘
|
|||||||
著者名(英) |
Itou, Katunobu
× Itou, Katunobu
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 音声認識・音声合成・顔画像合成・顔画像認識の4つのモードをもつマルチモーダルインタラクションシステムについて報告する。従来の音声入出力だけのシステムに比べ、)合成音声だけでは伝えにくい表情を顔画像合成によって伝えることができる。)音声入出力だけでは話しかける対象がなくて話しにくいといった欠点を顔画像を表示するよって補うことができる。)能動的にシステムの側から利用者に向かって話しかけるという音声入出力だけでは実現不可能な機能を、顔画像認識と統合することで実現した。また、これらの機能を持つ試作システムを構築した結果えられた複数のモードを統合するときに生じる問題点について考察する。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper describes a prototype multi-modal interaction system which includes a speech recognizer, a speech synthesizer, a face generator, a face recognizer and a dialogue manager. Compared with current speech dialog systems, our system have new functions as follows: 1) It can convey non-verbal expressions to a user. 2) It can decrease difficulties which a user feels to talk to the system without a face. 3) It can initiate to talk to a user actively with integration of a face recognizer. These functions cannot be realized only using a speech recognizer and a speech synthesizer. We also discuss the problem to integrate multiple modes into a single system, based on experience of the construction of the prototype system. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 1995, 号 16(1994-SLP-005), p. 31-38, 発行日 1995-02-03 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |