WEKO3
アイテム
擬人化音声対話エージェント開発とその意義
https://ipsj.ixsq.nii.ac.jp/records/57492
https://ipsj.ixsq.nii.ac.jp/records/5749257ed6888-0617-4d32-9929-873dcac2c149
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2000-10-27 | |||||||
タイトル | ||||||||
タイトル | 擬人化音声対話エージェント開発とその意義 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Developement of Anthropomorphic Dialogue Agent : a Plan and Its Significance | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
北陸先端科学技術大学院大学情報科学研究科/東京大学大学院工学系研究科 | ||||||||
著者所属 | ||||||||
ATR音声言語通信研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Japan Advanced Institute of Science and Technology/University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Spoken Language Translation Research Labs | ||||||||
著者名 |
嵯峨山, 茂樹
× 嵯峨山, 茂樹
|
|||||||
著者名(英) |
Shigeki, Sagayama
× Shigeki, Sagayama
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 擬人化音声対話エージェントの基本ソフトウェアの開発に向けて、その意義を議論する。IPAからサポートを受けて3年間の予定で開発に着手した。構成要素は、音声認識、音声合成、顔画像生成、エージェント統合処理の4部分である。IPAプロジェクトで開発された顔画像生成、音声認識の無償公開ソフトウェアを利用し、音声合成を新たに開発し、これらを統合する処理を加える。ヒューマンインタフェース危機への解決方向、産業応用の可能性、今後の音声技術研究の問題発掘、モルチモダリティの研究、研究キットとプラットフォームの提供などの多くの意義を持つ。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A plan of anthropomorphic spoken dialogue agent development is presented and its significance is discussed. With a 3-year financial supoport from IPA, a research team launched a project. The system will consists of four modules: speech recognition, speech synthesis, facial animation, and agent integration. Fully utilizing open softwares for speech recognition and facial image generation already developed under IPA supports, speech synthesis and agent integration will be newly developed. Significance of this plan is discussed in many aspects including solution to human interface crisis, industorial applications, finding new speech research issues, multimodality research, and open source provision of a software kit and platform future research. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2000, 号 101(2000-SLP-033), p. 1-6, 発行日 2000-10-27 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |