WEKO3
アイテム
音声シフト:“SHIFT” on Speech
https://ipsj.ixsq.nii.ac.jp/records/36953
https://ipsj.ixsq.nii.ac.jp/records/369535ff633eb-bc75-4550-8ad5-c0ce7aa0e143
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2002 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2002-02-01 | |||||||
タイトル | ||||||||
タイトル | 音声シフト:“SHIFT” on Speech | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Speech Shift: "SHIFT" on Speech | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
早稲田大学理工学部電気電子情報工学科 | ||||||||
著者所属 | ||||||||
産業技術総合研究所 | ||||||||
著者所属 | ||||||||
産業技術総合研究所 | ||||||||
著者所属 | ||||||||
早稲田大学理工学部電気電子情報工学科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Dept. EECE, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Advanced Industrial Science Technology AIST | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Advanced Industrial Science Technology AIST | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Dept. EECE, Waseda University | ||||||||
著者名 |
尾本, 幸宏
× 尾本, 幸宏
|
|||||||
著者名(英) |
Yukihiro, Omoto
× Yukihiro, Omoto
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,非言語情報の一つである音高を利用した,「音声シフト」という新たな音声入力インタフェース機能を提案する.我々は,従来の音声認識システムにおいて未使用だった非言語情報を活用することによって,音声の持つ潜在能力を引き出すことを目指している.音声シフトでは,普通に発声した発話と故意に高く発声した発話を異なるモードに割り当てることで,シームレスなモード切替えを音声のみで実現した.実際に,音声テキストエディタに応用したところ,効率よく文字入力できる,効果的なインタフェースを構築できた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper describes a new speech-input interface function called speech shift. While current speech-input interfaces have used only verbal infomation, we aim to build a more user-friendly speech interface by making use of nonverbal infomation. Our speech shift function enables a user to enter the same word in different meanings (functions) without changing a speech-input mode explicitly, using intentional F0 (fundamental frequency, perceived as pitch) control. For example, our speech shift interface can regard an utterance with a normal (low) F0 as a regular-mode input and an utterance with a high F0 as a command-mode input (such as word delete and file save commands). In our experience with a speech text editor with the speech shift function, the effectiveness of the speech shift was confirmed. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA1221543X | |||||||
書誌情報 |
情報処理学会研究報告ヒューマンコンピュータインタラクション(HCI) 巻 2002, 号 10(2001-HI-097), p. 13-18, 発行日 2002-02-01 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |