WEKO3
アイテム
ユーザの発話傾向分析に基づく車載機器操作のための音声入力手法の検討
https://ipsj.ixsq.nii.ac.jp/records/66400
https://ipsj.ixsq.nii.ac.jp/records/664006e94e771-8fc8-4cb4-a741-2801fd223d86
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-10-16 | |||||||
タイトル | ||||||||
タイトル | ユーザの発話傾向分析に基づく車載機器操作のための音声入力手法の検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Speech Input Method in Automobiles Reflecting Analysis on How Users Speak | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 一般講演 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
日本アイ・ビー・エム株式会社東京基礎研究所 | ||||||||
著者所属 | ||||||||
日本アイ・ビー・エム株式会社東京基礎研究所 | ||||||||
著者所属 | ||||||||
日本アイ・ビー・エム株式会社東京基礎研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research - Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research - Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research - Tokyo | ||||||||
著者名 |
倉田, 岳人
市川, 治
西村, 雅史
× 倉田, 岳人 市川, 治 西村, 雅史
|
|||||||
著者名(英) |
Gakuto, Kurata
Osamu, Ichikawa
Masafumi, Nishimura
× Gakuto, Kurata Osamu, Ichikawa Masafumi, Nishimura
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | ドライバーへの負荷を軽減する,車載機器操作手段の一つとして音声認識が取り入れられてきた.しかし,あらかじめ定められた定型句からなるコマンドしか受理できない従来の音声コマンド方式では,ユーザが前もってコマンドを正確に記憶していることを前提としており,音声入力に不慣れなユーザが直観的に音声だけで車載機器を操作することは困難である.本報告では,車載機器操作のための発話を多数のユーザから収集し,それらに分析を加え,従来方式の限界を定量的・定性的に検証した.さらに,大語彙連続音声認識と自然言語理解の組み合わせにより,ユーザの自由な発話を受理できる拡張音声コマンド方式を開発した.本方式を利用して,実際の車載機器の音声操作機能を実装し,92% を超えるタスク達成率を得ることができた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Automatic Speech Recognition (ASR) has been adapted as a method to control embedded systems in automobiles. The most used approach "Voice Command" is difficult to use for normal users because it accepts only the predefined commands. In this report, we qualitatively and quantitatively show the limitations of "Voice Command" by collecting and analyzing the real utterance examples of users. We also developed "Expanded Voice Command" that can accept users' unconstrained utterance by combining "Large Vocabulary Continuous Speech Recognition" and "Natural Language Understanding". We implemented the ASR function of a stock car with "Expanded Voice Command" and confirmed that it achieved more than 92% of task completion ratio. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2009-SLP-78, 号 2, p. 1-6, 発行日 2009-10-16 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |