WEKO3
アイテム
人名と番組名の言い換えに対応する音声認識インタフェース
https://ipsj.ixsq.nii.ac.jp/records/68708
https://ipsj.ixsq.nii.ac.jp/records/687082f465a91-4aaa-4a08-a279-40993f2d38a2
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2010-03-15 | |||||||
タイトル | ||||||||
タイトル | 人名と番組名の言い換えに対応する音声認識インタフェース | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Speech Recognition Interface Accepting Paraphrases of Celebrity Names and Program Titles | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 特集:マルチメディア、分散、協調とモバイルシステム | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
株式会社東芝研究開発センター | ||||||||
著者所属 | ||||||||
株式会社東芝研究開発センター | ||||||||
著者所属 | ||||||||
株式会社東芝研究開発センター | ||||||||
著者所属 | ||||||||
株式会社東芝研究開発センター | ||||||||
著者所属 | ||||||||
株式会社東芝研究開発センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Corporate Research and Development Center, Toshiba Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Corporate Research and Development Center, Toshiba Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Corporate Research and Development Center, Toshiba Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Corporate Research and Development Center, Toshiba Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Corporate Research and Development Center, Toshiba Corporation | ||||||||
著者名 |
大内一成
× 大内一成
|
|||||||
著者名(英) |
Kazushige, Ouchi
× Kazushige, Ouchi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | テレビでの番組検索やWeb検索など,キーボードが使えない機器での文字入力の機会が増加している.そのような場面に適した音声認識の課題は,受理可能な語彙数と音声認識率にトレードオフの関係がある点である.実用的な認識率を確保できる語彙数の制約の中で,発話語彙に対するカバー率を上げるため,検索対象のコンテンツごとに愛称などを加えた認識語彙を生成する手法を提案する.これにより発話語彙カバー率が9ポイント向上していることが確認できた.さらに音声認識とリモコン操作を併用したマルチモーダル操作手法により,テレビ番組検索実験では,スクリーンキーボードを用いた従来手法より,提案手法がタスク完了までの所要時間を約40%短縮できた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The opportunities of character entry on keyboard less devices such as TV have increased. The problem of speech recognition which is suitable for the situation is a trade-off between the number of acceptable vocabulary and recognition accuracy. In order to improve the cover ratio in the limitation of the number to keep the practical accuracy, we propose vocabulary generation including paraphrases such as nicknames from the targeted contents. We confirmed that it improved the cover ratio of vocabulary by 9 points by adopting paraphrases. Moreover, in the experiment of TV program retrieval, the proposed multimodal interface by the combined use of speech recognition and remote control shortened the time required to finish all tasks by about 40% against the conventional method using a screen keyboard. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 51, 号 3, p. 846-855, 発行日 2010-03-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |