WEKO3
アイテム
視線・音声入力に基づくマルチモーダル・ショートカット機能の提案・試作と評価
https://ipsj.ixsq.nii.ac.jp/records/57674
https://ipsj.ixsq.nii.ac.jp/records/57674b9c0a5f0-72d9-4326-8471-84edb0546662
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1998 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1998-07-24 | |||||||
タイトル | ||||||||
タイトル | 視線・音声入力に基づくマルチモーダル・ショートカット機能の提案・試作と評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Multi - modal shortcut : a robust selection system using gaze and speech inputs. | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
(株)東芝関西研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
TOSHIBA Kansai Research Laboratories. | ||||||||
著者名 |
田中, 克己
× 田中, 克己
|
|||||||
著者名(英) |
Katsumi, Tanaka
× Katsumi, Tanaka
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | マルチモーダル入力をベースとしたインタフェースとして、マルチモーダル・ショートカットを提案する。これは従来よく行われてきた、自然言語、ジェスチャ入力などの組合わせによる複雑なマルチモーダル入力解析を対象とするものではなく、オブジェクト選択のような単機能をタスクとしている。通常想定される入力モダリティからの入力の不確実性に対して、個々の選択対象をエージェント化し、ユーザとエージェントのリアルタイム・インタラクションにより、ロバストな選択機能を実現するのが特徴である。本報告では視線・音声入力を用いたシステム試作と評価について報告する。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper presents a real-time object selection system, called multi-modal shortcut, which can deal with gaze and speech inputs with uncertainty. Although there has been many researches which focused on integration of multi-modal information, most of them assumed that each input is perfectly recognized. In addition, real-time interaction with user is an important and desirable feature which few systems have attempted. Unlike those systems, we focused on satisfying these two requirements. In our system, target objects are modeled by agents which react with user's action in real-time. Agent's reaction are based on integration of multi-modal inputs. Our first experiments shows that it is possible to select target object successfully in most cases, even if either of modalities has great uncertainty. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 1998, 号 68(1998-SLP-022), p. 7-14, 発行日 1998-07-24 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |