WEKO3
アイテム
バイモーダル車内音声認識評価用データベースの構築
https://ipsj.ixsq.nii.ac.jp/records/57023
https://ipsj.ixsq.nii.ac.jp/records/57023ce6b92bd-df4f-47a4-b6de-e28f7e92cd38
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-02-04 | |||||||
タイトル | ||||||||
タイトル | バイモーダル車内音声認識評価用データベースの構築 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Construction of Bimodal Database for Evaluating In-Car Speech Recognition | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
名古屋大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
名古屋大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
名古屋大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
名古屋大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
名古屋大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
名古屋大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
名古屋大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
名古屋大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
名城大学理工学部情報工学科 | ||||||||
著者所属 | ||||||||
名古屋商科大学経営情報学部 | ||||||||
著者所属 | ||||||||
(株)豊田中央研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information Engineering, Faculty of Science and Technology, Meijo University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Management Information Science, Nagoya University of Commerce & Business | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Toyota Central R&D Lab., Inc. | ||||||||
著者名 |
根木, 大輔
前野, 俊希
北坂, 孝幸
森, 健策
末永, 康仁
宮島, 千代美
伊藤, 克亘
武田, 一哉
板倉, 文忠
佐野, 昌己
二宮, 芳樹
× 根木, 大輔 前野, 俊希 北坂, 孝幸 森, 健策 末永, 康仁 宮島, 千代美 伊藤, 克亘 武田, 一哉 板倉, 文忠 佐野, 昌己 二宮, 芳樹
|
|||||||
著者名(英) |
Daisuke, NEGI
Toshiki, MAENO
Takayuki, KITASAKA
Kensaku, MORI
Yasuhito, SUENAGA
Chiyomi, MIYAJIMA
Katsunobu, ITOU
Kazuya, TAKEDA
Fumitada, ITAKURA
Masami, SANO
Yoshiki, NINOMIYA
× Daisuke, NEGI Toshiki, MAENO Takayuki, KITASAKA Kensaku, MORI Yasuhito, SUENAGA Chiyomi, MIYAJIMA Katsunobu, ITOU Kazuya, TAKEDA Fumitada, ITAKURA Masami, SANO Yoshiki, NINOMIYA
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年,現実の雑音環境下の様々なシーンにおいて音声認識率を向上させるために,音声情報と映像情報を統合したバイモーダル音声認識への関心が高まっている.映像情報は音響雑音の影響を受けない情報源として,音声認識において重要な役割を果たすものと考えられる.しかし,大規模バイモーダルデータベースが少ないことなどから,映像情報は実際の音声認識システムにおいて十分に利用されるには至っていない.そこで我々は,これまでに構築されている雑音環境下音声認識評価用共通データベースAURORA-2J/AURORA-3Jの仕様に則り,高品質カラー映像と近赤外映像を付加して収録を行い,新しいデータベースAURORA-2J-AV(室内),AURORA-3J-AV(自動車内)を構築している.本稿ではこれらのデータベースの詳細について述べる. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | There are remarkable interests on bimodal speech recognition, which integrate audio and visual information, to improve speech recognition rates. Visual information plays a very important role in speech recognition since it is not affected by acoustic noises. However, such kind of information has not been fully used in existing actual speech recognition systems because of the lack of large-scale bimodal databases. Therefore we are building new databases called AURORA-2J-AV(indoor) and AURORA-3J-AV(in-vehicle) that contain aural signals and high quality facial images taken by color and near-infrared cameras. The utterance tasks of these databases are the same as those of our AURORA-2J/AURORA-3J database for evaluating speech recognition method under noisy environments. This paper describes the detailed specification of the databases. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2005, 号 12(2004-SLP-055), p. 35-40, 発行日 2005-02-04 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |