| Item type |
SIG Technical Reports(1) |
| 公開日 |
2023-02-21 |
| タイトル |
|
|
タイトル |
実環境下日本語話し言葉音声コーパスの構築と音声認識ベンチマーク |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
SLP |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
京都大学情報学研究科 |
| 著者所属 |
|
|
|
京都大学情報学研究科 |
| 著者所属 |
|
|
|
京都大学情報学研究科 |
| 著者所属 |
|
|
|
東京大学情報理工学系研究科 |
| 著者所属 |
|
|
|
東京大学情報理工学系研究科 |
| 著者所属(英) |
|
|
|
en |
|
|
Kyoto University |
| 著者所属(英) |
|
|
|
en |
|
|
Kyoto University |
| 著者所属(英) |
|
|
|
en |
|
|
Kyoto University |
| 著者所属(英) |
|
|
|
en |
|
|
The University of Tokyo |
| 著者所属(英) |
|
|
|
en |
|
|
The University of Tokyo |
| 著者名 |
三村, 正人
井上, 昂治
河原, 達也
中村, 友彦
猿渡, 洋
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
実環境下において低遅延かつ高精度で動作する話し言葉のための遠隔音声認識システムは,対話ロボットとの円滑なコミュニケーションを実現する上で必須の技術である.本研究では,多数の雑音源が存在する 4 つのロケーションにおいて様々なトピックについてのプレゼンテーション音声を遠隔マイクで収録し,遠隔話し言葉音声認識の評価を行うためのコーパスを構築する.また,種々の音声強調・音声発話区分化・音声認識手法を用いた本コーパスの音声認識ベンチマーク結果について報告する.音声強調については,特に未知の環境下で頑健に動作する教師なし音源分離に基づく手法に焦点を当てる.既存の音声・雑音データセット上で学習したオンライン音声発話区分化およびバックエンド音声認識モデルを用いた音声認識実験において,オフライン音声強調で平均文字誤り率 15.0%,ストリーミング音声強調で 16.2%の音声認識精度を達成した. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
| 書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2023-SLP-146,
号 12,
p. 1-6,
発行日 2023-02-21
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |