Item type |
SIG Technical Reports(1) |
公開日 |
2016-05-14 |
タイトル |
|
|
タイトル |
非同期スマートデバイスを用いた雑音に頑健な音声翻訳アプリケーションの検討 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Application of Noise-Robust Speech Translation Using Asynchronous Smart Devices |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
日立製作所研究開発グループ |
著者所属 |
|
|
|
日立製作所研究開発グループ |
著者所属 |
|
|
|
日立製作所研究開発グループ |
著者所属 |
|
|
|
日立製作所研究開発グループ |
著者所属(英) |
|
|
|
en |
|
|
Hitachi Ltd. Research and development group |
著者所属(英) |
|
|
|
en |
|
|
Hitachi Ltd. Research and development group |
著者所属(英) |
|
|
|
en |
|
|
Hitachi Ltd. Research and development group |
著者所属(英) |
|
|
|
en |
|
|
Hitachi Ltd. Research and development group |
著者名 |
高島, 遼一
孫, 慶華
住吉, 貴志
戸上, 真人
|
著者名(英) |
Ryoichi, Takashima
Qinghua, Sun
Takashi, Sumiyoshi
Masahito, Togami
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,汎用スマートデバイスを用いた雑音に頑健な音声翻訳アプリケーションを検討する.提案する音声翻訳システムでは,二人のユーザがそれぞれスマートデバイスを持って対話を行う.各スマートデバイスで収録された音声は,雑音除去,音声認識,翻訳を行うサーバへ送信され,翻訳結果が返送される.雑音除去部においては,二個のスマートデバイスを擬似的なマイクロホンアレーとして活用することで,複数チャネルによる音源分離を行う.このとき,デバイス毎に録音開始時刻とサンプリングレートのミスマッチがあるため,相互相関関数による録音開始時刻の補正と,サンプリングレートのミスマッチに対して,位相差よりも頑健な音圧差を用いた音源分離方式を用いる.騒音レベル 70dB の雑音環境下において音声認識実験を実施した結果,雑音除去の無いシステムと比較して 21.2%の単語認識誤り率改善を確認した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In this paper, we propose an application of noise-robust speech translation for general purpose smart devices. In the proposed speech translation system, two users have a conversation with their own smart devices installing speech translation applications. The recorded speech signals are sent to a server performing speech signal processing, speech recognition and translation, and translation results are returned to users' smart devices. In the speech signal processing part, a virtual microphone array is constructed from the microphones on users' smart devices, and a microphone-array-based noise reduction is performed. Then, because each smart device has different beginning time of recording and different sampling rate, we apply a cross-correlation-based compensation of beginning time and a signal separation method based on the difference of sound energy that is robust against the mismatch of sampling rate. We carried out a speech recognition experiment using two smart devices at a noisy environment in which noise level is 70dB, and as a result, the noise reduction process improved the word error rate of a speech recognition system without noise reduction by 21.2%. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10438388 |
書誌情報 |
研究報告音楽情報科学(MUS)
巻 2016-MUS-111,
号 54,
p. 1-5,
発行日 2016-05-14
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8752 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |