Item type |
SIG Technical Reports(1) |
公開日 |
2016-12-13 |
タイトル |
|
|
タイトル |
英日講義音声翻訳に対する音声認識誤りを考慮したパラレルコーパスの利用 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Utilization of Parallel Corpus with Speech Misrecognition for English to Japanese Lecture Speech Translation |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
ポスターセッション |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
豊橋技術科学大学 |
著者所属 |
|
|
|
豊橋技術科学大学 |
著者所属 |
|
|
|
豊橋技術科学大学 |
著者所属(英) |
|
|
|
en |
|
|
TUT |
著者所属(英) |
|
|
|
en |
|
|
TUT |
著者所属(英) |
|
|
|
en |
|
|
TUT |
著者名 |
後藤, 統興
山本, 一公
中川, 聖一
|
著者名(英) |
Norioki, Goto
Kazumasa, Yamamoto
Seiichi, Nakagawa
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
自動音声認識と統計的機械翻訳を組み合わせた英語講義音声を日本語文へ翻訳する音声翻訳システムの改善を検討した.翻訳対象ドメインに近い話し言葉の英語講演音声に対して音声認識を行い,音声認識誤りを持つ書き起こしを作成し,正しい書き起こしに対する人手の日本語訳と対にすることで,音声認識誤り付きのパラレルコーパスを作成した.これを翻訳モデルの学習に利用することで,音声認識誤りによる翻訳への影響を軽減した.利用手法として,機械翻訳の学習に利用する誤りのないコーパスに追加する手法と,誤りのないコーパスのみで作成したフレーズテーブルに対して誤り付きのコーパスのみで作成したフレーズテーブルを統合する手法を比較した.性能の比較には自動評価指標 BLEU を用いた.対象ドメインの音声認識結果を翻訳した結果,誤り付きのパラレルコーパスを学習コーパスへ加えることにより,最大で 10.0 (BLEU) を得ることができ,ベースラインの 7.7 (BLEU) を上回った.また,学生を対象に,翻訳対象の講義音声の書き起こしと音声の翻訳実験を行い,機械による音声認識と翻訳結果との比較を行った. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2016-SLP-114,
号 18,
p. 1-7,
発行日 2016-12-13
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |