@techreport{oai:ipsj.ixsq.nii.ac.jp:00176404, author = {後藤, 統興 and 山本, 一公 and 中川, 聖一 and Norioki, Goto and Kazumasa, Yamamoto and Seiichi, Nakagawa}, issue = {18}, month = {Dec}, note = {自動音声認識と統計的機械翻訳を組み合わせた英語講義音声を日本語文へ翻訳する音声翻訳システムの改善を検討した.翻訳対象ドメインに近い話し言葉の英語講演音声に対して音声認識を行い,音声認識誤りを持つ書き起こしを作成し,正しい書き起こしに対する人手の日本語訳と対にすることで,音声認識誤り付きのパラレルコーパスを作成した.これを翻訳モデルの学習に利用することで,音声認識誤りによる翻訳への影響を軽減した.利用手法として,機械翻訳の学習に利用する誤りのないコーパスに追加する手法と,誤りのないコーパスのみで作成したフレーズテーブルに対して誤り付きのコーパスのみで作成したフレーズテーブルを統合する手法を比較した.性能の比較には自動評価指標 BLEU を用いた.対象ドメインの音声認識結果を翻訳した結果,誤り付きのパラレルコーパスを学習コーパスへ加えることにより,最大で 10.0 (BLEU) を得ることができ,ベースラインの 7.7 (BLEU) を上回った.また,学生を対象に,翻訳対象の講義音声の書き起こしと音声の翻訳実験を行い,機械による音声認識と翻訳結果との比較を行った.}, title = {英日講義音声翻訳に対する音声認識誤りを考慮したパラレルコーパスの利用}, year = {2016} }