Item type |
SIG Technical Reports(1) |
公開日 |
2016-05-09 |
タイトル |
|
|
タイトル |
対象ドメインの高頻出句に対する人手対訳追加による講義音声翻訳の検討 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Investigation of speech translation for Lectures by using manually extracted parallel phrases for frequently occurrences in-domain. |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
音声認識,対話,翻訳 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
豊橋技術科学大学 |
著者所属 |
|
|
|
豊橋技術科学大学 |
著者所属 |
|
|
|
豊橋技術科学大学 |
著者所属(英) |
|
|
|
en |
|
|
Toyohashi Univer |
著者所属(英) |
|
|
|
en |
|
|
Toyohashi Univer |
著者所属(英) |
|
|
|
en |
|
|
Toyohashi Univer |
著者名 |
後藤, 統興
山本, 一公
中川, 聖一
|
著者名(英) |
Norioki, Goto
Kazumasa, Yamamoto
Seiichi, Nakagawa
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
自動音声認識と統計的機械翻訳を組み合わせた,英語音声を日本語文書へ翻訳する音声翻訳システムについて,統計的機械翻訳の改善を行った.単語列を句とし,翻訳対象ドメインの英語書き起こしから頻出する句を抽出した.抽出の手法として n-gram 単位で抽出する手法と構文解析を用いて抽出する手法について比較を行った.抽出した句のうちテストデータに出現するものに対して人手によって翻訳を行うことで,対象ドメインに頻出する英日の頻出フレーズ対を作成した.作成した英日フレーズ対を翻訳モデルへ学習させることで対象ドメインへの適応を行った.学習の手法として学習コーパスとして追加する手法とフレーズテーブルに追加する手法を比較した.性能の比較を行うために評価基準 BLEU を用いた.結果として書き起こしの英語文を日本語へ翻訳した結果,構文解析によって抽出し,作成した英日フレーズ対をフレーズテーブルに追加する手法において BLEU10.5 を得ることができ,ベースラインのモデルの BLEU10.2 を上回った.また,英語を習熟した評価者三名に評価を依頼し,本手法の有効性を確認した. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
書誌情報 |
研究報告自然言語処理(NL)
巻 2016-NL-226,
号 3,
p. 1-8,
発行日 2016-05-09
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |