WEKO3
アイテム
意味的類似性を用いた後処理的な音声認識正解部分特定法と音声翻訳手法への導入
https://ipsj.ixsq.nii.ac.jp/records/57750
https://ipsj.ixsq.nii.ac.jp/records/57750bdcc368e-2334-4fe8-869d-edfadbee37b9
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1997 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1997-07-18 | |||||||
タイトル | ||||||||
タイトル | 意味的類似性を用いた後処理的な音声認識正解部分特定法と音声翻訳手法への導入 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Correct parts extraction from speech recognition results using semantic distance calculation, and its application to speech translation | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
ATR音声翻訳通信研究所 | ||||||||
著者所属 | ||||||||
現在東洋情報システム(株)に勤務 | ||||||||
著者所属 | ||||||||
ATR音声翻訳通信研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Interpreting Telecommunications Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Interpreting Telecommunications Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Interpreting Telecommunications Research Laboratories | ||||||||
著者名 |
脇田, 由実
× 脇田, 由実
|
|||||||
著者名(英) |
Yumi, Wakita
× Yumi, Wakita
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 話し言葉を音声認識した場合の誤り文の解析を目的として、音声認識処理後の結果文から正解部分のみを特定する手法を提案する。話し言葉の文法記述が困難であることと、音声認識用の言語処理が文の局所的な部分にのみ制約をかけていることを考慮し、本手法では、用例に依存した単語間の意味的距離と意味的距離の近さから決定された単語間の依存関係とを用いて、音声認識の際の言語的な制約範囲と比べてより大局的な範囲での表現の自然性を判断することにより正解部分を特定した。本手法を音声翻訳システムに導入し、音声認識結果の正解部分のみを部分翻訳するシステムを作成した。このシステムを用いて、次の3点を評価することで、本手法の有効性を調べた。() 正解部分特定率、() 文理解への影響、() 翻訳率への影響。その結果、特定された正解部分の96%は実際に正解であり、高い信頼度で正解部分を特定されることがわかった。また、正解部分のみを抽出することで、本手法の導入以前には誤った意味に理解された文を半減することができた。さらに、特定した正解部分のみを翻訳することで、認識誤り文の約69%の翻訳結果が対話を円滑に進めるに足る内事であった。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes a method for extracting the correct parts from speech recognition results by using an example-based approach for parsing those results that include several recognition errors. Correct parts are extracted using two factors: (1) the semantic distance between the input expression and example expression, and (2) the structure selected by the shortest semantic distance. We examined the correct parts extraction rate and the effectiveness of the method in improving the speech understanding rate and the speech translation rate. The examination results showed that the proposed method is able to efficiently extract the correct parts from speech recognition results. About ninety-six percent of the extracted parts are correct. The results also showed that the proposed method is effective in understanding misrecognition speech sentences and in improving speech translation results. The misunderstanding rate for erroneous sentences is reduced about half. Sixty-nine percent of speech translation results are improved for misrecognized sentences. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 1997, 号 66(1997-SLP-017), p. 19-26, 発行日 1997-07-18 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |