WEKO3
アイテム
日本語母語話者による英語発話認識のための言語モデル適応化
https://ipsj.ixsq.nii.ac.jp/records/66505
https://ipsj.ixsq.nii.ac.jp/records/66505ea0845d7-ff17-46d8-8c97-e057925889b5
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-10-15 | |||||||
タイトル | ||||||||
タイトル | 日本語母語話者による英語発話認識のための言語モデル適応化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Language Model Adaptation of an English Speech Recognizer for Japanese | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 一般論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
同志社大学 | ||||||||
著者所属 | ||||||||
同志社大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Doshisha University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Doshisha University | ||||||||
著者名 |
原田, 貴史
× 原田, 貴史
|
|||||||
著者名(英) |
Takashi, Harada
× Takashi, Harada
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 様々な言語を母語とする人が集まる国際的な会議やビジネスの場などでの発表・交渉・議論は主に英語でなされることから,英語発話ドキュメント処理においては,英語母語話者の発話に加えて第二言語話者による英語発話認識の高性能化も重要である.第二言語話者による発音や表現は母語の干渉を受け,英語母語話者の発音や表現とは異なる点があるため,英語母語話者の音声データを用いて学習を行った英語音声認識装置では,第二言語話者による英語発話に対する音声認識性能は劣化する.本論文は,日本語母語話者による英語発話の認識率を向上させる取り組みとして言語モデル適応手法を提案し,その認識実験結果について記述している.日本語を母語とする英語学習者による英訳文を収集した学習者コーパスを用いて学習を行った言語モデルを,同一ドメインの大規模な英文コーパスで学習した言語モデルに線形補間した言語モデルを開発した.この言語モデルの使用により,日本語母語話者により英語表現された英語発話の認識率が向上することが確認された.また,学習者コーパスの作成方法の違いが認識性能に与える影響についての検討結果も記述している. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | English is spoken during presentations and discussions at international conferences and business meetings by many people who have different mother tongues, and there is a need for automatic speech recognition which transcribes English speech by the second language speakers as well as native speakers. English as a second language (ESL) speakers often have a distinct accent, as well as different lexical and syntactic characteristics. As the language model of a speech recognition system is usually trained with transcribed speech data or text data collected in English-native countries, and speech recognition performance is severely affected when the lexical or syntactic characteristics in the training and recognition tasks differ, speech recognition performance is expected to be degraded by mismatch of lexical and syntactic characteristics between native speakers and ESL speakers, as well as the distinction between their accents. This paper proposes a language model adaptation to compensate for mismatch between those characteristics of native speakers and ESL speakers. A language model was created by linearly interpolating a language model trained with a learner corpus and a language model trained with a large native English corpus of the same domain. Some experiments verified that language model adaptation was effective for compensating for the mismatch between the lexical and syntactic characteristics of native speakers and ESL speakers. This paper also describes some relations between the methodology of creating the learner corpus and recognition performance. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 50, 号 10, p. 2574-2582, 発行日 2009-10-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |