WEKO3
アイテム
関連語彙獲得に基づく認識辞書のオフライン教師なし適応
https://ipsj.ixsq.nii.ac.jp/records/57123
https://ipsj.ixsq.nii.ac.jp/records/57123f3e5d125-2879-4d9f-8928-750e698d3722
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2004 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2004-07-17 | |||||||
タイトル | ||||||||
タイトル | 関連語彙獲得に基づく認識辞書のオフライン教師なし適応 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Off - line Unsupervised Vocabulary Adaptation based on Relevant Word Acquisition | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
日本電信電話株式会社NTTサイバーソリューション研究所 | ||||||||
著者所属 | ||||||||
日本電信電話株式会社NTTサイバースペース研究所 | ||||||||
著者所属 | ||||||||
大阪大学大学院言語文化研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Cyber Solutions Laboratories, NTT Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Cyber Space Laboratories, NTT Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Language and Culture, Osaka University | ||||||||
著者名 |
廣嶋伸章
× 廣嶋伸章
|
|||||||
著者名(英) |
Nobuaki, Hiroshima
× Nobuaki, Hiroshima
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 音声認識では認識辞書に含まれない単語は認識できないという、いわゆる未登録語の問題があるが、認識結果の内容に関連する語彙を獲得して認識辞書に追加することにより入力音声に適応した未登録語の少ない辞書を作成することができ、その辞書を用いて再度認識を行うことにより未登録語の影響を抑えて認識精度を改善できると考えられる。そこで本稿では、音声認識結果の内容に関連する語彙をコーパスから獲得し、獲得した語彙を辞書に追加することによって辞書を入力音声に適応させる手法を提案する。提案手法は、テキストコーパス中の語彙に対して語彙の分野を表す語彙分野ベクトルを算出しておき、入力の認識結果に対して発声内容の分野を推定し、その分野に近い語彙分野ベクトルを持つ語彙を入力に対する関連語彙として獲得し辞書に追加するという処理をオフラインで行う教師なし適応手法である。毎日新聞コーパスから各語彙の語彙分野ベクトルを求め、TVニュース音声を用いて提案手法の評価を行った。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | One of the most common problems in speech recognition system is the out-of-vocabulary (OOV) problem. Although we cannot avoid that input data includes OOV words for a vocabulary, we can reduce the number of them by adapting the vocabulary to inputs. Extracting relevant words to the content of an input speech based on a speech recognition result obtained using a reference vocabulary and adding them to the vocabulary enable to build an expanded vocabulary that includes less OOV words. The second recognition process using the new vocabulary is supposed to be performed better than the first process. In this paper, we propose vocabulary adaptation that acquires relevant words to an input from corpus and builds an expanded vocabulary by adding them to the reference vocabulary. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2004, 号 74(2004-SLP-052), p. 107-114, 発行日 2004-07-17 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |