WEKO3
アイテム
ウェブデータベースを用いた音声認識用言語モデルの簡易適応
https://ipsj.ixsq.nii.ac.jp/records/109712
https://ipsj.ixsq.nii.ac.jp/records/1097124ad25979-b5a6-4488-9792-def611a340cd
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | National Convention(1) | |||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2012-03-06 | |||||||||||||||
タイトル | ||||||||||||||||
タイトル | ウェブデータベースを用いた音声認識用言語モデルの簡易適応 | |||||||||||||||
言語 | ||||||||||||||||
言語 | jpn | |||||||||||||||
キーワード | ||||||||||||||||
主題Scheme | Other | |||||||||||||||
主題 | 人工知能と認知科学 | |||||||||||||||
資源タイプ | ||||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||||
資源タイプ | conference paper | |||||||||||||||
著者所属 | ||||||||||||||||
和歌山大 | ||||||||||||||||
著者所属 | ||||||||||||||||
和歌山大 | ||||||||||||||||
著者所属 | ||||||||||||||||
和歌山大 | ||||||||||||||||
著者所属 | ||||||||||||||||
和歌山大 | ||||||||||||||||
著者所属 | ||||||||||||||||
和歌山大 | ||||||||||||||||
著者名 |
西村竜一
× 西村竜一
× 島田敏明
× 田中雅康
× 河原英紀
× 入野俊夫
|
|||||||||||||||
論文抄録 | ||||||||||||||||
内容記述タイプ | Other | |||||||||||||||
内容記述 | 我々は、大語彙連続音声認識の精度向上の為、ウェブデータベースを用いた3-gram言語モデルの拡張手法を検討している。本手法は、Googleの日本語N-gramデータベースの登録情報に基づき、学習用コーパス内では未観測であった3-gramの出現確率を推定する。また、本手法では情報量を基準として重要単語を抽出し、拡張する3-gramを選別する。昨年の報告に引き続き、提案法を言語モデルのタスク適応に応用した。実験では、日本語話し言葉コーパス(CSJ)から抽出した講演発話を対象に本手法を適用し、認識精度を評価した。また、提案法を実装したウェブアプリサービスを構築する予定なので、その概要を報告する。 | |||||||||||||||
書誌レコードID | ||||||||||||||||
収録物識別子タイプ | NCID | |||||||||||||||
収録物識別子 | AN00349328 | |||||||||||||||
書誌情報 |
第74回全国大会講演論文集 巻 2012, 号 1, p. 5-6, 発行日 2012-03-06 |
|||||||||||||||
出版者 | ||||||||||||||||
言語 | ja | |||||||||||||||
出版者 | 情報処理学会 |