WEKO3
アイテム
外部知識としてウェブを用いた3-gram言語モデル拡張手法の検討
https://ipsj.ixsq.nii.ac.jp/records/108459
https://ipsj.ixsq.nii.ac.jp/records/108459d42e976b-99f4-45b3-92cb-cb88524bb909
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | National Convention(1) | |||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2011-03-02 | |||||||||||||||
タイトル | ||||||||||||||||
タイトル | 外部知識としてウェブを用いた3-gram言語モデル拡張手法の検討 | |||||||||||||||
言語 | ||||||||||||||||
言語 | jpn | |||||||||||||||
キーワード | ||||||||||||||||
主題Scheme | Other | |||||||||||||||
主題 | 人工知能と認知科学 | |||||||||||||||
資源タイプ | ||||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||||
資源タイプ | conference paper | |||||||||||||||
著者所属 | ||||||||||||||||
和歌山大 | ||||||||||||||||
著者所属 | ||||||||||||||||
和歌山大 | ||||||||||||||||
著者所属 | ||||||||||||||||
和歌山大 | ||||||||||||||||
著者所属 | ||||||||||||||||
和歌山大 | ||||||||||||||||
著者所属 | ||||||||||||||||
和歌山大 | ||||||||||||||||
著者名 |
西村竜一
× 西村竜一
× 島田敏明
× 田中雅康
× 河原英紀
× 入野俊夫
|
|||||||||||||||
論文抄録 | ||||||||||||||||
内容記述タイプ | Other | |||||||||||||||
内容記述 | 大語彙連続音声認識の精度向上の為、ウェブを用いた3-gram言語モデルの拡張手法に関して報告する。3-gramモデルにおいて、学習コーパスに存在しない未観測3-gramの確率値を推定する手法として、バックオフが従来から用いられている。内包的な確率推定手法であるバックオフが広く普及する一方、本研究のように、外部のデータベースを用いた未観測3-gramの確率推定の手法も存在する。本発表では、外部データベースとしてGoogleデータベースを用いた場合の未観測3-gram確率推定法に関して、従来のバックオフ手法との比較を中心に報告する。 | |||||||||||||||
書誌レコードID | ||||||||||||||||
収録物識別子タイプ | NCID | |||||||||||||||
収録物識別子 | AN00349328 | |||||||||||||||
書誌情報 |
第73回全国大会講演論文集 巻 2011, 号 1, p. 75-76, 発行日 2011-03-02 |
|||||||||||||||
出版者 | ||||||||||||||||
言語 | ja | |||||||||||||||
出版者 | 情報処理学会 |