ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 1999
  4. 108(1999-SLP-029)

ニュース音声認識のための(n≧4)- gramを併用する言語モデル

https://ipsj.ixsq.nii.ac.jp/records/57577
https://ipsj.ixsq.nii.ac.jp/records/57577
dcfba621-7d00-48d5-b5fa-b1470b4b7717
名前 / ファイル ライセンス アクション
IPSJ-SLP99029032.pdf IPSJ-SLP99029032.pdf (513.2 kB)
Copyright (c) 1999 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 1999-12-20
タイトル
タイトル ニュース音声認識のための(n≧4)- gramを併用する言語モデル
タイトル
言語 en
タイトル A New Language Model by using (n≧4) - gram for Broadcast News Speech Transcription
言語
言語 jpn
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
NHK放送技術研究所
著者所属
ATR音声翻訳通信研究所
著者所属
NHK放送技術研究所
著者所属
NHK放送技術研究所
著者所属(英)
en
NHK Science and Technical Research Laboratories
著者所属(英)
en
ATR Interpreting Telecommunications Research Laboratories
著者所属(英)
en
NHK Science and Technical Research Laboratories
著者所属(英)
en
NHK Science and Technical Research Laboratories
著者名 加藤, 直人 浦谷則好 江原暉将 安藤, 彰男

× 加藤, 直人 浦谷則好 江原暉将 安藤, 彰男

加藤, 直人
浦谷則好
江原暉将
安藤, 彰男

Search repository
著者名(英) Naoto, Katoh Noriyoshi, Uratani Terumasa, Ehara Akio, Ando

× Naoto, Katoh Noriyoshi, Uratani Terumasa, Ehara Akio, Ando

en Naoto, Katoh
Noriyoshi, Uratani
Terumasa, Ehara
Akio, Ando

Search repository
論文抄録
内容記述タイプ Other
内容記述 音声認識の精度向上には言語制約が強い言語モデルを構成すること必要であり,その一つの方法がタスク適応である.一方で,タスク適応しすぎると頑健性が損なわれるという問題がある.本稿では(n≧4)?gramを利用することによりタスクへの適応をしつつ,2 3-gramも利用することで頑健性もそれほど損なわない言語モデルについて述べる.提案する言語モデルでは(n≧4)-gramを,従来のn-gramのように宣言的知識として記憶するのではなく,単語出現位置辞書という概念を導入して手続き的知識として記憶することによりそれほどデータ量を増やすことなく利用している.本言語モデルを放送ニュースに応用し,そのperplexityによる評価実験を行ったところ,良好な結果を得た.
論文抄録(英)
内容記述タイプ Other
内容記述 Language model adaptation is one of the important methods to construct a speech recognition system for practical use. The conventional adaptation methods adjusted n-gram estimated from various task corpora to ones from a specific task corpus. However the methods are not so effective in some tasks such as TV news, because some of TV news does not use news scripts. This paper proposes a new language model for Broadcast news speech transcription. Our model can not only adapt to a specific task but also deal with the more tasks by dynamically using (n≧4)-gram and 2,3-gram. The proposed method can reduce amount of (n≧4)-gram data by registering it as procedural knowledge through WPD (Word Position Data). The WPD represents each position of words in a task corpus and is automatically composed of the corpus. We conducted a serirs of experiments to evaluate our model and obtained a good result.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 情報処理学会研究報告音声言語情報処理(SLP)

巻 1999, 号 108(1999-SLP-029), p. 187-192, 発行日 1999-12-20
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-22 04:26:57.443460
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3