ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2004
  4. 131(2004-SLP-054)

異種コーパスの組合せによるトリガー言語モデルの構築

https://ipsj.ixsq.nii.ac.jp/records/57056
https://ipsj.ixsq.nii.ac.jp/records/57056
441e0908-5e38-4ea6-abb9-c707831d8db5
名前 / ファイル ライセンス アクション
IPSJ-SLP04054020.pdf IPSJ-SLP04054020.pdf (713.5 kB)
Copyright (c) 2004 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2004-12-21
タイトル
タイトル 異種コーパスの組合せによるトリガー言語モデルの構築
タイトル
言語 en
タイトル Trigger - Based Language Model Construction by Combining Different Corpora
言語
言語 eng
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
京都大学情報学研究科
著者所属
京都大学情報学研究科
著者所属
ATR音声言語コミュニケーション研究所
著者所属
ATR音声言語コミュニケーション研究所
著者所属(英)
en
School of Informatics, Kyoto University
著者所属(英)
en
School of Informatics, Kyoto University
著者所属(英)
en
Spoken Language Translation Research Laboratories, ATR
著者所属(英)
en
Spoken Language Translation Research Laboratories, ATR
著者名 カルロストロンコーソ 河原, 達也 山本, 博史 菊井, 玄一郎

× カルロストロンコーソ 河原, 達也 山本, 博史 菊井, 玄一郎

カルロストロンコーソ
河原, 達也
山本, 博史
菊井, 玄一郎

Search repository
著者名(英) Carlos, Troncoso Tatsuya, Kawahara Hirofumi, Yamamoto Genichiro, Kikui

× Carlos, Troncoso Tatsuya, Kawahara Hirofumi, Yamamoto Genichiro, Kikui

en Carlos, Troncoso
Tatsuya, Kawahara
Hirofumi, Yamamoto
Genichiro, Kikui

Search repository
論文抄録
内容記述タイプ Other
内容記述 大語彙連続音声認識において,n-gramモデルより長距離の単語共起をモデル化するトリガー言語モデルについて検討する.一般に言語モデルの構築においては,タスクにマッチした学習コーパスのサイズは小さいため,統計量の学習が十分に行えず,逆に,大規模なコーパスでは一般的過ぎて,タスク依存性がなくなるという問題がある.本研究では,タスクにマッチしたコーパスからトリガーペアを抽出し,大規模なテキストコーパスからトリガーペアの生起確率を推定するアプローチを提案する.ATRの旅行会話コーパス(BTEC),及び日本語話し言葉コーパス(CSJ)の模擬講演において評価を行った結果を報告する.
論文抄録(英)
内容記述タイプ Other
内容記述 We study the trigger-based language model (LM) for large vocabulary continuous speech recognition (LVCSR), which can model dependencies between words longer than those modeled by the n-gram LM. In general, in language modeling for LVCSR, when the training corpus matches the target task, its size is typically small, and therefore insufficient for providing us with reliable probability estimates. On the other hand, large corpora are often too general to capture task dependency. The proposed approach tries to overcome this generality-sparseness trade-off problem by constructing a trigger-based LM in which task-dependent trigger pairs are first extracted from the corpus that matches the task, and then the occurrence probabilities of the pairs are estimated from a huge text corpus. We report evaluation results in ATR's Basic Travel Expression Corpus (BTEC) as well as in the Corpus of Spontaneous Japanese(CSJ).
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 情報処理学会研究報告音声言語情報処理(SLP)

巻 2004, 号 131(2004-SLP-054), p. 115-120, 発行日 2004-12-21
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-22 04:40:18.430137
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3