ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2005
  4. 69(2005-SLP-057)

トリガー言語モデルの適応によるパネル討論の音声認識

https://ipsj.ixsq.nii.ac.jp/records/56975
https://ipsj.ixsq.nii.ac.jp/records/56975
3de829c7-5129-4b3a-ba72-685387942820
名前 / ファイル ライセンス アクション
IPSJ-SLP05057003.pdf IPSJ-SLP05057003.pdf (296.2 kB)
Copyright (c) 2005 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2005-07-15
タイトル
タイトル トリガー言語モデルの適応によるパネル討論の音声認識
タイトル
言語 en
タイトル Automatic Transcription of Panel Discussions Using Trigger-Based Language Model Adaptation
言語
言語 eng
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
京都大学
著者所属
京都大学
著者所属(英)
en
Kyoto University
著者所属(英)
en
Kyoto University
著者名 カルロス・トロンコーソ 河原, 達也

× カルロス・トロンコーソ 河原, 達也

カルロス・トロンコーソ
河原, 達也

Search repository
著者名(英) Carlos, Troncoso Tatsuya, Kawahara

× Carlos, Troncoso Tatsuya, Kawahara

en Carlos, Troncoso
Tatsuya, Kawahara

Search repository
論文抄録
内容記述タイプ Other
内容記述 パネル討論の音声認識を対象として、トリガーモデルを用いた言語モデル適応法を提案する。パネル討論では、与えられた話題について終始話されるので、遠距離でもキーワードの相関が期待できる。トリガー言語モデルはそのような遠距離の依存関係をとらえるためのものであるが、従来は新聞記事などの一般的すぎる大規模コーパスから構築されており、タスクに依存したトリガーペアが十分に得られない。提案手法では、ベースラインモデルによる初期認識結果を使用して、当該討論に特化したトリガーペアを抽出し、またそれらの確率を推定する。確率値については、大規模コーパスから推定される統計量も利用するバックオフ手法も提案する。実験の結果、大規模コーパスから作成した通常のトリガー言語モデルと比較して、テストセットパープレキシティを約2倍削減できた。さらに、トライグラム言語モデルの適応と組合わせることにより、ベースラインよりパープレキシティを41%削減できた。
論文抄録(英)
内容記述タイプ Other
内容記述 We present a novel trigger-based language model adaptation method oriented to the transcription of meetings. In meetings, the topic is focused and consistent throughout the whole session, therefore keywords can be correlated over long distances. The trigger-based language model is designed to capture such long-distance dependencies, but it is typically constructed from a large corpus, which is usually too general to derive task-dependent trigger pairs. In the proposed method, we make use of the initial speech recognition results to extract task-dependent trigger pairs and to estimate their statistics. Moreover, we introduce a back-off scheme that also exploits the statistics estimated from a large corpus. The proposed model reduced the test-set perplexity twice as much as the typical trigger-based language model constructed from a large corpus, and achieved a remarkable perplexity reduction of 41% over the baseline when combined with an adapted trigram language model.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 情報処理学会研究報告音声言語情報処理(SLP)

巻 2005, 号 69(2005-SLP-057), p. 13-18, 発行日 2005-07-15
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-22 04:42:41.570187
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3