WEKO3
アイテム
テキストコーパスを用いた音声理解のための言語モデル自動獲得
https://ipsj.ixsq.nii.ac.jp/records/57895
https://ipsj.ixsq.nii.ac.jp/records/578952c0e9086-862d-4eb0-857a-6f65f249adee
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1995 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1995-12-14 | |||||||
タイトル | ||||||||
タイトル | テキストコーパスを用いた音声理解のための言語モデル自動獲得 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Language model acquisition from a text corpus for speech understanding | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
NTTヒューマンインタフェース研究所 | ||||||||
著者所属 | ||||||||
NTTヒューマンインタフェース研究所 | ||||||||
著者所属 | ||||||||
NTTヒューマンインタフェース研究所 | ||||||||
著者所属 | ||||||||
NTTヒューマンインタフェース研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Human Interface Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Human Interface Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Human Interface Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Human Interface Laboratories | ||||||||
著者名 |
松岡, 達雄
× 松岡, 達雄
|
|||||||
著者名(英) |
Tatsuo, Matsuoka
× Tatsuo, Matsuoka
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本報告では音声理解システムにおいて、音声認識結果である自然言語をシステムを駆動する意味言語に変換するための言語モデルを、コーパスから自動的に獲得する方法について述べる。音声理解の問題は自然言語から意味言語へ翻訳する問題ととらえることができる。機械翻訳の研究分野では、二カ国語が一対となった並行テキストからなるコーパスを用いて、翻訳のための言語モデルを統計的に推定する方法が提案されている。本報告ではこれを音声理解における翻訳言語モデルに適用し、スパースデータからの推定の問題を回避するため、統計的手法により文脈自由文法を生成し、有限状態オートマトンで表現された文法ネットワークの状態数を削減することにより、翻訳言語モデルの推定精度を向上する方法を提案する。米国ARPAの音声理解評価タスクである航空旅行情報システム(ir Travel Information System: ATI)を対象として評価を行い、提案法の有効性を示す。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Speech understanding can be viewed as a translation problem from natural language into semantic language. This paper describes automatic acquisition of a language model by using a text corpus, which translates natural language into semantic language for speech understanding. A stochastic method for language modeling is proposed for machine translation using a parallel text corpus. This method can be used in speech understanding, but input and output languages should be modeled concisely in order to estimate a reliable translation language model. This paper proposes a method for reducing the number of grammar rules while maintaining the original coverage. This method was shown to be effective by experiments using the ARPA ATIS task. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 1995, 号 120(1995-SLP-009), p. 93-98, 発行日 1995-12-14 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |