WEKO3
アイテム
話者の心の状態遷移モデルに基づく対話音声認識
https://ipsj.ixsq.nii.ac.jp/records/57448
https://ipsj.ixsq.nii.ac.jp/records/5744874ed846d-fe02-40aa-b10c-555ca2dc9a2c
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2001 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2001-02-02 | |||||||
タイトル | ||||||||
タイトル | 話者の心の状態遷移モデルに基づく対話音声認識 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Speech Recognition in Spoken Dialogue Based on State Transition Model of Speaker's Mind | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京理科大学基礎工学部 | ||||||||
著者所属 | ||||||||
東京理科大学基礎工学部 | ||||||||
著者所属 | ||||||||
東京理科大学基礎工学部 | ||||||||
著者所属 | ||||||||
東京理科大学基礎工学部 | ||||||||
著者所属 | ||||||||
東京理科大学基礎工学部 | ||||||||
著者所属 | ||||||||
東京工科大学工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Science University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Science University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Science University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Science University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Science University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo University of Technology | ||||||||
著者名 |
藤崎, 博也
× 藤崎, 博也
|
|||||||
著者名(英) |
Hiroya, Fujisaki
× Hiroya, Fujisaki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 音声認識において話題や話者の内部状態に適応した言語モデルを用いる場合、生起し得る単語列の候補数が減少するため、認識率は高くなることが予想される。このような観点から、筆者らは、一般的なコーパスから作成した平均的な言語モデルを用いた場合を基準とし、話題を"学術情報検索"に限定した場合のユーザの発話の言語モデル、および、ユーザの内部状態に適応した言語モデルの採用による認識率の改善の効果を実験により検証した。その結果、平均的な言語モデルよりも、話題に適応し、さらに状態に適応した言語モデルの採用が最も効果的であることを確認した。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The performance of a speech recognition/understanding system is expected to be higher if the language model can be adapted to the current topic of the utterance. It is expected to be still higher if the model can be adapted to the current sated of the mind of the speaker. From this point of view, the present study examines the merits of these adapted language models over a language model obtained from a general corpus, by restricting the topic to "academic information retrieval" and by adopting a representation of the speaker's mind in terms of a probabilistic finite-state automaton. The experimental results confirmed the advantages of these models in quantitative terms. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2001, 号 11(2000-SLP-035), p. 79-84, 発行日 2001-02-02 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |