WEKO3
アイテム
話し言葉音声認識の概観
https://ipsj.ixsq.nii.ac.jp/records/57470
https://ipsj.ixsq.nii.ac.jp/records/57470852b0e37-6296-4ba4-8639-228aca086915
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2000-12-21 | |||||||
| タイトル | ||||||||
| タイトル | 話し言葉音声認識の概観 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Toward Spontaneous and Conversational Speech Recognition | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 京都大学情報学研究科 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| School of Informatics, Kyoto University | ||||||||
| 著者名 |
河原, 達也
× 河原, 達也
|
|||||||
| 著者名(英) |
Tatsuya, Kawahara
× Tatsuya, Kawahara
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 読上げ音声の認識は数万語彙でもかなりの認識精度を達成しているのに対して、自然な話し言葉の音声については、タスクドメインを限定した場合でないと十分な性能が得られていないのが現状である。本稿では、話し言葉音声認識の困難さについて分析を行った上で、音響モデル・発音モデル・言語モデルなどのアプローチについて概観する。 | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | While large vocabulary continuous speech recognition systems achieve high accuracy in read speech as in dictation systems, recognition performance on the spontaneous and conversational speech is still poor unless the task domain is limited. In this review, the problems and approaches in acoustic, pronunciation and language models are addressed. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10442647 | |||||||
| 書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2000, 号 119(2000-SLP-034), p. 119-123, 発行日 2000-12-21 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||