WEKO3
アイテム
端点検出を行わない連続音声認識手法
https://ipsj.ixsq.nii.ac.jp/records/57467
https://ipsj.ixsq.nii.ac.jp/records/5746764a04d46-85ad-4c3d-a1f3-c3c83bbb7258
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2000-12-21 | |||||||
タイトル | ||||||||
タイトル | 端点検出を行わない連続音声認識手法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Continuous Speech Recognition without End - point Detection | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
名古屋大学大学院工学研究科/中部電力株式会社電力技術研究所 | ||||||||
著者所属 | ||||||||
名古屋大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
名古屋大学情報メディア教育センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Nagoya University/Chubu Electric Power Co., Inc. Electric Power R&D Center | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Nagoya University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Center for Information Media Studies, Nagoya University | ||||||||
著者名 |
瀬川, 修
武田, 一哉
板倉, 文忠
× 瀬川, 修 武田, 一哉 板倉, 文忠
|
|||||||
著者名(英) |
Osamu, Segawa
Kazuya, Takeda
Fumitada, Itakura
× Osamu, Segawa Kazuya, Takeda Fumitada, Itakura
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 入力音声の明示的な端点検出を必要としない新しい連続音声認識手法を提案する。本手法では数秒程度の一定時間長の処理ブロックを認識すると同時に終端で途切れた単語区間をバックトラックによって修復しながら連続的にデコードを続けるため、端点検出や発話単位の考慮無しに無限長の人力音声を認識することが可能である。基本的なアルゴリズムは次のとおりである。1)一定時間長の処理ブロックの認識を行う。2)処理ブロックの終端フレームに残った全ての単語終端ノードよりトレースバックによって一つの最尤パスにマージするフレームを探し、これを最適な単語境界フレームとする。3)単語境界フレームまで戻ってサーチを再開する。本稿ではまずアルゴリズムの詳細を説明し、提案手法の有効性を検証するために行った約10分の連続した新聞読み上げ音声および男女各1名による約30分の車内音声対話の自動書き起こし実験の結果を示す。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A new continuous speech recognition method that does not need the explicit speech end-point detection is proposed. In this method, the decoder proceeds to recognize a processing block of a predetermined length and then to fix a word section which is broken at the end of a processing block. Therefore, continuous speech recognition of infinite length can be executed without the explicit end-point detection and without considering an utterance unit. The basic algorithm is 1) decode a processing block of the predetermined length, 2) traceback and find the boundaries of the processing blocks where the word history in the preceding processing block is merged into one, and 3) restart decoding from the boundary frame with the merged word history. The effectiveness of the method is verified by the two dictating experiments. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2000, 号 119(2000-SLP-034), p. 101-106, 発行日 2000-12-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |