WEKO3
アイテム
単語を認識単位とした日本語の大語彙連続音声認識
https://ipsj.ixsq.nii.ac.jp/records/57704
https://ipsj.ixsq.nii.ac.jp/records/57704cb934c34-1fd4-4875-ad27-2571e0bac2b6
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1998 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1998-02-05 | |||||||
タイトル | ||||||||
タイトル | 単語を認識単位とした日本語の大語彙連続音声認識 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Word - based approach to large - vocabulary continuous speech recognition for Japanese | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
日本アイ・ビー・エム(株)東京基礎研究所 | ||||||||
著者所属 | ||||||||
日本アイ・ビー・エム(株)東京基礎研究所 | ||||||||
著者所属 | ||||||||
日本アイ・ビー・エム(株)東京基礎研究所 | ||||||||
著者所属 | ||||||||
日本アイ・ビー・エム(株)東京基礎研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research, Tokyo Research Laboratory, IBM Japan, Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research, Tokyo Research Laboratory, IBM Japan, Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research, Tokyo Research Laboratory, IBM Japan, Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research, Tokyo Research Laboratory, IBM Japan, Ltd. | ||||||||
著者名 |
西村, 雅史
× 西村, 雅史
|
|||||||
著者名(英) |
Masafumi, Nishimura
× Masafumi, Nishimura
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 我々は先に,日本人が感覚的に捉えている単語単位を,既存の形態素解析プログラムの出力である形態素単位との統計的対応関係から自動推定する方法を提案し,それを認識および発声の単位とする離散単語発声の日本語ディクテーションシステムを構築した.今回,この人間の考える単語単位を連続音声認識の認識単位としても利用することを試み、特に,他の大語紮連続音声認識システムで用いられる事の多い形態素単位と比較し,その有効性について調査した.また,認識単位の定義が一意に決まらない現状を踏まえて,日本語の連続音声認識システムの評価方法を提案するとともに,ついて報告する.男女各10名に対する認識実験の結果,文字誤り率 3%,単語誤り率 4.3%が得られた.さらに,句読点の自動挿入方法や,未知語モデルを使った単語 N?gramによる単語単位の自動分割方法などについても述べる. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In This paper, we discuss a word-based Japanese continuous dictation system. We have previously proposed a statistical method for segmenting a text into words on the basis of human intuition, and developed an isolated-word-based Japanese dictation system. By comparing this word unit used for the isolated word recognition with grammatical units, we show that this unit is also very useful for continuous speech recognition. Evaluation of the performance of this continuous dictation system showed that the character error rate was 3%, and that the word error rate was 43%. We also present a method for inserting punctuation marks in spoken texts automatically, and a method for segmenting Japans text into words by using an N-gram model, focusing on how to handle unknown words. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 1998, 号 12(1997-SLP-020), p. 17-24, 発行日 1998-02-05 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |