WEKO3
アイテム
Voice Across Japanデータベース
https://ipsj.ixsq.nii.ac.jp/records/12536
https://ipsj.ixsq.nii.ac.jp/records/125369521d15f-7150-46fc-91d8-5954ce10474b
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-09-15 | |||||||
タイトル | ||||||||
タイトル | Voice Across Japanデータベース | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | The Voice Across Japan Database | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 音声言語情報処理 | |||||||
著者所属 | ||||||||
株式会社テキサスインスツルメンツ筑波研究開発センター/現在,ジャストシステム | ||||||||
著者所属 | ||||||||
株式会社テキサスインスツルメンツ筑波研究開発センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Texas Instruments Tsukuba Research and Development Center Ltd/Presently with Rresently with Justsystem | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Texas Instruments Tsukuba Research and Development Center Ltd | ||||||||
著者名 |
工藤, 育男
× 工藤, 育男
|
|||||||
著者名(英) |
Ikuo, Kudo
× Ikuo, Kudo
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 90年代に入り音声認識の研究はフィールド実験がさかんに行われるようになり 中でも 電話回線を通したアプリケーションは大規模なシステムが開発されるにいたっている. その結果として 話者の個人差により認識率に大きなちがいがあることは分かっていたが どのような原因がどの程度 認識率に影響を与えているのかは不明瞭であった. 本論文では 電話回線を通じて大規模な話者数を要する音声データベース(VAJデータベース)を構築し それにより話者の年齢や出身地が音声認識にどのような影響を与えるのかを分析するものである. まず 日本全国から電話回線を通して 8 866人の音声データを収録した. 話者の選定には性別 年齢 出身地に関してできる限り日本の人口比に近い比率でサンプリングを行った. このデータベースを用いて Hidden Markov Model(HMM)をトレーニングして 学習に用いていないデータで評価した結果 年齢が音声認識に最も強く影響を与えていることが明らかになった. 20代 30代 40代の声は比較的よく似ているが 10代 あるいは 高齢者の声とは異なることが明らかになった. また 話者の出身地(方言)の影響も 年齢ほどはないが 認識率に2%から4%程度の影響を与えていることを確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In 1990, a lot of speech recognition system have been tested in several fields. Especially, in a telephone application, some huge systems have been developed. As the result, it is known that speaker's age or growing area make influence into error rate of speech recognition system. But the cause was not so clear. Thus this paper reports the influence of speakers' age or growing area into speech recognition through development of a huge-speakers telephone speech database, called VAJ database, which is Japanese Polyphone database. It includes 8,866 speaker's speech data through all the Japan area as possible as portion of Japanese population about gender, age, or growing area. The database, also, has speakers' personal information about gender, age, growing area and so on. Such database did not exist in the world. Through some experiments, it was clear that speaker's age makes influence into speech recognition very strongly. The twenties, thirties, and forties are resemble, however, teenagers or senior age were very different. Also, speakers' growing area, that is, dialects makes 2縲鰀4% influence on speech recognition. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 40, 号 9, p. 3432-3445, 発行日 1999-09-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |