Item type |
SIG Technical Reports(1) |
公開日 |
2014-12-08 |
タイトル |
|
|
タイトル |
発音クラスタリングを目的とした基準発音距離の定義と発音距離予測に用いる音響特徴量の実験的検討 |
タイトル |
|
|
言語 |
en |
|
タイトル |
An experimental study of definitions of reference pronunciation distances and acoustic features used for distance prediction with the aim of pronunciation clustering |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
音声対話・分析 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
東京大学 |
著者所属 |
|
|
|
清華大学 |
著者所属 |
|
|
|
東京大学 |
著者所属 |
|
|
|
東京大学 |
著者所属 |
|
|
|
東京大学 |
著者所属(英) |
|
|
|
en |
|
|
The university of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Tsinghua University |
著者所属(英) |
|
|
|
en |
|
|
The university of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
The university of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
The university of Tokyo |
著者名 |
笠原, 駿
史, 天澤
峯松, 信明
齋藤, 大輔
広瀬, 啓吉
|
著者名(英) |
Shun, Kasahara
Tianze, Shi
Nobuaki, Minematsu
Daisuke, Saito
Keikichi, Hirose
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
国際語となった英語について,「英語利用者が従うべき標準的な英語を設けるのではなく,英語が多様化した現状を受け入れる」 世界諸英語という考えがある.本研究はこの考え方に基づき,個人を単位とした英語発音分類を行い,話者本人の英語発音が世界諸英語の中でどのように位置づけられるかを提示することを目的としている.そのために本研究では,二話者間の英語発音の “距離” を,入力音声のみから予測することを試みている.本稿では初めに,自動予測の対象として用いた IPA 書き起しに基づく発音距離が,発音分類において凡そ適した距離となっていることを示す.次に,発音距離を予測する実験では,話者間で対応する音素 HMM の差異を直接とる絶対的特徴を導入している.更に,粒度の高い絶対的特徴である HMM スーパーベクトルを用いたところ単体でも高い予測を行うことができ,従来用いていた構造特徴についても粒度を上げることでさらに有用な特徴となり得ることが示唆された. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
"World Englishes" indicates well one aspect of the current state of English as an international language, which claims that there is no need to standardize the language of English and we have to accept its diversity. The purpose of this study is to propose a technique to realize individual-basis pronunciation clustering in order to inform each user of how his/her pronunciation is located in the diversity of World Englishes pronunciations. In this paper, we tried to predict inter-speaker pronunciation distances only from their speech signals. At first, some experiments were conducted to investigate how suitable the proposed definition of pronunciation distances is for World Englishes clustering. Next, for automatic prediction of distances, we introduced absolute features which are derived by direct comparison between corresponding phoneme HMMs of a speaker pair. By increasing temporal and spectral resolutions, HMM-supervector was derived as one kind of the absolute features. Experiments showed that these features were very effective for prediction and we can expect that the structural features, which we proposed in our previous studies, will bring a much better performance by increasing their resolutions. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2014-SLP-104,
号 10,
p. 1-6,
発行日 2014-12-08
|
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |