2024-03-29T17:55:00Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001073572024-03-29T05:26:34Z01164:05159:07427:07760
発音クラスタリングを目的とした基準発音距離の定義と発音距離予測に用いる音響特徴量の実験的検討An experimental study of definitions of reference pronunciation distances and acoustic features used for distance prediction with the aim of pronunciation clusteringjpn音声対話・分析http://id.nii.ac.jp/1001/00107333/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=107357&item_no=1&attribute_id=1&file_no=1Copyright (c) 2014 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.東京大学清華大学東京大学東京大学東京大学笠原, 駿史, 天澤峯松, 信明齋藤, 大輔広瀬, 啓吉国際語となった英語について,「英語利用者が従うべき標準的な英語を設けるのではなく,英語が多様化した現状を受け入れる」 世界諸英語という考えがある.本研究はこの考え方に基づき,個人を単位とした英語発音分類を行い,話者本人の英語発音が世界諸英語の中でどのように位置づけられるかを提示することを目的としている.そのために本研究では,二話者間の英語発音の “距離” を,入力音声のみから予測することを試みている.本稿では初めに,自動予測の対象として用いた IPA 書き起しに基づく発音距離が,発音分類において凡そ適した距離となっていることを示す.次に,発音距離を予測する実験では,話者間で対応する音素 HMM の差異を直接とる絶対的特徴を導入している.更に,粒度の高い絶対的特徴である HMM スーパーベクトルを用いたところ単体でも高い予測を行うことができ,従来用いていた構造特徴についても粒度を上げることでさらに有用な特徴となり得ることが示唆された."World Englishes" indicates well one aspect of the current state of English as an international language, which claims that there is no need to standardize the language of English and we have to accept its diversity. The purpose of this study is to propose a technique to realize individual-basis pronunciation clustering in order to inform each user of how his/her pronunciation is located in the diversity of World Englishes pronunciations. In this paper, we tried to predict inter-speaker pronunciation distances only from their speech signals. At first, some experiments were conducted to investigate how suitable the proposed definition of pronunciation distances is for World Englishes clustering. Next, for automatic prediction of distances, we introduced absolute features which are derived by direct comparison between corresponding phoneme HMMs of a speaker pair. By increasing temporal and spectral resolutions, HMM-supervector was derived as one kind of the absolute features. Experiments showed that these features were very effective for prediction and we can expect that the structural features, which we proposed in our previous studies, will bring a much better performance by increasing their resolutions.AN10442647研究報告音声言語情報処理(SLP)2014-SLP-10410162014-12-082014-12-02