| Item type |
SIG Technical Reports(1) |
| 公開日 |
2016-07-21 |
| タイトル |
|
|
タイトル |
世界諸英語発音分類を目的とした構造的特徴の不変性制御に関する検討 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
A study of controlling the degree of invariant properties of structural features for World Englishes clustering |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
教育・福祉 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
東京大学大学院工系研究科 |
| 著者所属 |
|
|
|
東京大学大学院工系研究科/現在,ソニー株式会社 |
| 著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
| 著者所属 |
|
|
|
東京大学大学院工系研究科 |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Engineering, The University of Tokyo |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Engineering, The University of Tokyo / |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Engineering, The University of Tokyo |
| 著者名 |
塩澤, 文野
柏木, 陽佑
齋藤, 大輔
峯松, 信明
|
| 著者名(英) |
Fumiya, Shiozawa
Yosuke, Kashiwagi
Daisuke, Saito
Nobuaki, Minematsu
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
唯一の国際共通語である英語は,話者の言語的背景の違いにより,様々な訛りと共に話されている (世界諸英語).この発音多様性の可視化・地図化を目的として,話者を単位とした発音自動クラスタリングが検討されている.ここでは,二話者間の発音差異 (発音距離) を,彼らの音声試料のみから定量的に推定する技術を構築している.先行研究では,年齢・性別などの非言語的情報を抑制することを目的として,音声の構造的特徴を入力特徴量として用い,回帰モデルを用いて距離を予測する方法が提案されている.しかし構造的特徴は理想環境下では,あらゆる変換に対して不変となるため,発音の違いについても,これを無視する可能性がある.本研究では,この不変性を適切に制御することで,距離予測の精度向上を狙う.先行研究において提案された,異なるタスクにおいて検討された不変性の制御手法を本タスクに適用したところ,次元を分割し,特徴量を複数ストリーム化することによって,予測精度が改善することが示された. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
| 書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2016-SLP-112,
号 6,
p. 1-6,
発行日 2016-07-21
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |