@techreport{oai:ipsj.ixsq.nii.ac.jp:00169877, author = {塩澤, 文野 and 柏木, 陽佑 and 齋藤, 大輔 and 峯松, 信明 and Fumiya, Shiozawa and Yosuke, Kashiwagi and Daisuke, Saito and Nobuaki, Minematsu}, issue = {6}, month = {Jul}, note = {唯一の国際共通語である英語は,話者の言語的背景の違いにより,様々な訛りと共に話されている (世界諸英語).この発音多様性の可視化・地図化を目的として,話者を単位とした発音自動クラスタリングが検討されている.ここでは,二話者間の発音差異 (発音距離) を,彼らの音声試料のみから定量的に推定する技術を構築している.先行研究では,年齢・性別などの非言語的情報を抑制することを目的として,音声の構造的特徴を入力特徴量として用い,回帰モデルを用いて距離を予測する方法が提案されている.しかし構造的特徴は理想環境下では,あらゆる変換に対して不変となるため,発音の違いについても,これを無視する可能性がある.本研究では,この不変性を適切に制御することで,距離予測の精度向上を狙う.先行研究において提案された,異なるタスクにおいて検討された不変性の制御手法を本タスクに適用したところ,次元を分割し,特徴量を複数ストリーム化することによって,予測精度が改善することが示された.}, title = {世界諸英語発音分類を目的とした構造的特徴の不変性制御に関する検討}, year = {2016} }