Item type |
SIG Technical Reports(1) |
公開日 |
2020-05-30 |
タイトル |
|
|
タイトル |
学習者間相互シャドーイングの実現に向けた音声分析条件と発音教示生成に関する実験的検討 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
一般発表 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
著者所属 |
|
|
|
東京大学大学院工学系研究科 |
著者所属 |
|
|
|
株式会社OneTerrace |
著者所属 |
|
|
|
東京大学大学院工学系研究科 |
著者所属 |
|
|
|
東京大学大学院工学系研究科 |
著者名 |
青谷, 和真
安藤, 慎太郎
井上, 雄介
齋藤, 大輔
峯松, 信明
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
学習者の発話を母語話者がシャドーイングする逆シャドーイングにより,聴取時の聞き取りやすさ (可解性) を音響的に観測することができる.この逆シャドーイングを,多言語を対象として学習者同士でシャドーしシャドーされる相互シャドーイングへと発展させることができれば,逆シャドー音声の崩れを可解性アノテーションとした大規模データ収集や,学習者へのより直感的なフィードバックが実現できる.本研究では,学習者間相互シャドーイングの実現に向けた音声分析条件と発音教示生成に関する実験的検討を行う.逆シャドー音声の崩れの計測は,逆シャドー音声と (テキストを見ながら行う) スクリプトシャドー音声とを Posteriorgram に変換して比較していたが,様々な言語への応用を考えると,Posteriorgram への変換そのものが困難となることが予想される.同一話者内での発話比較であることから,スペクトルに基づく音響量による直接比較でも十分な精度が期待できる.本研究ではまず,声道長を変化させた場合の (同一話者内) 発話比較を行った.実験結果より,MFCC や PLPCC といった音響特徴量を使用し,距離尺度としてユークリッド距離を用いた場合には,体格の違いが発話間の距離に与える影響が小さいことが示された.また,日本語と中国語を対象として実際に逆シャドーイングによる発話評価を行った実験では,学習者自身による自己評価とは異なる客観評価を示せる可能性を確認できた. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2020-SLP-132,
号 38,
p. 1-7,
発行日 2020-05-30
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |