WEKO3
アイテム
台本読みの技術向上のための入力音声の自然読み・台本読み判定手法
https://ipsj.ixsq.nii.ac.jp/records/240272
https://ipsj.ixsq.nii.ac.jp/records/240272a3c81a5c-7d34-495f-96d0-f18fcdd201e4
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2026年6月19日からダウンロード可能です。
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
非会員:¥660, IPSJ:学会員:¥330, DLIB:会員:¥0 |
Item type | Symposium(1) | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2024-06-19 | |||||||||||||
タイトル | ||||||||||||||
タイトル | 台本読みの技術向上のための入力音声の自然読み・台本読み判定手法 | |||||||||||||
言語 | ||||||||||||||
言語 | jpn | |||||||||||||
資源タイプ | ||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||
資源タイプ | conference paper | |||||||||||||
著者所属 | ||||||||||||||
神戸大学大学院工学研究科 | ||||||||||||||
著者所属 | ||||||||||||||
公立はこだて未来大学 システム情報科学部 情報アーキテクチャ学科 | ||||||||||||||
著者所属 | ||||||||||||||
神戸大学大学院工学研究科 | ||||||||||||||
著者所属 | ||||||||||||||
神戸大学大学院工学研究科 | ||||||||||||||
著者名 |
谷重, 翔生
× 谷重, 翔生
× 渡邉, 拓貴
× 寺田, 努
× 塚本, 昌彦
|
|||||||||||||
論文抄録 | ||||||||||||||
内容記述タイプ | Other | |||||||||||||
内容記述 | スピーチやプレゼンテーションでは,発表者が話す内容をまとめた原稿に沿って話を進めることがある.発表者に台本を読み上げる技術が十分に備わっていないと,聞き手は「ただ台本を音読しているだけ」だと感じ,発表が印象に残らない.そのため,発表者は台本読み上げであっても自然な会話のように発話する技術が必要である.台本読み上げの練習を複数人で行う方法では時間や場所の融通が利かず,一方で個人練習では自分の話し方が「台本読み」だと感じられる状態であるかを話し手が認識することが難しい.そのため,台本読みの個人練習において,話し方に対する聞き手の感じ方を提示することで台本読みの改善を支援できると考える.そこで本研究では,入力された音声が台本を読み上げていない自然な話し方であるか,台本を読み上げた話し方であるかを機械学習により判定しフィードバックする台本読み個人練習支援手法を提案する.本稿では,自然な話し方の音声と台本を読み上げた音声から取得したスペクトログラム画像を,既存の画像データを学習済みである深層学習モデルの一部を利用する転移学習に使用することで,入力音声が自然な話し方であるか台本の読み上げであるかの分類を行うモデルを作成した.作成したモデルの分類精度の評価を行ったところ,学習に使用した音声と同じ人および環境で収録された音声に対しては分類精度が高かったのに対し,異なる話者の音声に対する分類精度が低い結果となった. | |||||||||||||
書誌情報 |
マルチメディア,分散,協調とモバイルシンポジウム2024論文集 巻 2024, p. 1155-1164, 発行日 2024-06-19 |
|||||||||||||
出版者 | ||||||||||||||
言語 | ja | |||||||||||||
出版者 | 情報処理学会 |