WEKO3
アイテム
台本読みの技術向上のためのスピーチ練習音声の自然発話・台本読み発話判定手法
https://ipsj.ixsq.nii.ac.jp/records/2003931
https://ipsj.ixsq.nii.ac.jp/records/2003931eadd1994-8304-4c1d-9199-788d4b406d8c
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
2027年9月10日からダウンロード可能です。
|
Copyright (c) 2025 by the Information Processing Society of Japan
|
|
| 非会員:¥660, IPSJ:学会員:¥330, UBI:会員:¥0, DLIB:会員:¥0 | ||
| Item type | SIG Technical Reports(1) | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2025-09-10 | |||||||||||||
| タイトル | ||||||||||||||
| 言語 | ja | |||||||||||||
| タイトル | 台本読みの技術向上のためのスピーチ練習音声の自然発話・台本読み発話判定手法 | |||||||||||||
| 言語 | ||||||||||||||
| 言語 | jpn | |||||||||||||
| キーワード | ||||||||||||||
| 主題Scheme | Other | |||||||||||||
| 主題 | UBI | |||||||||||||
| 資源タイプ | ||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||||
| 資源タイプ | technical report | |||||||||||||
| 著者所属 | ||||||||||||||
| 神戸大学大学院工学研究科 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 公立はこだて未来大学システム情報科学部情報アーキテクチャ学科 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 神戸大学大学院工学研究科 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 神戸大学大学院工学研究科 | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| Graduate School of Engineering, Kobe University | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| School of Systems Information Science, Department of Media Architecture, Future University Hakodate | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| Graduate School of Engineering, Kobe University | ||||||||||||||
| 著者所属(英) | ||||||||||||||
| en | ||||||||||||||
| Graduate School of Engineering, Kobe University | ||||||||||||||
| 著者名 |
谷重,翔生
× 谷重,翔生
× 渡邉,拓貴
× 寺田,努
× 塚本,昌彦
|
|||||||||||||
| 論文抄録 | ||||||||||||||
| 内容記述タイプ | Other | |||||||||||||
| 内容記述 | スピーチやプレゼンテーションでは,発表者が話す内容をまとめた原稿に沿って話を進めることがある.発表者に台本を読み上げる技術が十分に備わっていないと,聞き手は「ただ台本を音読しているだけ」だと感じ,発表が印象に残らない.そのため,発表者は台本読み上げであっても自然な会話のように発話する技術が必要である.台本読み上げの個人練習では,自分の話し方が「台本読み」だと感じられる状態であるかを話し手が認識することが難しいため,話し方に対する聞き手の感じ方を提示することで台本読みの改善を支援できると考える.そこで本研究では,入力された音声が台本を読み上げていない自然な話し方であるか,台本を読み上げた話し方であるかを判定しフィードバックする台本読み上げの個人練習支援手法を提案する.本論文では,自然な話し方の音声と台本を読み上げた音声から取得したスペクトログラム画像を学習データとした深層学習によって,入力音声が自然な話し方であるか台本の読み上げであるかの分類を行うモデルを作成した.訓練データとテストデータを変えながら分類精度の評価実験を実施したところ,正解率が最高で97.5%,最低で66.0%,平均で79.7%となり,高い精度が得られる場合もあるが使用するデータによって精度に大きく差が出た.これに対し,AIボイスチェンジャーを用いて発話音声の声質を統一することで,声質が分類に与える影響を低減し分類精度を改善できるか評価したところ,正解率が最高で80.0%,最低で73.8%,平均で77.5%となり,使用データによる精度のばらつきを低減できた. | |||||||||||||
| 書誌レコードID | ||||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||||
| 収録物識別子 | AA11838947 | |||||||||||||
| 書誌情報 |
研究報告ユビキタスコンピューティングシステム(UBI) 巻 2025-UBI-87, 号 32, p. 1-8, 発行日 2025-09-10 |
|||||||||||||
| ISSN | ||||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||||
| 収録物識別子 | 2188-8698 | |||||||||||||
| Notice | ||||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||||
| 出版者 | ||||||||||||||
| 言語 | ja | |||||||||||||
| 出版者 | 情報処理学会 | |||||||||||||