台本読みの技術向上のための入力音声の自然読み・台本読み判定手法

谷重, 翔生; 渡邉, 拓貴; 寺田, 努; 塚本, 昌彦

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

台本読みの技術向上のための入力音声の自然読み・台本読み判定手法

https://ipsj.ixsq.nii.ac.jp/records/240272

名前 / ファイル	ライセンス	アクション
IPSJ-DICOMO2024156.pdf (7.3 MB)	Copyright (c) 2024 by the Information Processing Society of Japan
オープンアクセス

Item type

Symposium(1)

公開日

2024-06-19

タイトル

台本読みの技術向上のための入力音声の自然読み・台本読み判定手法

言語

jpn

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_5794

資源タイプ

conference paper

著者所属

神戸大学大学院工学研究科

著者所属

公立はこだて未来大学システム情報科学部情報アーキテクチャ学科

著者所属

神戸大学大学院工学研究科

著者所属

神戸大学大学院工学研究科

著者名

谷重, 翔生
渡邉, 拓貴
寺田, 努
塚本, 昌彦

論文抄録

内容記述タイプ

Other

内容記述

スピーチやプレゼンテーションでは，発表者が話す内容をまとめた原稿に沿って話を進めることがある．発表者に台本を読み上げる技術が十分に備わっていないと，聞き手は「ただ台本を音読しているだけ」だと感じ，発表が印象に残らない．そのため，発表者は台本読み上げであっても自然な会話のように発話する技術が必要である．台本読み上げの練習を複数人で行う方法では時間や場所の融通が利かず，一方で個人練習では自分の話し方が「台本読み」だと感じられる状態であるかを話し手が認識することが難しい．そのため，台本読みの個人練習において，話し方に対する聞き手の感じ方を提示することで台本読みの改善を支援できると考える．そこで本研究では，入力された音声が台本を読み上げていない自然な話し方であるか，台本を読み上げた話し方であるかを機械学習により判定しフィードバックする台本読み個人練習支援手法を提案する．本稿では，自然な話し方の音声と台本を読み上げた音声から取得したスペクトログラム画像を，既存の画像データを学習済みである深層学習モデルの一部を利用する転移学習に使用することで，入力音声が自然な話し方であるか台本の読み上げであるかの分類を行うモデルを作成した．作成したモデルの分類精度の評価を行ったところ，学習に使用した音声と同じ人および環境で収録された音声に対しては分類精度が高かったのに対し，異なる話者の音声に対する分類精度が低い結果となった．

書誌情報

マルチメディア，分散，協調とモバイルシンポジウム2024論文集

巻 2024, p. 1155-1164, 発行日 2024-06-19

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-19 08:01:46.627208

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

台本読みの技術向上のための入力音声の自然読み・台本読み判定手法

× 谷重, 翔生

× 渡邉, 拓貴

× 寺田, 努

× 塚本, 昌彦

Versions

Share

Cite as

エクスポート