@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00232295, author = {吉村, 有弘 and 幡手, 千華 and 浅井, 紀久夫 and Arihiro, YOSHIMURA and Chika, HATADE and Kikuo, ASAI}, book = {第64回プログラミング・シンポジウム予稿集}, month = {Jan}, note = {音声合成(Text-to-Speech,TTS)では Speech Rate とポーズを設定し発話を合成できる.その利用は今後広がっていくと思われる.意図的にポーズが取られた発話の速度を分析する際,従来のようにポーズを含む条件で発話速度を導出する必要があるのだろうか.また,複数の長い音声ファイルの発話速度を導出するために,音声分析ソフトで発話区間とポーズを手動で見極めるのは時間を要する.そこで本発表では,librosa で 15~20dB の音圧レベルでポーズを統制して発話速度を導出する方法を考察した.その結果, 多くの交替潜時を 0.2 秒未満に統制することができたが,短くカットされる発話があった.しかし,簡易に発話速度・対話速度を導出することができるのを確認した.}, pages = {17--19}, publisher = {情報処理学会}, title = {ポーズ統制と発話速度・対話速度の導出}, volume = {2023}, year = {2023} }