2024-03-29T10:02:11Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000676382023-04-27T10:00:04Z01164:05159:06009:06012
TTS to Provide Audio Descriptions of Internet Videos音声合成を用いたインターネット動画用音声ガイドengマルチメディア,マルチモーダルhttp://id.nii.ac.jp/1001/00067638/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=67638&item_no=1&attribute_id=1&file_no=1Copyright (c) 2010 by the Information Processing Society of Japan日本IBM東京基礎研究所日本IBM東京基礎研究所日本IBM東京基礎研究所日本IBM東京基礎研究所立花, 隆輝長野, 徹高木, 啓伸西村, 雅史筆者らは、音声合成 (TTS) を用いてインターネット動画用の音声ガイド (AD) を作成・流通しやすくする枠組みを開発している。AD を TTS でどのように作成すればどれほど有用になるのかまだ明らかではなかった。AD 作成において、音声合成ならではの新しい表現方法、映画など感情表現を伴う動画での有用性、感情音声合成の効果なども興味深い疑問点である。本論文では、これらの疑問点に関してTTSを用いた AD の予備実験の結果を紹介する。そこでは、特にドラマに対して高品質な TTS の有効性が示唆された。そして、まもなく実施予定の本実験に向け準備中の感情音声合成についても実験結果を紹介する。TTS を利用することによって AD 作成の負担が軽減され、無数のボランティアが作成した多数の AD が利用可能になることが期待される。We are developing a collaborative Web accessibility framework that facilitates the authoring and sharing of Audio Descriptions (AD) for Internet videos by using a Text-To-Speech (TTS) engine. The crucial aspects of TTS-generated ADs and their utility are still unknown. It is natural that two-hour romantic movies would require higher quality for TTS-generated ADs than are needed for short e-learning videos. In this paper, we introduce the results of preliminary experiments of TTS-generated ADs for two video genres. The results suggest that an AD generated with a high quality TTS system is feasible for dramas. We also present experimental results for expressive TTS systems. We believe that TTS-generated ADs reduce the authoring costs and will allow for widespread sharing of ADs created by large numbers of volunteers.AN10442647研究報告音声言語情報処理(SLP)2010-SLP-801162010-02-052010-01-28