WEKO3
アイテム
音声合成を用いたインターネット動画用音声ガイド
https://ipsj.ixsq.nii.ac.jp/records/67638
https://ipsj.ixsq.nii.ac.jp/records/67638afd12a15-cf9d-431a-86f4-95eabb37f6c0
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2010-02-05 | |||||||
| タイトル | ||||||||
| タイトル | 音声合成を用いたインターネット動画用音声ガイド | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | TTS to Provide Audio Descriptions of Internet Videos | |||||||
| 言語 | ||||||||
| 言語 | eng | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | マルチメディア,マルチモーダル | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 日本IBM東京基礎研究所 | ||||||||
| 著者所属 | ||||||||
| 日本IBM東京基礎研究所 | ||||||||
| 著者所属 | ||||||||
| 日本IBM東京基礎研究所 | ||||||||
| 著者所属 | ||||||||
| 日本IBM東京基礎研究所 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| IBM Research - Tokyo | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| IBM Research - Tokyo | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| IBM Research - Tokyo | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| IBM Research - Tokyo | ||||||||
| 著者名 |
立花, 隆輝
長野, 徹
高木, 啓伸
西村, 雅史
× 立花, 隆輝 長野, 徹 高木, 啓伸 西村, 雅史
|
|||||||
| 著者名(英) |
Ryuki, Tachibana
Tohru, Nagano
Hironobu, Takagi
Masafumi, Nishimura
× Ryuki, Tachibana Tohru, Nagano Hironobu, Takagi Masafumi, Nishimura
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 筆者らは、音声合成 (TTS) を用いてインターネット動画用の音声ガイド (AD) を作成・流通しやすくする枠組みを開発している。AD を TTS でどのように作成すればどれほど有用になるのかまだ明らかではなかった。AD 作成において、音声合成ならではの新しい表現方法、映画など感情表現を伴う動画での有用性、感情音声合成の効果なども興味深い疑問点である。本論文では、これらの疑問点に関してTTSを用いた AD の予備実験の結果を紹介する。そこでは、特にドラマに対して高品質な TTS の有効性が示唆された。そして、まもなく実施予定の本実験に向け準備中の感情音声合成についても実験結果を紹介する。TTS を利用することによって AD 作成の負担が軽減され、無数のボランティアが作成した多数の AD が利用可能になることが期待される。 | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | We are developing a collaborative Web accessibility framework that facilitates the authoring and sharing of Audio Descriptions (AD) for Internet videos by using a Text-To-Speech (TTS) engine. The crucial aspects of TTS-generated ADs and their utility are still unknown. It is natural that two-hour romantic movies would require higher quality for TTS-generated ADs than are needed for short e-learning videos. In this paper, we introduce the results of preliminary experiments of TTS-generated ADs for two video genres. The results suggest that an AD generated with a high quality TTS system is feasible for dramas. We also present experimental results for expressive TTS systems. We believe that TTS-generated ADs reduce the authoring costs and will allow for widespread sharing of ADs created by large numbers of volunteers. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10442647 | |||||||
| 書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2010-SLP-80, 号 1, p. 1-6, 発行日 2010-02-05 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||