ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2010
  4. 2010-SLP-080

音声合成を用いたインターネット動画用音声ガイド

https://ipsj.ixsq.nii.ac.jp/records/67638
https://ipsj.ixsq.nii.ac.jp/records/67638
afd12a15-cf9d-431a-86f4-95eabb37f6c0
名前 / ファイル ライセンス アクション
IPSJ-SLP10080001.pdf IPSJ-SLP10080001.pdf (558.6 kB)
Copyright (c) 2010 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2010-02-05
タイトル
タイトル 音声合成を用いたインターネット動画用音声ガイド
タイトル
言語 en
タイトル TTS to Provide Audio Descriptions of Internet Videos
言語
言語 eng
キーワード
主題Scheme Other
主題 マルチメディア,マルチモーダル
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
日本IBM東京基礎研究所
著者所属
日本IBM東京基礎研究所
著者所属
日本IBM東京基礎研究所
著者所属
日本IBM東京基礎研究所
著者所属(英)
en
IBM Research - Tokyo
著者所属(英)
en
IBM Research - Tokyo
著者所属(英)
en
IBM Research - Tokyo
著者所属(英)
en
IBM Research - Tokyo
著者名 立花, 隆輝 長野, 徹 高木, 啓伸 西村, 雅史

× 立花, 隆輝 長野, 徹 高木, 啓伸 西村, 雅史

立花, 隆輝
長野, 徹
高木, 啓伸
西村, 雅史

Search repository
著者名(英) Ryuki, Tachibana Tohru, Nagano Hironobu, Takagi Masafumi, Nishimura

× Ryuki, Tachibana Tohru, Nagano Hironobu, Takagi Masafumi, Nishimura

en Ryuki, Tachibana
Tohru, Nagano
Hironobu, Takagi
Masafumi, Nishimura

Search repository
論文抄録
内容記述タイプ Other
内容記述 筆者らは、音声合成 (TTS) を用いてインターネット動画用の音声ガイド (AD) を作成・流通しやすくする枠組みを開発している。AD を TTS でどのように作成すればどれほど有用になるのかまだ明らかではなかった。AD 作成において、音声合成ならではの新しい表現方法、映画など感情表現を伴う動画での有用性、感情音声合成の効果なども興味深い疑問点である。本論文では、これらの疑問点に関してTTSを用いた AD の予備実験の結果を紹介する。そこでは、特にドラマに対して高品質な TTS の有効性が示唆された。そして、まもなく実施予定の本実験に向け準備中の感情音声合成についても実験結果を紹介する。TTS を利用することによって AD 作成の負担が軽減され、無数のボランティアが作成した多数の AD が利用可能になることが期待される。
論文抄録(英)
内容記述タイプ Other
内容記述 We are developing a collaborative Web accessibility framework that facilitates the authoring and sharing of Audio Descriptions (AD) for Internet videos by using a Text-To-Speech (TTS) engine. The crucial aspects of TTS-generated ADs and their utility are still unknown. It is natural that two-hour romantic movies would require higher quality for TTS-generated ADs than are needed for short e-learning videos. In this paper, we introduce the results of preliminary experiments of TTS-generated ADs for two video genres. The results suggest that an AD generated with a high quality TTS system is feasible for dramas. We also present experimental results for expressive TTS systems. We believe that TTS-generated ADs reduce the authoring costs and will allow for widespread sharing of ADs created by large numbers of volunteers.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2010-SLP-80, 号 1, p. 1-6, 発行日 2010-02-05
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-22 00:31:37.014320
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3