@article{oai:ipsj.ixsq.nii.ac.jp:00009360, author = {足立, 吉広 and 大谷, 大和 and 川本, 真一 and 四倉, 達夫 and 森島, 繁生 and 中村, 哲 and Yoshihiro, Adachi and Yamato, Ohtani and Shinichi, Kawamoto and Tatsuo, Yotsukura and Shigeo, Morishima and Satoshi, Nakamura}, issue = {12}, journal = {情報処理学会論文誌}, month = {Dec}, note = {視聴者の顔をCGで再現し,CGキャラクタとして映画に登場させるFuture Cast System(FCS)を改良し,視聴者の声の特徴をそのキャラクタの台詞音声へ反映させ,キャラクタの顔と声の一致度を向上させて音声を出力するシステムを構築する.あらかじめ構築した話者データベースから視聴者の知覚的類似話者を選出し,その話者の台詞音声を視聴者のキャラクタに割り当て,短時間で台詞音声を映像と同期出力するシステムを提案する.知覚的類似話者は,個人性の知覚と関係があると報告されている8つの音響特徴量による距離の線形結合を用いて推定する.声優による60種類の声質の台詞音声データベースを用いた音声出力同期システムを構築し,視聴者のキャラクタの顔と選択された音声の一致度に関して5段階の主観評価を行った.登場者数と話者データベースの規模,および類似話者の許容度の関係を予備実験により調査し,実験条件にあてはめたところ,予想される許容度約51%に対して主観実験値において35%の許容が確認され,全体として予備実験で得られた予想値の68%が達成できた., In this paper, we propose an improved Future Cast System (FCS) that enables anyone to be a movie star with own individuality in voice as well as faces. Previous system created a CG character which closely resembles the face of the audience; however the voice of the character was selected only considering gender. Therefore, the voice of a CG character is not enough to identify oneself from others. The proposed system produces much closer voice to the audience by selecting one from a voice actor database, where voice similarity of speaker is estimated using a combined feature of 8 acoustic features. After assigning one CG character to the audience, the system produces voices in synchronization with the CG character's movement. We constructed the speech synchronization system using voice actor database with 60 voice quality, and conducted the subjective evaluation experiments of voice similarity in five-grades. Achievement rate of the proposal method for theoretical figure that considered the allowance rate of selected speaker to the database size is 68%.}, pages = {3908--3917}, title = {個人の音声を反映する映像エンタテインメントシステム}, volume = {49}, year = {2008} }