@techreport{oai:ipsj.ixsq.nii.ac.jp:00200791, author = {次井, 貴浩 and 高木, 信二 and 橋本, 佳 and 大浦, 圭一郎 and 南角, 吉彦 and 徳田, 恵一 and Takahiro, Tsugai and Shinji, Takaki and Kei, Hashimoto and Keiichiro, Oura and Yoshihiko, Nankaku and Keiichi, Tokuda\nt}, issue = {12}, month = {Nov}, note = {近年,スマートフオンの著しい普及とともに,音声入力は街中などの公共空間においても利用されるようになった.一方で,公共空間において音声入力を用いたシステムを利用する場合,ユーザーの発話内容が周囲に筒抜けであるという問題がある. この問題に対し,スピーチプライバシーを保護するための手法としてサウンドマスキングが提案されており,特にユーザー発話を加工したマスキング音の効果が優れていることが報告されている.しかし,加工されるとしても,ユーザー発話をマスキング音として利用することは,元の発話が復元される可能性があり,プライバシー保護の観点から好ましくない.そこで本稿では,統計モデルに基づく音声合成システムを用いてユーザーの音声特性を持つ合成音声を生成し,マスキング音として利用する手法を提案する.主観評価実験の結果,提案法は文章理解度や不快感に関する評価で有効性を示した., In this paper, we propose a synthetic speech-based sound masking method that protects the privacy when speaking to smartphones in public spaces. Recently, smartphones have become widespread and enabled voice input in public spaces such as cities. A problem with the use of voice input in public spaces is that the content of user's utterances are liable to be overheard by other people in the vicinity. To address this problem, sound masking has been proposed as a way of protecting the speech privacy. There have been many previous studies related to sound masking, and these have shown that it is more effective to perform masking using the user's utterance rather than using the other forms of masker. However, even though the user's utterance is processed, using user's utterances are not preferable from the viewpoint of privacy protection. To overcome these problems, we propose a privacy protecting method based on synthetic speech generated by a speech synthesis system based on statistical models that can synthesize speech with user's voice characteristics. Experimental results show the effectiveness of the proposed method on the sentence intelhgibihty and the annoyance to surroimding people compared with conventional methods.}, title = {公共空間におけるスピーチプライバシー保護を目的とした合成音声によるサウンドマスキングの検討}, year = {2019} }