@techreport{oai:ipsj.ixsq.nii.ac.jp:02009817, author = {浪崎,恭佑 and ホワン,ウェンチン and 戸田,智基}, issue = {44}, month = {May}, note = {低遅延リアルタイム音声変換システムは,発話の入力とほぼ同時に所望の特徴を持つ変換音声を出力可能な有用な技術である.これにより,身体的制約を超えた発声機能拡張の実現が期待されるが,システム利用時における聴覚フィードバックが発話に与える影響については,未だ不明な点が多い.この影響を解明するためには,変換音声と自己聴取音声による聴覚フィードバックを個別に制御できる仕組みが必要となる.本稿では,自己聴取音声による聴覚フィードバックの中で,物理的に遮断することが困難である体内伝導自己聴取音声に着目し,重畳音を用いた聴覚マスキングによる制御法を提案する.聴覚マスキング効果の測定には,発話者による主観評価に加えて,ロンバード効果を利用した客観評価を実施する.実験の結果,1)空気伝導自己聴取音声の有無により,聴覚マスキング効果に変化が生じること,2)重畳音の周波数特性を制御することで,体内伝導自己聴取音声を優先的にマスクできることを示した., Low-latency real-time voice conversion (VC) systems enable the output of converted speech with desired characteristics almost simultaneously with speech input. Such systems are expected to augment human speech production capabilities beyond physical limitations. However, the influence of auditory feedback during their use remains unclear. To investigate this issue, it is necessary to independently control auditory feedback from converted speech and self-voice. In this paper, we focus on body-conducted self-voice, which is difficult to physically block, and propose a control method based on auditory masking using masking sounds. To evaluate the masking effect, we conduct both subjective evaluations by speakers and objective evaluations based on the Lombard effect. Experimental results show that (1) the masking effect varies depending on the presence or absence of air-conducted self-voice, and (2) by controlling the frequency characteristics of the masking sound, body-conducted self-voice can be dominantly masked.}, title = {聴覚フィードバック音声制御に向けた体内伝導自己聴取音マスキングの調査}, year = {2026} }