@techreport{oai:ipsj.ixsq.nii.ac.jp:00199664, author = {太刀岡, 勇気}, issue = {1}, month = {Oct}, note = {ドメイン内の音声データを使うことで音響モデルの性能を顕著に向上させることができる.しかしながら,ドメイン内のデータは個人情報を含むので,書き起こしが残ると話者のプライバシーを侵害する.これに加えて,ある集団に属していることが知られたくない場合には話者同定も問題となる.ゆえに,ドメイン内データは利用期間が過ぎたら破棄される.ただ,ひとたびデータが破棄されてしまうと,より効果的なモデル構造が将来的に提案されたとしても再学習することができない.このため,音声データのプライバシー保護には価値がある.この際に求められるのは,書き起こしが再生されないことと,プライバシー保護されたデータセットから話者が特定されないことである.本報では,これらの要求を満たすプライバシー保護音響モデル学習を提案する.また 3 種類の特徴量 (n-gram,音素ラベル,音響特徴量) の提案の学習法に対する影響の受けやすさを調査する.影響の受けやすさの解析により,音素ラベルと音響特徴量は n-gram よりも影響が受けにくいことが分かった.これは音響モデルの学習の際に高精度な音素ラベルと音響特徴量が必要なことから考えると,良い性質である.音声認識実験により検証したところ,この良い性質のおかげで,提案法による単語誤り率の低下は 0.6% 未満であった.}, title = {音声認識のためのプライバシー保護音響モデル学習法}, year = {2019} }