WEKO3
アイテム
音声認識のためのプライバシー保護音響モデル学習法
https://ipsj.ixsq.nii.ac.jp/records/199664
https://ipsj.ixsq.nii.ac.jp/records/199664b478df92-c15d-4058-8d2e-9ffd35347a70
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2019 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2019-10-04 | |||||||
| タイトル | ||||||||
| タイトル | 音声認識のためのプライバシー保護音響モデル学習法 | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 認識 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| デンソーアイティーラボラトリ | ||||||||
| 著者名 |
太刀岡, 勇気
× 太刀岡, 勇気
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | ドメイン内の音声データを使うことで音響モデルの性能を顕著に向上させることができる.しかしながら,ドメイン内のデータは個人情報を含むので,書き起こしが残ると話者のプライバシーを侵害する.これに加えて,ある集団に属していることが知られたくない場合には話者同定も問題となる.ゆえに,ドメイン内データは利用期間が過ぎたら破棄される.ただ,ひとたびデータが破棄されてしまうと,より効果的なモデル構造が将来的に提案されたとしても再学習することができない.このため,音声データのプライバシー保護には価値がある.この際に求められるのは,書き起こしが再生されないことと,プライバシー保護されたデータセットから話者が特定されないことである.本報では,これらの要求を満たすプライバシー保護音響モデル学習を提案する.また 3 種類の特徴量 (n-gram,音素ラベル,音響特徴量) の提案の学習法に対する影響の受けやすさを調査する.影響の受けやすさの解析により,音素ラベルと音響特徴量は n-gram よりも影響が受けにくいことが分かった.これは音響モデルの学習の際に高精度な音素ラベルと音響特徴量が必要なことから考えると,良い性質である.音声認識実験により検証したところ,この良い性質のおかげで,提案法による単語誤り率の低下は 0.6% 未満であった. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10442647 | |||||||
| 書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2019-SLP-129, 号 1, p. 1-6, 発行日 2019-10-04 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 2188-8663 | |||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||