| Item type |
SIG Technical Reports(1) |
| 公開日 |
2016-07-21 |
| タイトル |
|
|
タイトル |
音声クエリによる音声検索語検出のための認識結果およびDNNベースの特徴抽出と再照合手法の比較評価 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Rescoring with ASR output-based and DNN-based features extraction for improved query-by-example spoken term detection |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
SPオーガナイズドセッション |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
静岡大学大学院総合科学技術研究科 |
| 著者所属 |
|
|
|
静岡大学大学院総合科学技術研究科 |
| 著者所属 |
|
|
|
静岡大学大学院総合科学技術研究科 |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Integrated Science and Technology, Shizuoka University |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Integrated Science and Technology, Shizuoka University |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Integrated Science and Technology, Shizuoka University |
| 著者名 |
大石, 修司
松葉, 達也
甲斐, 充彦
|
| 著者名(英) |
Shuji, Oishi
Tatsuya, Matsuba
Atsuhiko, Kai
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,音声ドキュメント検索技術に関連した研究として,与えられた検索語が発話されている箇所を音声ドキュメント中から特定する音声検索語検出 (Spoken Term Detection:STD) の研究が盛んに行われている.本稿では,音声によるクエリ入力を想定した STD の手法を対象として考える.従来の STD 手法は,音声認識を行い検索対象及び検索語 (クエリ) を元にサブワード (音素や音節) 列などの認識結果を用いて検索を行う.以前に我々はサブワード単位音響モデルのパラメータから求める様々な音響的類似度を用いる方法を提案し,STD で検索性能を改善した.しかし音声クエリを用いる場合,未知語 (OOV) や誤認識の影響はより大きくなり,検索性能を低下させてしまう.そのため本稿では音声認識結果を用いる従来の STD 手法によるスポッティングを行った後,話者や環境の違いに頑健な DNN に基づいた特徴量によって再照合を行う手法を提案する.さらに,認識結果より得られる信頼度やクエリの長さの特徴を素性として書き起こしを含む開発用データによって自動的に構築する検出事例から学習したスコアリングモデルにより,正規化されたスコアを得る.これらの方法の併用により,更なる STD 精度の改善が得られた. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
| 書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2016-SLP-112,
号 11,
p. 1-6,
発行日 2016-07-21
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |