WEKO3
アイテム
DNNの出力確率を用いたSTDのリスコアリング方式
https://ipsj.ixsq.nii.ac.jp/records/102198
https://ipsj.ixsq.nii.ac.jp/records/102198ac9cff28-8a6d-4dc7-8da9-263d2d579e6f
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2014 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2014-07-17 | |||||||
タイトル | ||||||||
タイトル | DNNの出力確率を用いたSTDのリスコアリング方式 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A rescoring method for STD using output probability of DNN | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | ニューラルネットワーク | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
岩手県立大学 | ||||||||
著者所属 | ||||||||
産業技術総合研究所 | ||||||||
著者所属 | ||||||||
筑波大学 | ||||||||
著者所属 | ||||||||
岩手県立大学 | ||||||||
著者所属 | ||||||||
岩手県立大学 | ||||||||
著者所属 | ||||||||
岩手県立大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Iwate Prefectural University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Advanced Industrial Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Iwate Prefectural University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Iwate Prefectural University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Iwate Prefectural University | ||||||||
著者名 |
紺野, 良太
李, 時旭
田中, 和世
小嶋, 和徳
石亀, 昌明
伊藤, 慶明
× 紺野, 良太 李, 時旭 田中, 和世 小嶋, 和徳 石亀, 昌明 伊藤, 慶明
|
|||||||
著者名(英) |
Ryota, Konno
Shi-wook, Lee
Kazuyo, Tanaka
Kazunori, Kojima
Masaaki, Ishigame
Yoshiaki, Itoh
× Ryota, Konno Shi-wook, Lee Kazuyo, Tanaka Kazunori, Kojima Masaaki, Ishigame Yoshiaki, Itoh
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年,ビデオデータから特定のシーンを検索する機能に対するニーズが高まっており,音声中の検索語検出 (STD:Spoken Term Detection) の研究が盛んに行われている.本稿では,従来の STD を行った後,検索結果上位候補を DNN(Deep Neural Network) の出力確率を用いて検索語と照合するリスコアリング方式を提案する.NTCIR-9,10 の Formal run,Dry run 計 4 種のテストセットを用いた評価実験の結果,リランキング発話数Kを 50 件とした場合,検索精度を表す MAP が 4.11pt~11.61pt 向上し,処理時間はフレーム単位照合で約 0.17 秒,状態単位照合で平均約 0.10 秒と,実用可能な処理時間で検索精度の向上を実現できた.さらに,リランキング対象発話数の増加に伴い,検索精度が向上することも確認できた.K を 2000 件とした場合の MAP は 9.48pt~28.04pt 向上し,検索時間はフレーム単位照合で約 7.24 秒,状態単位照合で約 4.12 秒となった.また,状態単位照合方式は,フレーム単位照合とほぼ同等の検索精度で検索時間を約 1.73 倍高速化できた.以上のように,実用的な処理時間で検索精度向上を実現し本手法の有効性を確認できた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes a rescoring method for Spoken Term Detection (STD) using output probability of Deep Neural Network. The experimental results demonstrated the proposed method works well for open test collections that were distributed from National Institute of Informatics (NII) for STD evaluation. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2014-SLP-102, 号 7, p. 1-6, 発行日 2014-07-17 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |