WEKO3
アイテム
音節N-gramの事前検索結果を利用した音声中の検索語検出の高速化方式
https://ipsj.ixsq.nii.ac.jp/records/96767
https://ipsj.ixsq.nii.ac.jp/records/96767b5f3da56-d1bd-4545-8792-c53399c8912a
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-12-15 | |||||||
タイトル | ||||||||
タイトル | 音節N-gramの事前検索結果を利用した音声中の検索語検出の高速化方式 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Fast Spoken Term Detection Method by Preparing Pre-retrieval Results for All Syllable N-grams | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | [一般論文] 音声中の検索語検出,高速化,音節N-gram,事前検索 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
岩手県立大学 | ||||||||
著者所属 | ||||||||
岩手県立大学 | ||||||||
著者所属 | ||||||||
筑波大学 | ||||||||
著者所属 | ||||||||
産業技術総合研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Iwate Prefectural University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Iwate Prefectural University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Advanced Industrial Science and Technology | ||||||||
著者名 |
伊藤, 慶明
× 伊藤, 慶明
|
|||||||
著者名(英) |
Yoshiaki, Itoh
× Yoshiaki, Itoh
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,音声中の検索語検出(STD: Spoken Term Detection)において,音節をN個並べた音節N-gramの事前検索結果を利用したSTDの高速化方式を提案する.提案方式では,すべてのN-gram,すなわちN個の音節のすべての組合せに対し検索対象の音声ドキュメントとあらかじめ照合し,その検索結果を事前検索結果として用意しておく.検索語が与えられると,検索語の音節列を1音節ずつずらしながら音節N-gramに分割し,各音節N-gramに対し事前検索結果を参照して一次候補区間を抽出する.次に一次候補区間に対し連続DPによるリスコアリングを行う.すべての音声ドキュメントとの連続DPを行う従来の全照合方式と比べ,一次候補区間として候補を削減することで検索時間の短縮を図る.2音節事前検索結果を用いた実験において,検索精度を低下させることなくコア177講演で検索時間を0.922秒から0.365秒に,2,702講演で検索時間を16.10秒から2.87秒に高速化することができた.上位候補の評価においては,2,702講演の場合,上位1,3,5,10位いずれについても全照合と同精度で1秒未満で検索することができた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We propose a method based on pre-retrieval results using syllable N-grams as query terms in advance in the Spoken Term Detection (STD). In the proposed method, all the combinations of syllable N-grams such as syllable bigram and trigram are searched in spoken documents, and the retrieval results are prepared as pre-retrieval results beforehand. When a query is given, the query is divided into sub-queries that are composed by syllable N-grams, shifting an N-syllable window. First candidates are extracted for each syllable N-gram, and re-ranked according to the score obtained by applying Continuous DP. The proposed method could reduce the retrieval time from 0.922s to 0.365s with no performance deterioration for Core 177 lectures sets and could reduce the retrieval time from 16.10s to 2.87s with no performance deterioration for 2,702 lectures. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 54, 号 12, p. 2492-2501, 発行日 2013-12-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |