WEKO3
アイテム
音声中の検索語検出における音素トライグラム照合による高速抽出法
https://ipsj.ixsq.nii.ac.jp/records/87741
https://ipsj.ixsq.nii.ac.jp/records/87741a85881bc-4807-4fab-b0d6-195199c410da
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-12-13 | |||||||
タイトル | ||||||||
タイトル | 音声中の検索語検出における音素トライグラム照合による高速抽出法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Fast spoken term detection by phone trigram matching | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | ポスターセッション | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
岩手県立大学 | ||||||||
著者所属 | ||||||||
岩手県立大学 | ||||||||
著者所属 | ||||||||
岩手県立大学 | ||||||||
著者所属 | ||||||||
岩手県立大学 | ||||||||
著者所属 | ||||||||
岩手県立大学 | ||||||||
著者所属 | ||||||||
筑波大学 | ||||||||
著者所属 | ||||||||
産業技術総合研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Iwate Prefectural University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Iwate Prefectural University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Iwate Prefectural University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Iwate Prefectural University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Iwate Prefectural University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Advanced Industrial Science and Technology | ||||||||
著者名 |
鎌田, 圭祐
斉藤, 裕之
伊藤, 慶明
小嶋, 和徳
石亀, 昌明
田中, 和世
李, 時旭
× 鎌田, 圭祐 斉藤, 裕之 伊藤, 慶明 小嶋, 和徳 石亀, 昌明 田中, 和世 李, 時旭
|
|||||||
著者名(英) |
Keisuke, Kamata
Hiroyuki, Saito
Yoshiaki, Itoh
Kazunori, Kojima
Masaaki, Ishigame
Kazuyo, Tanaka
Shi-wook, Lee
× Keisuke, Kamata Hiroyuki, Saito Yoshiaki, Itoh Kazunori, Kojima Masaaki, Ishigame Kazuyo, Tanaka Shi-wook, Lee
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 音声中の検索語検出 (STD:Spoken Term Detection) において,音素トライグラムを利用した STD の高速化方式を提案する.提案方式では,音声ドキュメントを予め音素認識あるいは音節認識を行っておき、得られた認識結果から 3 音素単位で音素トライグラムとその出現位置を転置インデックスとして保持しておく.クエリが与えられると,クエリの音素列を, 1 音素ずつシフトさせながらクエリの音素列を分割することで,トライグラム群を作成する.クエリの各トライグラムを事前に作成した転置インデックスとの照合を行い候補区間を抽出する.抽出された候補区間にのみ連続 DP による精度の高いスコアリングを行うことで検索時間の短縮を図る. MAP による評価を行った実験において,検索性能低下なしで検索時間 86.5% 削減し, 2.21 秒にすることに成功した.検索結果上位 K 件の正解数による評価を行った実験において上位 1,3,5,10 位いずれについても全ての音声ドキュメントに対して連続 DP による検索を行った時と同性能を 1 秒未満で検索することができた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We have been conducting a research for Spoken Term Detection (STD), which identifies the target section where query terms are spoken in spoken documents. In STD, Out-Of-Vocabulary (OOV) query terms are one of the most important problems because OOV terms are not correctly recognized by using an automatic speech recognizer and are likely to be query terms. We have proposed a subword based STD system to deal with OOV query terms, where all spoken documents are searched for after query terms are given. It leads to the linear increase of search time according to the amount of spoken documents. The paper proposes a new method for fast STD by using phone trigram. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2012-SLP-94, 号 24, p. 1-6, 発行日 2012-12-13 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |