2024-03-29T09:12:50Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000626642023-04-27T10:00:04Z01164:05159:05160:05697
Suffix Arrayを用いた高速なキーワード検索Fast keyword spotting using suffix arrayjpn語彙・キーワード検出http://id.nii.ac.jp/1001/00062664/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=62664&item_no=1&attribute_id=1&file_no=1Copyright (c) 2009 by the Information Processing Society of Japan豊橋技術科学大学豊橋技術科学大学豊橋技術科学大学手島, 茂樹桂田, 浩一新田, 恒雄Suffix Array を用いたテキスト曖昧検索アルゴリズムを音声検索に適用し,音素単位のマッチングを行うことで,音声データベースに対する高速かつ使用データ領域が小さいキーワード検索を実現する.キーワード長に対して処理時間が指数的に増加する問題を解決するため,キーワードの分割検索法を提案した.また,高精度な検索結果を高速に提示するため,反復深化探索のアルゴリズムを導入した.CSJ 男女話者 600 時間分の音声データに対して検索実験を行い,キーワード分割の有効性,および,反復深化探索の適応性を評価した.さらに,連続 DP マッチングと比較して高速に検索できることを確認した.We present a fast and space-saving keyword spotting method for spoken documents. The method employs the phoneme-based approximate string matching algorithm using a suffix array. To solve the exponential explosion problem of process time with length of keywords, we propose a keyword division method and show effectiveness of the method experimentally. An iterative lengthening search algorithm is used to retrieve accurate results rapidly. We confirmed that the method can retrieve accurate results fast from the CSJ database containing 600 hour speech data of male and female speakers. We also confirmed that this approach is faster than the one using conventional continuous DP-matching.AN10442647研究報告音声言語情報処理(SLP)2009-SLP-773162009-07-102009-08-19