2024-03-28T22:15:25Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001475762023-04-27T10:00:04Z01164:05159:08497:08498
音声中の検索語検出における単語共起情報の利用Spoken Term Detection Using Information of Collocationjpn一般:認識、検出http://id.nii.ac.jp/1001/00147542/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=147576&item_no=1&attribute_id=1&file_no=1Copyright (c) 2016 by the Information Processing Society of Japan現在,立命館大学大学院情報理工学研究科現在,立命館大学情報理工学部小田原, 一成山下, 洋一本論文では,音声中の検索語検出において,音声ドキュメントと検索語の記号列照合に加えて,検索語に関する共起単語情報と検索語候補区間の単語信頼度を用いる手法を提案する.音素単位での DP マッチングにより音声ドキュメント中から検索語の候補区間を検出し,検出した候補区間を Web テキストから学習した共起単語情報と候補区間の単語信頼度に基づき再評価する.共起単語情報として,TF-IDF 値,候補区間前後に出現した共起単語の数,音声認識時に得られる単語信頼度の 3 種類の手法を比較する.共起単語情報を用いることにより STD の性能を改善でき,候補区間前後に出現した共起単語の数が STD の精度向上に最も有効であることがわかった.共起情報に加え候補区間の単語信頼度を組み込んだ場合,更に精度の向上が見られた.This paper proposes a new spoken term detection method which uses collocation information for a query word and word reliability of candidate segments, in addition to word matching score of phoneme sequences between spoken documents and a query word. This method detects candidate segments from spoken documents using DP matching in phoneme unit. The detected candidate segments are re-evaluated based on collocation information trained with web text and word reliability. We compared three measures for collocation information ; TF-IDF value, the number of the collocation word appeared before and after the candidate segment and word reliability scores obtained in speech recognition. Experimental results show that the introduction of collocation information improves STD performance and that the measure using number of the collocation word is most effective to improvement of STD. In addition to collocation information, word reliability of candidate segments improves STD performance.AN10442647研究報告音声言語情報処理(SLP)2016-SLP-1101162016-01-292188-86632016-01-27