2024-03-28T22:17:37Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001927072023-04-27T10:00:04Z01164:05159:09402:09617
音声中の検索語検出におけるドキュメントの最尤系列化と上位候補の再照合方式による検索時間・精度の改善Improvement of Search Accuracy and Search Time in Query-by-Example by Using Maximum Likelihood Sequence and Rescoring Top Candidatesjpn学生ポスターセッションhttp://id.nii.ac.jp/1001/00192618/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=192707&item_no=1&attribute_id=1&file_no=1Copyright (c) 2018 by the Information Processing Society of Japan岩手県立大学岩手県立大学独立行政法人産業技術総合研究所岩手県立大学金子, 大祐小嶋, 和徳李, 時旭伊藤, 慶明近年,長時間の音声ドキュメント中から特定のシーンを検索する音声中の検索語検出 (STD : Spoken Term Detection) の研究,およびクエリを音声で入力する SQ-STD (Spoken Query STD) の研究が盛んに行われている.DNN (Deep Neural Network) を音声認識に用いることで認識率が大幅に向上することが報告されており,SQ-STD においても DNN を使用することで高精度な検索が可能となった.本稿では SQ-STD における検索時間削減と検索精度向上のための方式を提案する.本稿で提案するドキュメント最優化系列方式では,DNN から得られる事後確率から入力音声の各フレームにおける確率最大値に対応した状態番号を抜き出した系列,最尤系列に変換し予め保持することで,検索の際の計算量の削減を行う.また,検索結果の上位候補の再度照合方式により,検索時間の増加を抑えつつ検索精度の向上を図る.これらの方式のより SQ-STD の検索時間削減および検索精度向上を図る.ドキュメント最尤系列化方式による実験の結果,Posteriorgram 照合と比較して検索語 1 つあたりの検索時間が 90% 以上削減できたとともに,112 GB のメモリ空間使用量が削減できた.また,上位候補の再度 Posteriorgram 照合方式により P@N の評価指標において,検索精度の向上が確認できた.以上の結果から,SQ-STD に対してドキュメント最尤系列化が有効であることを確認した.This paper proposes a maximum likelihood sequence method of retrieval documents obtained from DNN (Deep Neural Network) and a method of rescoring the top candidates of retrieval results again. Improvement search time and accuracy by using the above two methods.AN10442647研究報告音声言語情報処理(SLP)2018-SLP-12510162018-12-032188-86632018-11-29