WEKO3
アイテム
複数認識結果を用いて構築したSuffix Arrayに対する音声検索語検出
https://ipsj.ixsq.nii.ac.jp/records/87732
https://ipsj.ixsq.nii.ac.jp/records/87732853b8207-6459-4bbb-a88c-98f6d96f5f3c
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-12-13 | |||||||
タイトル | ||||||||
タイトル | 複数認識結果を用いて構築したSuffix Arrayに対する音声検索語検出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Spoken Term Detection for Suffix Array was Constructed Using Multiple Speech Recognition Results | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 音声検索 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
豊橋技術科学大学 | ||||||||
著者所属 | ||||||||
豊橋技術科学大学 | ||||||||
著者所属 | ||||||||
豊橋技術科学大学 | ||||||||
著者所属 | ||||||||
豊橋技術科学大学/早稲田大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Toyohashi University of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Toyohashi University of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Toyohashi University of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Toyohashi University of Technology / Waseda University | ||||||||
著者名 |
勝浦, 広大
× 勝浦, 広大
|
|||||||
著者名(英) |
Koudai, Katsuura
× Koudai, Katsuura
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では suffix array を用いた高速で精度の高い音声検索語検出法を提案する.これまで筆者らは,単一の音節言語モデルを用いて認識した結果から suffix array を構築していたが,本研究では,単語と音節の言語モデルを用いて音声認識を行い,出力された複数の認識結果を統合し suffix array を構築することで検索性能の向上を実現する.評価実験の結果, CSJ データベースに対して CORE 講演 44 時間分では, F 値の最大値が約 9 ポイント向上し, MAP は約 7 ポイント向上した.また, ALL 講演 604 時間分では, F 値の最大値が約 12 ポイント向上し, MAP は約 9 ポイント向上した.さらに,複数の認識結果から構築した suffix array では再現率あたりの検索時間が,単一の認識結果から構築したものと比べて短いことが分かった.この結果より,複数認識結果を用いることで高速で性能のよい音声検索語検出を実現できることが分かった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper proposes a fast spoken term detection (STD) method using a suffix array. Previously, we have proposed a STD method in which a suffix array is constructed from a recognition result obtained by using a single syllable-based language model. In this study, we attempt to improve search performance by constructing the suffix array from two or more recognition results obtained by using word-based and syllable-based language models. Experimental results show that the maximum F-measure and MAP scores increased by 9 points and 7 points on the CSJ core lectures (44 hours), respectively, and those on the CSJ all lectures (604 hours) increased by 12 points and 9 points, respectively. Moreover, we confirmed the search time per the recall rate decreased by using the suffix array constructed from multiple recognition results. These results show that constructing suffix array from multiple recognition results makes the search performance considerably improve without increasing the search time severely. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2012-SLP-94, 号 15, p. 1-6, 発行日 2012-12-13 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |