Item type |
SIG Technical Reports(1) |
公開日 |
2016-01-29 |
タイトル |
|
|
タイトル |
音声中の検索語検出における単語共起情報の利用 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Spoken Term Detection Using Information of Collocation |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
一般:認識、検出 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
現在,立命館大学大学院情報理工学研究科 |
著者所属 |
|
|
|
現在,立命館大学情報理工学部 |
著者所属(英) |
|
|
|
en |
|
|
Presently with Graduate School of Information and Engineering, Ritsumeikan University |
著者所属(英) |
|
|
|
en |
|
|
Presently with College of Information and Engineering, Ritsumeikan University |
著者名 |
小田原, 一成
山下, 洋一
|
著者名(英) |
Kazunari, Odawara
Yoichi, Yamashita
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本論文では,音声中の検索語検出において,音声ドキュメントと検索語の記号列照合に加えて,検索語に関する共起単語情報と検索語候補区間の単語信頼度を用いる手法を提案する.音素単位での DP マッチングにより音声ドキュメント中から検索語の候補区間を検出し,検出した候補区間を Web テキストから学習した共起単語情報と候補区間の単語信頼度に基づき再評価する.共起単語情報として,TF-IDF 値,候補区間前後に出現した共起単語の数,音声認識時に得られる単語信頼度の 3 種類の手法を比較する.共起単語情報を用いることにより STD の性能を改善でき,候補区間前後に出現した共起単語の数が STD の精度向上に最も有効であることがわかった.共起情報に加え候補区間の単語信頼度を組み込んだ場合,更に精度の向上が見られた. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
This paper proposes a new spoken term detection method which uses collocation information for a query word and word reliability of candidate segments, in addition to word matching score of phoneme sequences between spoken documents and a query word. This method detects candidate segments from spoken documents using DP matching in phoneme unit. The detected candidate segments are re-evaluated based on collocation information trained with web text and word reliability. We compared three measures for collocation information ; TF-IDF value, the number of the collocation word appeared before and after the candidate segment and word reliability scores obtained in speech recognition. Experimental results show that the introduction of collocation information improves STD performance and that the measure using number of the collocation word is most effective to improvement of STD. In addition to collocation information, word reliability of candidate segments improves STD performance. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2016-SLP-110,
号 1,
p. 1-6,
発行日 2016-01-29
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |