Item type |
Journal(1) |
公開日 |
2014-12-15 |
タイトル |
|
|
タイトル |
音響情報のベクトル量子化を用いた音声ドキュメントからの検索語検出 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Spoken Term Detection Using Vector Quantization of Spoken Documents |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[一般論文] 音声中の検索語検出,ベクトル量子化,V-Pスコア,テキストクエリ,連続DP |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
立命館大学大学院情報理工学研究科/現在,村田機械株式会社 |
著者所属 |
|
|
|
立命館大学大学院理工学研究科/現在,日本電気株式会社 |
著者所属 |
|
|
|
立命館大学情報理工学部 |
著者所属 |
|
|
|
立命館大学情報理工学部 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Engineering, Ritsumeikan University / Presently with Murata Machinery, Ltd |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Science and Engineering, Ritsumeikan University / Presently with NEC Corporation |
著者所属(英) |
|
|
|
en |
|
|
College of Information and Engineering, Ritsumeikan University |
著者所属(英) |
|
|
|
en |
|
|
College of Information and Engineering, Ritsumeikan University |
著者名 |
坂本, 伊織
松永, 徹
趙, 國
山下, 洋一
|
著者名(英) |
Iori, Sakamoto
Toru, Matsunaga
Kook, Cho
Yoichi, Yamashita
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
音声を含むマルチメディアコンテンツを有効に利用するには,音声認識に基づいた情報検索が重要な技術となる.与えられた検索語を音声データから検出する音声中の検索語検出(STD:Spoken Term Detection)の研究が広く行われている.本論文では,検索対象の音声ドキュメントの表現手法として,音響情報をベクトル量子化(VQ)して得られるVQコード列を用い,テキスト入力された検索語と照合するSTD手法を提案する.VQコードと音素の関連度をあらかじめ話者ごとに学習しておくことによって,音声ドキュメントのVQコード列と検索語の音素列の照合を行う.評価実験において,音声ドキュメントをサブワード列で表現する従来手法よりも高い検出性能が得られた.さらに,異なる音声認識結果で学習した関連度で照合を行った複数の検出結果を統合することによって検出性能が改善されることが示されている. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
The information retrieval based on speech recognition is an important technique to easily access large amount of multimedia contents including speech. The development of spoken term detection (STD) techniques, which detect a given word or phrase from spoken documents, is widely conducted. This paper proposes a new STD method based on matching between a text query and VQ (Vector Quantization) code sequences which represent spoken documents. The co-occurrence scores between a VQ code and a subword are a priori trained for each speaker. The continuous DP matching detects a subword sequence of the query term from VQ code sequences using the co-occurrence as a local score of matching. Evaluation experiments show that the proposed method improves the performance of STD. A fusion method of multiple detection results using the different cooccurrence scores gives more improvement of STD performance. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
書誌情報 |
情報処理学会論文誌
巻 55,
号 12,
p. 2537-2545,
発行日 2014-12-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |