ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 論文誌(ジャーナル)
  2. Vol.55
  3. No.3

音声中の任意検索語検出のための未知語区間推定に基づく選択的インデックス統合法

https://ipsj.ixsq.nii.ac.jp/records/99495
https://ipsj.ixsq.nii.ac.jp/records/99495
1f3f9c02-519a-4956-b9cd-e65768bc11e5
名前 / ファイル ライセンス アクション
IPSJ-JNL5503013.pdf IPSJ-JNL5503013.pdf (2.7 MB)
Copyright (c) 2014 by the Information Processing Society of Japan
オープンアクセス
Item type Journal(1)
公開日 2014-03-15
タイトル
タイトル 音声中の任意検索語検出のための未知語区間推定に基づく選択的インデックス統合法
タイトル
言語 en
タイトル Selective Index Combination Method Based on Out-of-vocabulary Region Estimator for Open-vocabulary Spoken Term Detection
言語
言語 jpn
キーワード
主題Scheme Other
主題 [一般論文] 音声検索語検出,キーワードスポッティング,未知語検出,未知語区間推定
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_6501
資源タイプ journal article
著者所属
京都大学大学院情報学研究科/株式会社日立製作所中央研究所
著者所属
京都大学大学院情報学研究科
著者所属
京都大学大学院情報学研究科
著者所属(英)
en
Graduate School of Informatics, Kyoto University / Hitachi Ltd., Central Research Laboratory
著者所属(英)
en
Graduate School of Informatics, Kyoto University
著者所属(英)
en
Graduate School of Informatics, Kyoto University
著者名 神田, 直之 糸山, 克寿 奥乃, 博

× 神田, 直之 糸山, 克寿 奥乃, 博

神田, 直之
糸山, 克寿
奥乃, 博

Search repository
著者名(英) Naoyuki, Kanda Katsutoshi, Itoyama Hiroshi, G.Okuno

× Naoyuki, Kanda Katsutoshi, Itoyama Hiroshi, G.Okuno

en Naoyuki, Kanda
Katsutoshi, Itoyama
Hiroshi, G.Okuno

Search repository
論文抄録
内容記述タイプ Other
内容記述 本研究では音声検索語検出のために複数の音声認識器から出力された認識結果を統合する手法において,未知語区間推定結果に基づいてインデックスを選択的に統合することで,検出精度の劣化を抑えつつインデックスサイズを削減する手法について提案する.提案する手法は4種類の音声認識器から得られた出力を1つのネットワークへと統合する.その際,未知語区間推定結果に基づきネットワーク中の有効なアークの選択や,インデックスに用いるサブワード単位の選択を行うことで,冗長なインデックスを削減する.日本語話し言葉コーパスを用いた評価の結果,提案法によって,検出精度の劣化を1.4ポイントに抑えたうえで音素Transition Networkから22.7%のインデックスが削減できることを確認した.単一の音声認識結果から作成した音素単位のネットワークと比較した場合,提案法では,インデックスの統合による検出精度向上の効果(既知語で16.3%,未知語で16.0%の検出エラー削減)を保ちながら,単一の音声認識結果に基づくインデックスと同等以下の大きさまでインデックスサイズを抑えることができた.
論文抄録(英)
内容記述タイプ Other
内容記述 In this paper, a novel index combination method for spoken term detection is proposed. In our method, outputs from four different recognizers are combined into one confusion network. A novel index-selection method for the multiple index-combination method is then used to suppress the increase of the index size. Two methods are proposed to reduce index size: (1) arc selection and (2) unit selection, both of which are based on an Out-of-Vocabulary (OOV)-region estimator score. Experimental results with Japanese lecture recordings, Corpus of Spontaneous Japanese, showed that the index-selection method achieved a 22.7% reduction of index size of the best confusion network with only 1.4 points loss of its high accuracy. Compared with the best phoneme-based index from a single recognizer, the proposed method achieved smaller index size while keeping high accuracy of the index combination method (a 16.3% and 16.0% relative error reduction for IV and OOV queries).
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN00116647
書誌情報 情報処理学会論文誌

巻 55, 号 3, p. 1201-1211, 発行日 2014-03-15
ISSN
収録物識別子タイプ ISSN
収録物識別子 1882-7764
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-21 12:02:00.272542
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3