WEKO3
アイテム
距離つき音節n-gram索引による音声検索語検出の距離尺度の厳密化
https://ipsj.ixsq.nii.ac.jp/records/90271
https://ipsj.ixsq.nii.ac.jp/records/9027107478465-c4ec-4da7-99d4-41d59ff1a8c4
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-02-15 | |||||||
タイトル | ||||||||
タイトル | 距離つき音節n-gram索引による音声検索語検出の距離尺度の厳密化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Strict Distance Measure for a Spoken Term Detection Method Based on a Syllable n-gram Index with Distance Metric | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | [特集:音声ドキュメント処理] 音声検索語検出,音節認識,n-gram,未知語,既知語 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
豊橋技術科学大学 | ||||||||
著者所属 | ||||||||
豊橋技術科学大学 | ||||||||
著者所属 | ||||||||
豊橋技術科学大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Toyohashi University of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Toyohashi University of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Toyohashi University of Technology | ||||||||
著者名 |
岩見, 圭祐
× 岩見, 圭祐
|
|||||||
著者名(英) |
Keisuke, Iwami
× Keisuke, Iwami
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | ニュースや新聞記事のようにテキスト情報を含むものであれば既存のテキスト検索エンジンを用いることで,欲しい情報を高速に検索することができる.しかし,現在のところ音声ドキュメントに対しての有効な検索手法は確立されていない.その理由としてあげられるのが,未知語や認識誤りといった音声ドキュメント特有の問題である.我々は今までにサブワード単位の認識結果を用いた高速な音声検索語検出(STD)手法を提案してきた.音節ラティスから置換誤り,挿入誤りを考慮した距離つきn-gram索引を構築し,脱落誤りを考慮したクエリで検索することで未知語と認識誤りに頑健な検索が可能となった.本論文では,挿入誤り距離と脱落誤り距離,およびダミー音節とクエリ中の音節との置換誤り距離の厳密化手法を提案し,その評価結果について述べる. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We can find the information with an existing textual search engine if the target data consist of text information such as news and newspaper, but efficient spoken term detection (STD) method has not been established, because there are specific problems such as some recognition errors and out-of-vocabulary (OOV) terms for spoken documents. Therefore, sub-word unit based recognition and retrieval methods have been proposed. In our previous work, we proposed a very fast Japanese STD system that is robust for considering OOV words and mis-recognition of sub-units. We used individual syllables as sub-word unit in continuous speech recognition and an n-gram index of syllables with distance metric in a recognized syllable-based lattice. In this paper, we describe the improvement method, especially, the exact definition of insertion/deletion error distance and the distance between the dummy syllable and an arbitrary syllable in a query, and show an experimental result. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 54, 号 2, p. 495-505, 発行日 2013-02-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |