WEKO3
アイテム
音声ドキュメント検索における Web ページを用いたドキュメント拡張の効果
https://ipsj.ixsq.nii.ac.jp/records/62295
https://ipsj.ixsq.nii.ac.jp/records/622955b95bcc3-5db2-409d-a9dd-fcf207fe0bfc
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-05-14 | |||||||
タイトル | ||||||||
タイトル | 音声ドキュメント検索における Web ページを用いたドキュメント拡張の効果 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Effect of Document Expansion using Web Pages on Spoken Document Retrieval | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
山梨大学大学院医学工学総合教育部コンピュータ・メディア工学専攻 | ||||||||
著者所属 | ||||||||
山梨大学大学院医学工学総合研究部 | ||||||||
著者所属 | ||||||||
山梨大学大学院医学工学総合研究部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Dept. of Computer Science and Media Engineering, Educational Interdisciplinary Graduate School of Medicine and Engineering, University of Yamanashi | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Dept. of Research Interdisciplinary Graduate School of Medicine and Engineering, University of Yamanashi | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Dept. of Research Interdisciplinary Graduate School of Medicine and Engineering, University of Yamanashi | ||||||||
著者名 |
杉本, 樹世貴
× 杉本, 樹世貴
|
|||||||
著者名(英) |
Kiyotaka, Sugimoto
× Kiyotaka, Sugimoto
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,音声ドキュメント検索のための Web ページを利用したドキュメント拡張について述べる.提案手法では,検索対象の音声ドキュメントから音声認識を利用して検索用インデックスを作成する他に,さらにそれらの音声ドキュメントと類似性の高い Web ページからも検索用インデックスを構築する.Web ページの検索は,検索対象の音声ドキュメントを音声認識した結果から Web 検索用のクエリを生成し,それを用いて検索を行う.これら 2 種類のインデックスを適宜組み合わせて利用することで,音声認識誤りや未知語に対して頑健な検索が期待できる.実験の結果,提案手法の有効性を示すことができた.特に未知語を含んだクエリに関しては,補正 11 点平均精度で 4.2% の改善が得られた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper describes a novel method for spoken document retrieval usingWeb document expansion. This technique improves document retrieval performance by expanding target spoken documents using Web data. In this research, two types of indexes are built. The one index is made from the transcriptions of the spoken documents, the other is made from Web documents that are highly related to the target spoken documents. The Web documents are retrieved by a search engine that uses Web search queries from transcriptions of the target spoken documents. To utilize both the indexes will achieve robust spoken document retrieval for out-of-vocabulary (OOV) problem and errorful transcriptions by a speech recognizer. The experimental result has shown that the proposed method was very effective for solving the OOV problem. Especially, retrieval performance for only queries including OOV words has achieved improvement of 4.2% comparing with the baseline result. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2009-NL-191, 号 11, p. 1-7, 発行日 2009-05-14 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |