@techreport{oai:ipsj.ixsq.nii.ac.jp:00062353, author = {杉本, 樹世貴 and 西崎, 博光 and 関口, 芳廣 and Kiyotaka, Sugimoto and Hiromitsu, Nishizaki and Yoshihiro, Sekiguchi}, issue = {11}, month = {May}, note = {本稿では,音声ドキュメント検索のための Web ページを利用したドキュメント拡張について述べる.提案手法では,検索対象の音声ドキュメントから音声認識を利用して検索用インデックスを作成する他に,さらにそれらの音声ドキュメントと類似性の高い Web ページからも検索用インデックスを構築する.Web ページの検索は,検索対象の音声ドキュメントを音声認識した結果から Web 検索用のクエリを生成し,それを用いて検索を行う.これら 2 種類のインデックスを適宜組み合わせて利用することで,音声認識誤りや未知語に対して頑健な検索が期待できる.実験の結果,提案手法の有効性を示すことができた.特に未知語を含んだクエリに関しては,補正 11 点平均精度で 4.2% の改善が得られた., This paper describes a novel method for spoken document retrieval usingWeb document expansion. This technique improves document retrieval performance by expanding target spoken documents using Web data. In this research, two types of indexes are built. The one index is made from the transcriptions of the spoken documents, the other is made from Web documents that are highly related to the target spoken documents. The Web documents are retrieved by a search engine that uses Web search queries from transcriptions of the target spoken documents. To utilize both the indexes will achieve robust spoken document retrieval for out-of-vocabulary (OOV) problem and errorful transcriptions by a speech recognizer. The experimental result has shown that the proposed method was very effective for solving the OOV problem. Especially, retrieval performance for only queries including OOV words has achieved improvement of 4.2% comparing with the baseline result.}, title = {音声ドキュメント検索における Web ページを用いたドキュメント拡張の効果}, year = {2009} }