WEKO3
アイテム
音声ドキュメント内容検索のためのWEBを用いたドキュメント拡張
https://ipsj.ixsq.nii.ac.jp/records/79551
https://ipsj.ixsq.nii.ac.jp/records/79551bf2017f0-493a-405f-9d63-0bc02b404b05
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-12-15 | |||||||
タイトル | ||||||||
タイトル | 音声ドキュメント内容検索のためのWEBを用いたドキュメント拡張 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Document Expansion Using WEB for Spoken Document Retrieval | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 特集:情報爆発時代におけるIT基盤技術 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
山梨大学大学院医学工学総合研究部 | ||||||||
著者所属 | ||||||||
山梨大学大学院医学工学総合教育部 | ||||||||
著者所属 | ||||||||
山梨大学大学院医学工学総合研究部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Research, Interdisciplinary Graduate School of Medicine and Engineering, Yamanashi University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Education, Interdisciplinary Graduate School of Medicine and Engineering, Yamanashi University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Research, Interdisciplinary Graduate School of Medicine and Engineering, Yamanashi University | ||||||||
著者名 |
西崎, 博光
× 西崎, 博光
|
|||||||
著者名(英) |
Hiromitsu, Nishizaki
× Hiromitsu, Nishizaki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 音声ドキュメントの内容検索において,検索精度に影響する主な要因が音声認識誤りである.音声認識技術の改良により音声ドキュメントの認識を改善することができる.しかし,検索要求に未知語が含まれる場合は,その要求を満たす検索を行うことができない.そこで,本論文では,検索対象の音声ドキュメントの内容に関連するWEBページを収集し,それを用いて検索対象のドキュメント拡張を行う方法を提案する.テストコレクションを用いた実験では,WEBページによるドキュメント拡張は未知語の検索要求の場合に検索精度改善に効果があった.しかし,音声ドキュメントが持つ話題の多様性から,無関係なページも多く収集していることが確認できた.そこで,ドキュメントを内容ごとに分割し,分割されたセグメント単位でWEBページを集めることで,検索対象のドキュメントの内容により即したWEBページを収集する.これにより検索精度が改善でき,WEBページを用いたドキュメント拡張の効果が見られた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In spoken document retrieval, the main factor affecting retrieval performance is speech recognition errors. Refining speech recognition technology can make improvement of speech recognition performance for spoken documents. However, if a query has out-of-vocabulary (OOV) words, we cannot get the spoken documents related to the query. This paper describes spoken document retrieval using document expansion based on WEB whose contents are similar to the spoken documents retrieved. The retrieval experiment showed that the document expansion worked well on OOV queries, but many irrelevant WEB pages were collected because of the variety of topics that spoken documents have. Therefore, each spoken document is automatically divided into some segments. And then, more similar WEB pages to the spoken document can be collected using the query derived from the segment. The improved document expansion achieved improvement of the spoken document retrieval performance. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 52, 号 12, p. 3461-3470, 発行日 2011-12-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |