WEKO3
アイテム
講演音声ドキュメント検索のための擬似適合性フィードバック
https://ipsj.ixsq.nii.ac.jp/records/92275
https://ipsj.ixsq.nii.ac.jp/records/92275a94b7097-471a-4c7c-8615-61610f79340e
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-05-16 | |||||||
タイトル | ||||||||
タイトル | 講演音声ドキュメント検索のための擬似適合性フィードバック | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Pseudo Relevance Feedback for Lectures | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | テキスト処理・検索 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
龍谷大学理工学研究科 | ||||||||
著者所属 | ||||||||
龍谷大学理工学部 | ||||||||
著者所属 | ||||||||
龍谷大学理工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Science and Technology, Ryukoku University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Science and Technology, Ryukoku, University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Science and Technology, Ryukoku, University | ||||||||
著者名 |
西尾, 友宏
× 西尾, 友宏
|
|||||||
著者名(英) |
Tomohiro, Nishio
× Tomohiro, Nishio
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 講演や講義などの長い音声ドキュメントの検索のための擬似適合性フィードバック (PRF: Pseudo Relevance Feedback) について述べる.PRF とは,与えられたクエリ (初期クエリ) で検索を行い,その検索結果から初期クエリに関連する語を抽出して,新たなクエリを作成するクエリ拡張手法である.本論文では,はじめに講演音声やその一部を検索対象とした検索 (パッセージ検索) において PRF の効果を調査し,長い音声ドキュメントの検索では,関連語抽出が難しく PRF が効果的でないことを示す.次に,この問題を解決するために,講演音声をあらかじめ 30 秒程度に機械的に区切っておき,それを対象として初期検索を行って関連語抽出を行う PRF 手法を提案する.提案手法が長い音声ドキュメント検索において従来法よりも適していることを明らかにした上で,拡張したクエリによる検索結果と初期クエリによる検索結果を組み合わせることの効果を示す.CSJ 音声ドキュメントコレクションの講演検索タスクや比較的長めのパッセージ検索タスクにおいて,平均的な検索精度 (11 点平均精度) の向上,および検索精度が向上するクエリ数の増加が確認できた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Pseudo relevance feedback (PRF) for Lectures is addressed. PRF is one of well-known query expansion (QE) methods, which extracts original query-related terms from initially retrieved documents obtained by an original query. In this paper, we first study PRF on lecture retrieval and passage (part of lectures) retrieval tasks, and show that PRF does not work well on longer spoken document retrieval task due to the difficulty in extracting truly related terms from longer documents. To solve the problem, we propose a novel PRF method in which initial document retrieval is performed to search shorter documents (passages) about 30 seconds, which are simply divided according to the number of utterances, and related terms are extracted from them. We show that the proposed PRF outperforms conventional PRF on longer document retrieval tasks, and then, show the effect of combination of retrieval results obtained by the original query and expanded query by the proposed PRF. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2013-NL-211, 号 3, p. 1-8, 発行日 2013-05-16 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |