ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 論文誌(ジャーナル)
  2. Vol.61
  3. No.1

音声中の検索語検出におけるクエリの関連語を利用したリスコアリング方式

https://ipsj.ixsq.nii.ac.jp/records/202733
https://ipsj.ixsq.nii.ac.jp/records/202733
1eab3391-a3dd-4365-b71c-a788d9f45631
名前 / ファイル ライセンス アクション
IPSJ-JNL6101020.pdf IPSJ-JNL6101020.pdf (1.7 MB)
Copyright (c) 2020 by the Information Processing Society of Japan
オープンアクセス
Item type Journal(1)
公開日 2020-01-15
タイトル
タイトル 音声中の検索語検出におけるクエリの関連語を利用したリスコアリング方式
タイトル
言語 en
タイトル Rescoring by Using Words Related to a Query for Spoken Term Detection
言語
言語 jpn
キーワード
主題Scheme Other
主題 [一般論文] 音声中の検索語検出,クエリの関連語,Word Vector,リスコアリング
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_6501
資源タイプ journal article
著者所属
岩手県立大学
著者所属
岩手県立大学
著者所属
産業技術総合研究所
著者所属
京都大学学術情報メディアセンター
著者所属
岩手県立大学
著者所属(英)
en
Iwate Prefectural University
著者所属(英)
en
Iwate Prefectural University
著者所属(英)
en
National Institute of Advanced Industrial Science and Technology
著者所属(英)
en
Academic Center for Computing and Media Studies, Kyoto University
著者所属(英)
en
Iwate Prefectural University
著者名 丹治, 遥

× 丹治, 遥

丹治, 遥

Search repository
小嶋, 和徳

× 小嶋, 和徳

小嶋, 和徳

Search repository
李, 時旭

× 李, 時旭

李, 時旭

Search repository
南條, 浩輝

× 南條, 浩輝

南條, 浩輝

Search repository
伊藤, 慶明

× 伊藤, 慶明

伊藤, 慶明

Search repository
著者名(英) Haruka, Tanji

× Haruka, Tanji

en Haruka, Tanji

Search repository
Kazunori, Kojima

× Kazunori, Kojima

en Kazunori, Kojima

Search repository
Shi-Wook, Lee

× Shi-Wook, Lee

en Shi-Wook, Lee

Search repository
Hiroaki, Nanjo

× Hiroaki, Nanjo

en Hiroaki, Nanjo

Search repository
Yoshiaki, Itoh

× Yoshiaki, Itoh

en Yoshiaki, Itoh

Search repository
論文抄録
内容記述タイプ Other
内容記述 音声中で検索したいキーワードが話されている箇所を特定する音声中の検索語検出(STD:Spoken Term Detection)の研究がさかんに行われている. 検索精度向上のために,先行研究として高順位候補を含むドキュメント内のすべての候補の照合距離を有利にする方式等が 提案されている. 本論文では,クエリを含む講演内で話されるトピックの内容に関連してクエリと共起する単語をクエリの関連語と呼び,関連語は当該講演内に複数回出現すると仮定する. クエリの関連語を特定するため,本論文ではWord2vecを用いた単語の分散表現が有効と考える. 音声ドキュメントの単語認識結果中の各単語をWord Vector化し,クエリのWord Vectorと比較し,類似度を求めることでクエリの関連語を取得する. 一方,未知語(OOV:Out-of-Vocabulary)クエリは単語認識結果に出現しないためWord Vectorを算出できないため,本論文ではWeb検索を併用する方式を採用し,クエリでWeb検索し得られたテキスト中の出現単語もWord2vecに用いてクエリの意味的情報を補い,未知語クエリのWord Vectorを算出できるようにする. これにより,未知語クエリに対応させることができ,既知語(IV:In Vocabulary), 未知語いずれのクエリでも関連語を的確に求められると考える. 以上のようにして,クエリの関連語を特定し,関連語を含むドキュメント内のすべての候補の距離を有利にすることで検索精度の向上を図る. NTCIR-10,12のFormal Runの2種のテストセットを用いて評価した結果,両テストセットで検索精度が向上した. また,先行方式と併用することでさらに精度が向上し,提案方式の有効性を確認できた.
論文抄録(英)
内容記述タイプ Other
内容記述 We propose a rescoring method using words related to a query for spoken term detection (STD). In this paper, we assume that words associated with the topic in speech data and co-occurring with the query are called “words related to the query,” and that the related words appear multiple times in the speech data. To identify the words related to the query, we introduce distributed expression of words obtained by Word2vec, and first convert each word in the word recognition results of speech data into a word vector. Each word vector is then compared with a word vector of the query. Words related to the query are determined by calculating the degree of similarity between the two word vectors. However, a word vector of an out-of-vocabulary (OOV) query cannot be obtained in this manner, since OOV queries do not appear in word-recognition results. For such OOV queries, we perform a Web search using the query, whereupon texts including the query are extracted. Recognition results of the speech data and the extracted texts are then combined and used for training of Word2vec. Distances to all candidates in the document, including words related to the query, are used advantageously. Experiments are conducted to evaluate the performance of the proposed method using open test collections of the NTCIR-10 and NTCIR-12 workshops. For retrieval accuracy, an improvement of 3.2 points in mean average precision was achieved using the proposed method.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN00116647
書誌情報 情報処理学会論文誌

巻 61, 号 1, p. 103-112, 発行日 2020-01-15
ISSN
収録物識別子タイプ ISSN
収録物識別子 1882-7764
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 20:47:09.065845
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3