@article{oai:ipsj.ixsq.nii.ac.jp:00090268, author = {伊藤, 慶明 and 西崎, 博光 and 中川, 聖一 and 秋葉, 友良 and 河原, 達也 and 胡新輝 and 南條浩輝 and 松井, 知子 and 山下, 洋一 and 相川, 清明 and Yoshiaki, Itoh and Hiromitsu, Nishizaki and Seiichi, Nakagawa and Tomoyosi, Akiba and Tatsuya, Kawahara and Xinhui, Hu and Hiroaki, Nanjo and Tomoko, Matsui and Yoichi, Yamashita and Kiyoaki, Aikawa}, issue = {2}, journal = {情報処理学会論文誌}, month = {Feb}, note = {TRECにおいてSpoken Document Retrieval(SDR:音声ドキュメント検索)のTrackが1996年~2000年に設定され,2006年には米国国立標準技術研究所(NIST)を中心に音声中の検索語検出(Spoken Term Detection:STD)タスクが設定され,以降海外ではさかんにSDR,STDに関する研究が行われるようになった.情報処理学会音声言語情報処理研究会(SIG-SLP)で国内の音声ドキュメント処理研究の推進・活性化を目的として2006年に音声ドキュメント処理ワーキンググループを立ち上げ,これまでにSDR評価用テストコレクションの構築を進めてきた.これに続き2008年から音声中の検索語検出の評価用テストコレクションの構築を開始し,2009年10月にテストコレクションを公開した.以来,様々な研究機関で利用されている.また2011年には国立情報学研究所が主催するNTCIR-9でのdry runに用いられ,formal run用のテストコレクションへの展開も行った.本論文ではこのテストコレクション構築にあたっての方針,テストコレクションの内容,ベースライン評価結果等の分析について説明するとともに,構築したテストセットによって活性化したSTD研究の展開について述べる., Spoken Document Retrieval (SDR) was dealt with in one of tracks of TREC from 1996 to 2000. NIST supplied a task for Spoken Term Detection (STD) in 2006. Many researches have been conducted as for SDR and STD after these projects. A working group for spoken document processing of SIG-SLP (Spoken Language Processing) in IPSJ also aimed to activate the researches for spoken document processing, and developed a test collection for SDR so far. The working group started to develop a test collection for STD from 2008, and distributed the β version of the test collections in October 2009. The test collections was used for the test sets of a dry run in NTCIR-9 held by NII in 2011, and was extended to the test sets of a formal run. This paper reports the policy, the content and baseline evaluation results and their analysis of the collection in detail, and describes the research expansion by the test collections.}, pages = {471--483}, title = {音声中の検索語検出のためのテストコレクションの構築と分析}, volume = {54}, year = {2013} }