@techreport{oai:ipsj.ixsq.nii.ac.jp:00056853, author = {伊藤, 克亘 and 相川, 清明 and 秋葉, 友良 and 伊藤, 慶明 and 河原, 達也 and 南條浩輝 and 西崎, 博光 and 安田, 宜仁 and 山下, 洋一 and Katunobu, ITOU and Kiyoaki, AIKAWA and Tomoyosi, AKIBA and Yoshiaki, ITOH and Tatsuya, KAWAHARA and Hiroaki, NANJO and Hiromitsu, NISHIZAKI and Norihito, YASUDA and Yoichi, YAMASHITA}, issue = {136(2006-SLP-064)}, month = {Dec}, note = {情報処理学会音声言語情報処理研究会の音声ドキュメント処理ワーキンググループの活動の一環として行っている、音声ドキュメント検索評価用テストコレクションについて報告する。試作したテストコレクションは、対象を日本語話し言葉コーパス(CSJ)の講演音声データならびに書き起こしデータとし、テキストクエリとそれに対する正解データ、ならびに音声認識結果から構成される。答が1分前後の音声区間となり、5区間程度の正解が得られるようなクエリを目標に作成して、正解判定をしたところ100件程度作成したクエリのうち、33件のクエリが条件を満たしていた。, The Spoken Document Processing Working Group, Which is organized in special interest group of spoken language processing, information processing society of Japan, are developing a test collection for evaluation of spoken document retrieval system. A prototype of the test collection consists of a set of textual queries, relevant segment lists, and the transcription by the automatic speech recognition system to retrieve from the Corpus of Spontaneous Japanese (CSJ). As a result to design qureies according to the criteria that a query should have more than five relevant segments that consist from about one minute speech segment, thirty three queries were obtained among about 100 queries.}, title = {音声ドキュメント検索評価のためのテストコレクションの試作}, year = {2006} }