WEKO3
アイテム
知識を用いた音声認識による野球実況中継の構造化
https://ipsj.ixsq.nii.ac.jp/records/57092
https://ipsj.ixsq.nii.ac.jp/records/57092dff6804e-0b72-42b8-9bc6-c824263aa22e
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2004 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2004-12-22 | |||||||
タイトル | ||||||||
タイトル | 知識を用いた音声認識による野球実況中継の構造化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Structuring Baseball Live Game Base on Knowledge Dependent Speech Recognition | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
神戸大学大学院自然科学研究科 | ||||||||
著者所属 | ||||||||
神戸大学工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduated School of Science and Technology, Kobe University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Engineering, Kobe University | ||||||||
著者名 |
佐古, 淳
× 佐古, 淳
|
|||||||
著者名(英) |
Atsushi, Sako
× Atsushi, Sako
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本研究では,野球の実況中継に対して構造化を行うことを目的としている.構造化を行うために,大語彙連続音声認識を利用する.音声認識では,発音は似ているが意味に照らして考えればありえないような単語を認識することがある.このような単語に対しては,野球の知識を用いることで認識誤りを低減できる.また,状況依存の情報として,アナウンサーの感情も利用する.音声認識の結果を用いて構造化を行いながら,推定された情報を音声認識に利用する手法として「状態推定音声認識」の枠組みを提案する.実験により,構造化を行うために重要と考えられるキーワード正解精度が2.3%向上し,また,約73.3%の構造化正解率が得られた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The purpose of this study is to automatically structure sports live speech, especially baseball live speech using Large Vocabulary Continuous Speech Recognition System. Since it is a difficult problem to recognize baseball live speech. We propose in this paper a speech recognition method of incorporating the baseball game knowledge such as counting of inning, out, strike, ball and announcer's emotion. This method is formalized in the framework of probability theory and implemented in the conventional speech decoding (Viterbi) algorithm. This method enables to seek a word sequence as well as a structure sequence. The experimental results showed that the proposed approach improved the structuring and segmentation accuracy to 73.3% as well as keywords accuracy by 2.3%. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2004, 号 131(2004-SLP-054), p. 331-336, 発行日 2004-12-22 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |