WEKO3
アイテム
重複音声のクラウド音声認識への影響評価
https://ipsj.ixsq.nii.ac.jp/records/228518
https://ipsj.ixsq.nii.ac.jp/records/2285186e3cef89-80a7-4678-b737-3c34409901c4
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Symposium(1) | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2023-10-18 | |||||||||||||
| タイトル | ||||||||||||||
| タイトル | 重複音声のクラウド音声認識への影響評価 | |||||||||||||
| 言語 | ||||||||||||||
| 言語 | jpn | |||||||||||||
| キーワード | ||||||||||||||
| 主題Scheme | Other | |||||||||||||
| 主題 | 字幕作成,重複音声 | |||||||||||||
| 資源タイプ | ||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||
| 資源タイプ | conference paper | |||||||||||||
| 著者所属 | ||||||||||||||
| 同志社大学大学院 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 同志社大学大学院 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 同志社大学 | ||||||||||||||
| 著者所属 | ||||||||||||||
| 同志社大学大学院 | ||||||||||||||
| 著者名 |
中平, 一六
× 中平, 一六
× 黒岩, 舜
× 大島, 千尋
× 小板, 隆浩
|
|||||||||||||
| 論文抄録 | ||||||||||||||
| 内容記述タイプ | Other | |||||||||||||
| 内容記述 | 本研究は,動画の字幕生成における既存システムの性能評価に焦点を当てる.特に,動画の時間長と重複音声の出現回数が性能に与える影響を詳細に調査した.分析には,Word Error Rate(WER)と BERTScore という二つの評価指標を用いた.結果として,短い動画で重複音声が多く出現する場合に性能が顕著に低下することが明らかになった.これを踏まえ,人間と機械の協働による新しい字幕生成手法を提案する.さらに,今後の研究の方向性として,新たな評価指標や重複音声の発生した時間を考慮する方法も示す.この研究は,字幕生成技術の精度向上に貢献するものであり,多くの動画コンテンツを活用する現代社会において,その重要性はますます高まっている. | |||||||||||||
| 書誌情報 |
第31回マルチメディア通信と分散処理ワークショップ論文集 p. 138-143, 発行日 2023-10-18 |
|||||||||||||
| 出版者 | ||||||||||||||
| 言語 | ja | |||||||||||||
| 出版者 | 情報処理学会 | |||||||||||||