@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00228518, author = {中平, 一六 and 黒岩, 舜 and 大島, 千尋 and 小板, 隆浩}, book = {第31回マルチメディア通信と分散処理ワークショップ論文集}, month = {Oct}, note = {本研究は,動画の字幕生成における既存システムの性能評価に焦点を当てる.特に,動画の時間長と重複音声の出現回数が性能に与える影響を詳細に調査した.分析には,Word Error Rate(WER)と BERTScore という二つの評価指標を用いた.結果として,短い動画で重複音声が多く出現する場合に性能が顕著に低下することが明らかになった.これを踏まえ,人間と機械の協働による新しい字幕生成手法を提案する.さらに,今後の研究の方向性として,新たな評価指標や重複音声の発生した時間を考慮する方法も示す.この研究は,字幕生成技術の精度向上に貢献するものであり,多くの動画コンテンツを活用する現代社会において,その重要性はますます高まっている.}, pages = {138--143}, publisher = {情報処理学会}, title = {重複音声のクラウド音声認識への影響評価}, year = {2023} }