WEKO3
アイテム
speaker diarization の精度低下要因の考察
https://ipsj.ixsq.nii.ac.jp/records/240100
https://ipsj.ixsq.nii.ac.jp/records/2401007a4d3280-db05-48bb-a4d5-fcac2bdfdfd8
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2026年10月23日からダウンロード可能です。
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
非会員:¥660, IPSJ:学会員:¥330, DPS:会員:¥0, DLIB:会員:¥0 |
Item type | Symposium(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2024-10-23 | |||||||||||
タイトル | ||||||||||||
タイトル | speaker diarization の精度低下要因の考察 | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | speaker diarization,字幕,ASR,クラウドソーシング,音声認識 | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||
資源タイプ | conference paper | |||||||||||
著者所属 | ||||||||||||
同志社大学大学院 | ||||||||||||
著者所属 | ||||||||||||
同志社大学大学院 | ||||||||||||
著者所属 | ||||||||||||
同志社大学大学院 | ||||||||||||
著者名 |
大島, 千尋
× 大島, 千尋
× 黒岩, 舜
× 小板, 隆浩
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 近年,動画コンテンツの需要が高まり,字幕生成技術の重要性が増している.自動字幕生成において,複数話者が含まれる音声に対する字幕生成において必要となる speaker diarization の精度が低下し,話者アノテーションの品質が低下すると,字幕の品質が損なわれる問題が生じる.本研究では,話者アノテーションの品質の品質向上を目指し,speaker diarization 処理の後にクラウドソーシングを組み合わせる手法を提案する.本手法では,speaker diarization の誤ラベリングが発生しやすい時刻を音声中から自動で判定し,該当部分をクラウドソーシングによって修正することで,全体の話者アノテーションの精度向上を目指す.本稿では,特に発話の重なり,発話の長さ,音声エネルギーの変化,感情分析を基に,誤ラベリング発生時刻の予測の可能性を検証した. | |||||||||||
書誌情報 |
第32回マルチメディア通信と分散処理ワークショップ論文集 p. 212-216, 発行日 2024-10-23 |
|||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |