ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. シンポジウム
  2. シンポジウムシリーズ
  3. マルチメディア通信と分散処理ワークショップ
  4. 2024

speaker diarization の精度低下要因の考察

https://ipsj.ixsq.nii.ac.jp/records/240100
https://ipsj.ixsq.nii.ac.jp/records/240100
7a4d3280-db05-48bb-a4d5-fcac2bdfdfd8
名前 / ファイル ライセンス アクション
IPSJ-DPSWS20240034.pdf IPSJ-DPSWS20240034.pdf (929.2 kB)
 2026年10月23日からダウンロード可能です。
Copyright (c) 2024 by the Information Processing Society of Japan
非会員:¥660, IPSJ:学会員:¥330, DPS:会員:¥0, DLIB:会員:¥0
Item type Symposium(1)
公開日 2024-10-23
タイトル
タイトル speaker diarization の精度低下要因の考察
言語
言語 jpn
キーワード
主題Scheme Other
主題 speaker diarization,字幕,ASR,クラウドソーシング,音声認識
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_5794
資源タイプ conference paper
著者所属
同志社大学大学院
著者所属
同志社大学大学院
著者所属
同志社大学大学院
著者名 大島, 千尋

× 大島, 千尋

大島, 千尋

Search repository
黒岩, 舜

× 黒岩, 舜

黒岩, 舜

Search repository
小板, 隆浩

× 小板, 隆浩

小板, 隆浩

Search repository
論文抄録
内容記述タイプ Other
内容記述 近年,動画コンテンツの需要が高まり,字幕生成技術の重要性が増している.自動字幕生成において,複数話者が含まれる音声に対する字幕生成において必要となる speaker diarization の精度が低下し,話者アノテーションの品質が低下すると,字幕の品質が損なわれる問題が生じる.本研究では,話者アノテーションの品質の品質向上を目指し,speaker diarization 処理の後にクラウドソーシングを組み合わせる手法を提案する.本手法では,speaker diarization の誤ラベリングが発生しやすい時刻を音声中から自動で判定し,該当部分をクラウドソーシングによって修正することで,全体の話者アノテーションの精度向上を目指す.本稿では,特に発話の重なり,発話の長さ,音声エネルギーの変化,感情分析を基に,誤ラベリング発生時刻の予測の可能性を検証した.
書誌情報 第32回マルチメディア通信と分散処理ワークショップ論文集

p. 212-216, 発行日 2024-10-23
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 08:05:11.613719
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3