ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2024
  4. 2024-SLP-152

話者ダイアライゼーションを用いたマルチタスク学習によるEnd-to-End複数話者音声認識の改善

https://ipsj.ixsq.nii.ac.jp/records/234717
https://ipsj.ixsq.nii.ac.jp/records/234717
5dd4870c-a982-4afc-81d2-0911a5a8fd32
名前 / ファイル ライセンス アクション
IPSJ-SLP24152030.pdf IPSJ-SLP24152030.pdf (928.0 kB)
 2026年6月7日からダウンロード可能です。
Copyright (c) 2024 by the Information Processing Society of Japan
非会員:¥660, IPSJ:学会員:¥330, SLP:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2024-06-07
タイトル
タイトル 話者ダイアライゼーションを用いたマルチタスク学習によるEnd-to-End複数話者音声認識の改善
言語
言語 jpn
キーワード
主題Scheme Other
主題 ポスターセッション1
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
奈良先端科学技術大学院大学
著者所属
奈良先端科学技術大学院大学
著者名 平野, 雄太

× 平野, 雄太

平野, 雄太

Search repository
サクティ, サクリアニ

× サクティ, サクリアニ

サクティ, サクリアニ

Search repository
論文抄録
内容記述タイプ Other
内容記述 本研究では,End-to-End 複数話者音声認識モデルの認識精度改善を目的とした,話者ダイアライゼーションを用いたマルチタスク学習を提案する.エンコーダの中間層に話者ダイアライゼーションブランチを導入し,これが認識精度改善に寄与するかについて検証する.また,話者ダイアライゼーションの推定結果を考慮したエンコーダ出力を得るために,話者ダイアライゼーションの推定結果をエンコーダに入力する自己条件付けフィードバック機構を提案し,その効果についても実験的検証を行う.実験において,話者ダイアライゼーションによるマルチタスク学習と自己条件付けフィードバックを同時に用いたとき,ベースラインの認識精度からの改善が見られた.この結果から,「誰がいつ話したか」という情報が,End-to-End 複数話者音声認識モデルのエンコーダのモデリングに有効であることが示唆される.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2024-SLP-152, 号 30, p. 1-3, 発行日 2024-06-07
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8663
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 09:42:54.226146
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3