ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音楽情報科学(MUS)
  3. 2023
  4. 2023-MUS-137

ChatGPT-EDSS: ChatGPT由来のContext Word Embeddingから学習される共感的対話音声合成モデル

https://ipsj.ixsq.nii.ac.jp/records/226310
https://ipsj.ixsq.nii.ac.jp/records/226310
b4149d90-b57b-4787-a50d-310a3c471f23
名前 / ファイル ライセンス アクション
IPSJ-MUS23137006.pdf IPSJ-MUS23137006.pdf (1.1 MB)
 2025年6月16日からダウンロード可能です。
Copyright (c) 2023 by the Information Processing Society of Japan
非会員:¥660, IPSJ:学会員:¥330, MUS:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2023-06-16
タイトル
タイトル ChatGPT-EDSS: ChatGPT由来のContext Word Embeddingから学習される共感的対話音声合成モデル
言語
言語 jpn
キーワード
主題Scheme Other
主題 一般発表
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
東京大学
著者所属
東京大学
著者所属
東京大学
著者所属
LINE株式会社
著者所属
東京大学
著者名 齋藤, 佑樹

× 齋藤, 佑樹

齋藤, 佑樹

Search repository
高道, 慎之介

× 高道, 慎之介

高道, 慎之介

Search repository
飯森, 英治

× 飯森, 英治

飯森, 英治

Search repository
橘, 健太郎

× 橘, 健太郎

橘, 健太郎

Search repository
猿渡, 洋

× 猿渡, 洋

猿渡, 洋

Search repository
著者名(英) Yuki, Saito

× Yuki, Saito

en Yuki, Saito

Search repository
Shinnosuke, Takamichi

× Shinnosuke, Takamichi

en Shinnosuke, Takamichi

Search repository
Eiji, Iimori

× Eiji, Iimori

en Eiji, Iimori

Search repository
Kentaro, Tachibana

× Kentaro, Tachibana

en Kentaro, Tachibana

Search repository
Hiroshi, Saruwatari

× Hiroshi, Saruwatari

en Hiroshi, Saruwatari

Search repository
論文抄録
内容記述タイプ Other
内容記述 本稿では,ChatGPT を活用して対話の文脈情報を自動的に抽出する共感的対話音声合成 (empathetic dialogue speech synthesis: EDSS) の手法である “ChatGPT-EDSS” を提案する.ChatGPT は,入力プロンプトの内容と意図を深く理解し,ユーザからの要求に対して適切に応答可能な最先端の AI チャットボットの 1 つである.我々は ChatGPT の文章読解力に着目し,対話相手の感情を考慮して共感的な音声を生成する EDSS タスクに ChatGPT を導入する.提案法である ChatGPT-EDSS では,まず ChatGPT に対話履歴のテキストをプロンプトとして与え,各話者の発話に対して意図,感情,発話スタイルを表現する 3 つの語(ChatGPT 文脈語)を回答させる.次に,得られた文脈語の word embedding で deep neural network (DNN) ベースの EDSS モデルを条件付けして学習し,ChatGPT 由来の文脈語で韻律を制御可能な音声合成を実現する.実験的評価の結果から,人手でアノテーションされた感情ラベルや,対話履歴から DNN で抽出された文脈情報で EDSS モデルを条件付けする従来法と同程度の合成音声品質を提案法が達成できることを示す.本研究で収集した ChatGPT 文脈語は,我々のプロジェクトページ https://sarulab-speech.github.io/demo_ChatGPT_EDSS/ で公開している.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10438388
書誌情報 研究報告音楽情報科学(MUS)

巻 2023-MUS-137, 号 6, p. 1-6, 発行日 2023-06-16
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8752
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 12:31:06.133378
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3