{"created":"2025-01-19T01:25:49.825330+00:00","updated":"2025-01-19T12:29:44.244529+00:00","metadata":{"_oai":{"id":"oai:ipsj.ixsq.nii.ac.jp:00226377","sets":["1164:5159:11151:11283"]},"path":["11283"],"owner":"44499","recid":"226377","title":["ChatGPT-EDSS: ChatGPT由来のContext Word Embeddingから学習される共感的対話音声合成モデル"],"pubdate":{"attribute_name":"公開日","attribute_value":"2023-06-16"},"_buckets":{"deposit":"2cee700c-9082-43c5-8298-d018f55f8e23"},"_deposit":{"id":"226377","pid":{"type":"depid","value":"226377","revision_id":0},"owners":[44499],"status":"published","created_by":44499},"item_title":"ChatGPT-EDSS: ChatGPT由来のContext Word Embeddingから学習される共感的対話音声合成モデル","author_link":["600905","600902","600904","600898","600906","600899","600897","600901","600903","600900"],"item_titles":{"attribute_name":"タイトル","attribute_value_mlt":[{"subitem_title":"ChatGPT-EDSS: ChatGPT由来のContext Word Embeddingから学習される共感的対話音声合成モデル"}]},"item_keyword":{"attribute_name":"キーワード","attribute_value_mlt":[{"subitem_subject":"一般発表","subitem_subject_scheme":"Other"}]},"item_type_id":"4","publish_date":"2023-06-16","item_4_text_3":{"attribute_name":"著者所属","attribute_value_mlt":[{"subitem_text_value":"東京大学"},{"subitem_text_value":"東京大学"},{"subitem_text_value":"東京大学"},{"subitem_text_value":"LINE株式会社"},{"subitem_text_value":"東京大学"}]},"item_language":{"attribute_name":"言語","attribute_value_mlt":[{"subitem_language":"jpn"}]},"item_publisher":{"attribute_name":"出版者","attribute_value_mlt":[{"subitem_publisher":"情報処理学会","subitem_publisher_language":"ja"}]},"publish_status":"0","weko_shared_id":-1,"item_file_price":{"attribute_name":"Billing file","attribute_type":"file","attribute_value_mlt":[{"url":{"url":"https://ipsj.ixsq.nii.ac.jp/record/226377/files/IPSJ-SLP23147006.pdf","label":"IPSJ-SLP23147006.pdf"},"date":[{"dateType":"Available","dateValue":"2025-06-16"}],"format":"application/pdf","billing":["billing_file"],"filename":"IPSJ-SLP23147006.pdf","filesize":[{"value":"1.1 MB"}],"mimetype":"application/pdf","priceinfo":[{"tax":["include_tax"],"price":"660","billingrole":"5"},{"tax":["include_tax"],"price":"330","billingrole":"6"},{"tax":["include_tax"],"price":"0","billingrole":"22"},{"tax":["include_tax"],"price":"0","billingrole":"44"}],"accessrole":"open_date","version_id":"879727ee-508e-4c7e-a569-69ca7514ec12","displaytype":"detail","licensetype":"license_note","license_note":"Copyright (c) 2023 by the Information Processing Society of Japan"}]},"item_4_creator_5":{"attribute_name":"著者名","attribute_type":"creator","attribute_value_mlt":[{"creatorNames":[{"creatorName":"齋藤, 佑樹"}],"nameIdentifiers":[{}]},{"creatorNames":[{"creatorName":"高道, 慎之介"}],"nameIdentifiers":[{}]},{"creatorNames":[{"creatorName":"飯森, 英治"}],"nameIdentifiers":[{}]},{"creatorNames":[{"creatorName":"橘, 健太郎"}],"nameIdentifiers":[{}]},{"creatorNames":[{"creatorName":"猿渡, 洋"}],"nameIdentifiers":[{}]}]},"item_4_creator_6":{"attribute_name":"著者名(英)","attribute_type":"creator","attribute_value_mlt":[{"creatorNames":[{"creatorName":"Yuki, Saito","creatorNameLang":"en"}],"nameIdentifiers":[{}]},{"creatorNames":[{"creatorName":"Shinnosuke, Takamichi","creatorNameLang":"en"}],"nameIdentifiers":[{}]},{"creatorNames":[{"creatorName":"Eiji, Iimori","creatorNameLang":"en"}],"nameIdentifiers":[{}]},{"creatorNames":[{"creatorName":"Kentaro, Tachibana","creatorNameLang":"en"}],"nameIdentifiers":[{}]},{"creatorNames":[{"creatorName":"Hiroshi, Saruwatari","creatorNameLang":"en"}],"nameIdentifiers":[{}]}]},"item_4_source_id_9":{"attribute_name":"書誌レコードID","attribute_value_mlt":[{"subitem_source_identifier":"AN10442647","subitem_source_identifier_type":"NCID"}]},"item_4_textarea_12":{"attribute_name":"Notice","attribute_value_mlt":[{"subitem_textarea_value":"SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc."}]},"item_resource_type":{"attribute_name":"資源タイプ","attribute_value_mlt":[{"resourceuri":"http://purl.org/coar/resource_type/c_18gh","resourcetype":"technical report"}]},"item_4_source_id_11":{"attribute_name":"ISSN","attribute_value_mlt":[{"subitem_source_identifier":"2188-8663","subitem_source_identifier_type":"ISSN"}]},"item_4_description_7":{"attribute_name":"論文抄録","attribute_value_mlt":[{"subitem_description":"本稿では，ChatGPT を活用して対話の文脈情報を自動的に抽出する共感的対話音声合成 (empathetic dialogue speech synthesis: EDSS) の手法である “ChatGPT-EDSS” を提案する．ChatGPT は，入力プロンプトの内容と意図を深く理解し，ユーザからの要求に対して適切に応答可能な最先端の AI チャットボットの 1 つである．我々は ChatGPT の文章読解力に着目し，対話相手の感情を考慮して共感的な音声を生成する EDSS タスクに ChatGPT を導入する．提案法である ChatGPT-EDSS では，まず ChatGPT に対話履歴のテキストをプロンプトとして与え，各話者の発話に対して意図，感情，発話スタイルを表現する 3 つの語（ChatGPT 文脈語）を回答させる．次に，得られた文脈語の word embedding で deep neural network (DNN) ベースの EDSS モデルを条件付けして学習し，ChatGPT 由来の文脈語で韻律を制御可能な音声合成を実現する．実験的評価の結果から，人手でアノテーションされた感情ラベルや，対話履歴から DNN で抽出された文脈情報で EDSS モデルを条件付けする従来法と同程度の合成音声品質を提案法が達成できることを示す．本研究で収集した ChatGPT 文脈語は，我々のプロジェクトページ https://sarulab-speech.github.io/demo_ChatGPT_EDSS/ で公開している．","subitem_description_type":"Other"}]},"item_4_biblio_info_10":{"attribute_name":"書誌情報","attribute_value_mlt":[{"bibliographicPageEnd":"6","bibliographic_titles":[{"bibliographic_title":"研究報告音声言語情報処理（SLP）"}],"bibliographicPageStart":"1","bibliographicIssueDates":{"bibliographicIssueDate":"2023-06-16","bibliographicIssueDateType":"Issued"},"bibliographicIssueNumber":"6","bibliographicVolumeNumber":"2023-SLP-147"}]},"relation_version_is_last":true,"weko_creator_id":"44499"},"id":226377,"links":{}}