WEKO3
アイテム
「キミは私の声,好きかな?」大規模主観評価による声質好感度コーパスの構築とその分析
https://ipsj.ixsq.nii.ac.jp/records/234694
https://ipsj.ixsq.nii.ac.jp/records/234694e2899bd0-4f66-4b2f-b0b3-4ef9d38bd87c
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
2026年6月7日からダウンロード可能です。
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
| 非会員:¥660, IPSJ:学会員:¥330, SLP:会員:¥0, DLIB:会員:¥0 | ||
| Item type | SIG Technical Reports(1) | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2024-06-07 | |||||||||||
| タイトル | ||||||||||||
| タイトル | 「キミは私の声,好きかな?」大規模主観評価による声質好感度コーパスの構築とその分析 | |||||||||||
| 言語 | ||||||||||||
| 言語 | jpn | |||||||||||
| キーワード | ||||||||||||
| 主題Scheme | Other | |||||||||||
| 主題 | ポスターセッション1 | |||||||||||
| 資源タイプ | ||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
| 資源タイプ | technical report | |||||||||||
| 著者所属 | ||||||||||||
| 産業技術総合研究所 | ||||||||||||
| 著者所属 | ||||||||||||
| 東京大学/現在,日本電信電話株式会社 | ||||||||||||
| 著者所属 | ||||||||||||
| 東京大学/現在,慶應義塾大学 | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| National Institute of Advanced Industrial Science and Technology (AIST) | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| The University of Tokyo / Presently with NTT Corporation | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| The University of Tokyo / Presently with Keio University | ||||||||||||
| 著者名 |
須田, 仁志
× 須田, 仁志
× 渡邊, 亞椰
× 高道, 慎之介
|
|||||||||||
| 論文抄録 | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | 本研究では,多様な声質の音声に対して好感度の評点を与えたコーパス「CocoNut-Humoresque」を,大規模な主観評価実験により構築した.音声アナウンスや対話システムなどにおいて合成音声を利用する際には,ターゲットとなる聴取者にとって好ましい音声のデザインが有効である.本研究では,885 人の聴取者に各 30 音声を聴取させ,総じて 1800 音声に対して声質にもとづく好感度の評点を収集した.話者だけでなく聴取者による好感度への影響を評価するため,聴取者に性別,年齢,好みの YouTube 動画について回答させ,コーパスとして整備した.したがって本コーパスは,話者および聴取者の両側面による影響を考慮した,声質好感度の分析や推定システムの実現に貢献する.本稿では,コーパスの構築手法およびこれを用いた分析について述べ,話者および聴取者の性別や年齢に応じた好感度の傾向,また基本周波数や話者表現であるx-vectorと好感度との関係を明らかにする. | |||||||||||
| 書誌レコードID | ||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||
| 収録物識別子 | AN10442647 | |||||||||||
| 書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2024-SLP-152, 号 7, p. 1-9, 発行日 2024-06-07 |
|||||||||||
| ISSN | ||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||
| 収録物識別子 | 2188-8663 | |||||||||||
| Notice | ||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
| 出版者 | ||||||||||||
| 言語 | ja | |||||||||||
| 出版者 | 情報処理学会 | |||||||||||