| Item type |
SIG Technical Reports(1) |
| 公開日 |
2023-03-11 |
| タイトル |
|
|
タイトル |
自由記述文による声質制御に向けたin-the-wild文データ収集法 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
分析・生成 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
| 著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
| 著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
| 著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
| 著者名 |
渡邊, 亞椰
高道, 慎之介
齋藤, 佑樹
猿渡, 洋
|
| 著者名(英) |
Aya, Watanabe
Shinnosuke, Takamichi
Yuki, Saito
Hiroshi, Saruwatari
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,音声を人工的に合成する音声合成タスクにおける,合成音声の声質を自由記述文で制御するための文データ自動収集法を提案する.自由記述による声質制御は,従来の制御法によりも汎用かつ複雑な声質を表現でき,また,昨今の言語モデルの影響を強く享受できると期待される.提案法ではまず,音声に関連すると思われる日本語動画とそのメタデータを自動収集する.次に,ルールと機械学習に基づいて,各動画の各コメントが声質や発話スタイルを表現するか否かを識別する.本稿ではその識別結果について報告するとともに,収集したコメント群について分析する. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
| 書誌情報 |
研究報告自然言語処理(NL)
巻 2023-NL-255,
号 15,
p. 1-6,
発行日 2023-03-11
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |