WEKO3
アイテム
歌声識別タスクのための事前学習済み自己教師ありフロントエンドの調査
https://ipsj.ixsq.nii.ac.jp/records/226389
https://ipsj.ixsq.nii.ac.jp/records/2263894c7ccc01-d207-4892-95aa-40819ac7e5c0
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2023-06-16 | |||||||
| タイトル | ||||||||
| タイトル | 歌声識別タスクのための事前学習済み自己教師ありフロントエンドの調査 | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | ディスカッション | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 筑波大学 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| University of Tsukuba | ||||||||
| 著者名 |
山本, 雄也
× 山本, 雄也
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 歌手認識や歌声採譜,歌唱表現識別等,歌声から情報を分析する認識タスクは歌声のバリエーションの多さから深層学習等によるデータ駆動型アプローチが有効である.その一方でラベル付きのデータの不足がボトルネックとなっている.近年音声処理や音楽識別では大規模なラベルなしデータを用いて自己教師あり学習を行なったモデル(SSL モデル)を用い,それを目的タスクにおいてファインチューニングさせることにより,少ない学習データで従来の教師あり学習に匹敵する識別性能を得ることができている.そこで本発表では,各種歌声認識タスクへの SSL モデルの有効性を調査する.本発表では,初期検討として異なる 3 タスクにおいて SSL モデルの結果を比較した実験の結果を報告し,これを議論したい. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10442647 | |||||||
| 書誌情報 |
研究報告音声言語情報処理(SLP) 巻 2023-SLP-147, 号 18, p. 1-8, 発行日 2023-06-16 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 2188-8663 | |||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||