| Item type |
SIG Technical Reports(1) |
| 公開日 |
2024-03-02 |
| タイトル |
|
|
タイトル |
サムネイル画像を活用した音楽キャプション生成法 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
学習データ |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
北海道大学 |
| 著者所属 |
|
|
|
北海道大学 |
| 著者所属 |
|
|
|
奈良先端科学技術大学院大学 |
| 著者所属 |
|
|
|
奈良先端科学技術大学院大学 |
| 著者名 |
元満, 丈寛
林, 克彦
坂井, 優介
上垣外, 英剛
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,自然言語を用いた音楽検索・生成モデルに関する研究が盛んに行われている.これらモデルの学習や評価には,音楽に関する情報を自然言語の文章形式で記述した説明文(音楽キャプション)が必要となるが,規模の大きな公開データはほとんど存在しない.特に,自然言語による音楽の説明記述として,聴きたいシチュエーションや季節等の非音楽的なアスペクト情報は重要であるが,このようなアスペクトが記述された音楽キャプションデータは少ない.この問題に対処するため,本研究ではサムネイル画像から想起される非音楽的なアスペクト(聴きたいシチュエーションや時間,季節,聴いた時の感情)を付与した音楽キャプションデータの生成法を提案し,人手評価によって提案手法の有効性を確認した.また,約 36 万の非音楽的なアスペクトが付与された,学習用と評価用の音楽キャプションデータセットを作成した.作成したデータセットを用いて音楽検索モデルを学習し,検索タスクにおいて有効性を確認した. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10438388 |
| 書誌情報 |
研究報告音楽情報科学(MUS)
巻 2024-MUS-139,
号 12,
p. 1-8,
発行日 2024-03-02
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8752 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |