Visual onoma-to-wave：画像オノマトペと音源画像を利用した環境音合成の提案

大中, 緋慧; 高道, 慎之介; 井本, 桂右; 岡本, 悠希; 藤井, 一貴; 猿渡, 洋; Hien, Ohnaka; Shinnnosuke, Takamichi; Keisuke, Imoto; Yuki, Okamoto; Kazuki, Fujii; Hiroshi, Saruwatari

WEKO3

インデックスツリー

RootNode

アイテム

Visual onoma-to-wave：画像オノマトペと音源画像を利用した環境音合成の提案

https://ipsj.ixsq.nii.ac.jp/records/224430

名前 / ファイル	ライセンス	アクション
IPSJ-SLP23146033.pdf (2.0 MB)	Copyright (c) 2023 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
SLP:会員：¥0, DLIB:会員：¥0

Item type

SIG Technical Reports(1)

公開日

2023-02-21

タイトル

Visual onoma-to-wave：画像オノマトペと音源画像を利用した環境音合成の提案

言語

jpn

キーワード

主題Scheme

Other

主題

SP-EA:音響・モデル

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_18gh

資源タイプ

technical report

著者所属

徳山工業高等専門学校

著者所属

東京大学

著者所属

同志社大学

著者所属

立命館大学

著者所属

東京大学

著者所属

東京大学

著者所属(英)

National Institute of Technology, Tokuyama College

著者所属(英)

The University of Tokyo

著者所属(英)

Doshisha University

著者所属(英)

Ritsumeikan University

著者所属(英)

The University of Tokyo

著者所属(英)

The University of Tokyo

著者名

大中, 緋慧
高道, 慎之介
井本, 桂右
岡本, 悠希
藤井, 一貴
猿渡, 洋

著者名(英)

Hien, Ohnaka
Shinnnosuke, Takamichi
Keisuke, Imoto
Yuki, Okamoto
Kazuki, Fujii
Hiroshi, Saruwatari

論文抄録

内容記述タイプ

Other

内容記述

オノマトペとは，音の構造を模倣する文字表現，つまり音の文字表現である．この観点から，所望のオノマトペから環境音を合成する Onoma-to-wave が提案されている．他方，オノマトペには漫画や広告，バーチャルリアリティにおける音の視覚的表現（画像オノマトペ）がある．画像オノマトペには，画像の伸縮などの文字だけでは表現できない表現が含まれており，この表現を用いることでより多様な音の合成が期待できる．そこで本研究は，画像オノマトペから環境音を合成する Visual onoma-to-wave を提案する．本手法は，画像オノマトペに含まれる視覚表現のみならず，環境音源の視覚表現（音源画像）を補助情報として，環境音を合成する．また本論文では，オノマトペの反復表現に着目したデータ拡張手法を提案し，より多様な環境音合成を可能にする．実験評価の結果から，画像オノマトペと音源画像から多様な環境音を合成できることが示す．

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN10442647

書誌情報

研究報告音声言語情報処理（SLP）

巻 2023-SLP-146, 号 33, p. 1-6, 発行日 2023-02-21

ISSN

収録物識別子タイプ

ISSN

収録物識別子

2188-8663

Notice

SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-19 13:09:15.639593

Show All versions

Cite as

大中, 緋慧, 高道, 慎之介, 井本, 桂右, 岡本, 悠希, 藤井, 一貴, 猿渡, 洋, 2023, Visual onoma-to-wave：画像オノマトペと音源画像を利用した環境音合成の提案: 情報処理学会, 1–6 p.

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

Visual onoma-to-wave：画像オノマトペと音源画像を利用した環境音合成の提案

× 大中, 緋慧

× 高道, 慎之介

× 井本, 桂右

× 岡本, 悠希

× 藤井, 一貴

× 猿渡, 洋

× Hien, Ohnaka

× Shinnnosuke, Takamichi

× Keisuke, Imoto

× Yuki, Okamoto

× Kazuki, Fujii

× Hiroshi, Saruwatari

Versions

Share

Cite as

エクスポート