WEKO3
アイテム
「歌う雑音」:Phantom Skeleton方式による多層動的バンドノイズ音声
https://ipsj.ixsq.nii.ac.jp/records/234661
https://ipsj.ixsq.nii.ac.jp/records/2346613aa6d40b-f0ad-4f8c-8da7-6258027dea34
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2026年6月7日からダウンロード可能です。
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
非会員:¥660, IPSJ:学会員:¥330, MUS:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2024-06-07 | |||||||||
タイトル | ||||||||||
タイトル | 「歌う雑音」:Phantom Skeleton方式による多層動的バンドノイズ音声 | |||||||||
タイトル | ||||||||||
言語 | en | |||||||||
タイトル | “Singing Noise”: Multilayer Dynamic Band Noise Speech with Phantom Skeleton Method | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
キーワード | ||||||||||
主題Scheme | Other | |||||||||
主題 | ポスターセッション2 | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
資源タイプ | technical report | |||||||||
著者所属 | ||||||||||
大学入試センター研究開発部 | ||||||||||
著者所属 | ||||||||||
明治大学総合数理学部 | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
Research Division, National Center for University Entrance Examinasions | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
School of Interdisciplinary Mathematical Sciences, Meiji University | ||||||||||
著者名 |
内田, 照久
× 内田, 照久
× 森勢, 将雅
|
|||||||||
論文抄録 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | 音の高さの知覚を説明するためのピッチ知覚の聴覚モデルが提案されている.そこでは,音の時間的な周期性が重要だとする時間説と,高調波成分を検出する感覚器に軸足を置く周波数説(場所説)とが,長年,議論を戦わせてきた.今回,本研究では声のピッチ知覚の研究のための実験用音声の生成を試みた.音声分析合成 vocoder: WORLD を改変し,通常音声から抽出したスペクトルを白色雑音で駆動した多層動的バンドノイズ音声を生成した.これは周期性が存在しない雑音であるが,調波構造状のスペクトルを備えた動的な帯域雑音となる.評価実験で素材に歌声を用いて,(1) 単純再合成音声,(2) スペクトル包絡を雑音駆動した疑似ささやき声,(3) 調波構造状の多層動的バンドノイズ音声,(4) 基本周波数を移調した歌声を元にした多層動的バンドノイズ音声を準備した.そして,聴覚実験によって調波構造状のエネルギーの集中からピッチを感じるかどうか検証した. | |||||||||
論文抄録(英) | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | An auditory model of pitch perception has been proposed to explain the perception of sound pitch. For decades, a significant debate has raged between the temporal theory, which asserts the temporal periodicity of sound as crucial, and the frequency theory (place theory), which is grounded in the sensory organs that detect harmonic components. In this study, we attempted to generate experimental voices to study voice pitch perception. A voice analysis synthesis vocoder, WORLD, was modified to generate a multilayer dynamic band noise voice with a spectrum extracted from ordinary speech and driven by white noise. This noise has no periodicity, but a dynamic band noise with a harmonic structure-like spectrum. In the evaluation experiment, we used singing voices as materials. We prepared (1) a simple resynthesized voice, (2) a pseudo-whispering voice with noise-vocoded spectral envelope, (3) a multilayered dynamic band noise voice with the harmonic structure preserved, and (4) a multilayered dynamic band noise voice based on singing voices transposed by a constant multiplication of the fundamental frequency. Subsequently, we conducted auditory experiments with the aim of confirming whether pitch perception is influenced by the concentration of energy in the harmonic structure. | |||||||||
書誌レコードID | ||||||||||
収録物識別子タイプ | NCID | |||||||||
収録物識別子 | AN10438388 | |||||||||
書誌情報 |
研究報告音楽情報科学(MUS) 巻 2024-MUS-140, 号 49, p. 1-7, 発行日 2024-06-07 |
|||||||||
ISSN | ||||||||||
収録物識別子タイプ | ISSN | |||||||||
収録物識別子 | 2188-8752 | |||||||||
Notice | ||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
出版者 | ||||||||||
言語 | ja | |||||||||
出版者 | 情報処理学会 |