ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2024
  4. 2024-SLP-152

「歌う雑音」:Phantom Skeleton方式による多層動的バンドノイズ音声

https://ipsj.ixsq.nii.ac.jp/records/234736
https://ipsj.ixsq.nii.ac.jp/records/234736
ac92dc53-2e08-42ad-a4cf-24e9225b45fa
名前 / ファイル ライセンス アクション
IPSJ-SLP24152049.pdf IPSJ-SLP24152049.pdf (2.3 MB)
 2026年6月7日からダウンロード可能です。
Copyright (c) 2024 by the Information Processing Society of Japan
非会員:¥660, IPSJ:学会員:¥330, SLP:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2024-06-07
タイトル
タイトル 「歌う雑音」:Phantom Skeleton方式による多層動的バンドノイズ音声
タイトル
言語 en
タイトル “Singing Noise”: Multilayer Dynamic Band Noise Speech with Phantom Skeleton Method
言語
言語 jpn
キーワード
主題Scheme Other
主題 ポスターセッション2
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
大学入試センター研究開発部
著者所属
明治大学総合数理学部
著者所属(英)
en
Research Division, National Center for University Entrance Examinasions
著者所属(英)
en
School of Interdisciplinary Mathematical Sciences, Meiji University
著者名 内田, 照久

× 内田, 照久

内田, 照久

Search repository
森勢, 将雅

× 森勢, 将雅

森勢, 将雅

Search repository
論文抄録
内容記述タイプ Other
内容記述 音の高さの知覚を説明するためのピッチ知覚の聴覚モデルが提案されている.そこでは,音の時間的な周期性が重要だとする時間説と,高調波成分を検出する感覚器に軸足を置く周波数説(場所説)とが,長年,議論を戦わせてきた.今回,本研究では声のピッチ知覚の研究のための実験用音声の生成を試みた.音声分析合成 vocoder: WORLD を改変し,通常音声から抽出したスペクトルを白色雑音で駆動した多層動的バンドノイズ音声を生成した.これは周期性が存在しない雑音であるが,調波構造状のスペクトルを備えた動的な帯域雑音となる.評価実験で素材に歌声を用いて,(1) 単純再合成音声,(2) スペクトル包絡を雑音駆動した疑似ささやき声,(3) 調波構造状の多層動的バンドノイズ音声,(4) 基本周波数を移調した歌声を元にした多層動的バンドノイズ音声を準備した.そして,聴覚実験によって調波構造状のエネルギーの集中からピッチを感じるかどうか検証した.
論文抄録(英)
内容記述タイプ Other
内容記述 An auditory model of pitch perception has been proposed to explain the perception of sound pitch. For decades, a significant debate has raged between the temporal theory, which asserts the temporal periodicity of sound as crucial, and the frequency theory (place theory), which is grounded in the sensory organs that detect harmonic components. In this study, we attempted to generate experimental voices to study voice pitch perception. A voice analysis synthesis vocoder, WORLD, was modified to generate a multilayer dynamic band noise voice with a spectrum extracted from ordinary speech and driven by white noise. This noise has no periodicity, but a dynamic band noise with a harmonic structure-like spectrum. In the evaluation experiment, we used singing voices as materials. We prepared (1) a simple resynthesized voice, (2) a pseudo-whispering voice with noise-vocoded spectral envelope, (3) a multilayered dynamic band noise voice with the harmonic structure preserved, and (4) a multilayered dynamic band noise voice based on singing voices transposed by a constant multiplication of the fundamental frequency. Subsequently, we conducted auditory experiments with the aim of confirming whether pitch perception is influenced by the concentration of energy in the harmonic structure.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2024-SLP-152, 号 49, p. 1-7, 発行日 2024-06-07
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8663
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 09:42:31.701439
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3