ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 音声言語情報処理(SLP)
  3. 2015
  4. 2015-SLP-109

音声波形加工に基づく非母語音声の継続長補正法の評価と分析

https://ipsj.ixsq.nii.ac.jp/records/146176
https://ipsj.ixsq.nii.ac.jp/records/146176
5a6e565b-cc44-44f7-9a9a-dbc4f0e3c2b0
名前 / ファイル ライセンス アクション
IPSJ-SLP15109004.pdf IPSJ-SLP15109004.pdf (508.5 kB)
Copyright (c) 2015 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
SLP:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2015-11-25
タイトル
タイトル 音声波形加工に基づく非母語音声の継続長補正法の評価と分析
タイトル
言語 en
タイトル Evaluation and Analysis of Duration Correction for Non-Native Speech Based on Waveform Modification
言語
言語 jpn
キーワード
主題Scheme Other
主題 声質変換
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
奈良先端科学技術大学院大学情報科学研究科
著者所属
奈良先端科学技術大学院大学情報科学研究科
著者所属
奈良先端科学技術大学院大学情報科学研究科/名古屋大学情報基盤センター教育情報メディア研究部門
著者所属
奈良先端科学技術大学院大学情報科学研究科
著者所属
奈良先端科学技術大学院大学情報科学研究科
著者所属
奈良先端科学技術大学院大学情報科学研究科
著者所属(英)
en
Nara Institute of Science and Technology
著者所属(英)
en
Nara Institute of Science and Technology
著者所属(英)
en
Nara Institute of Science and Technology / Information Media Division, Information Technology Center, Nagoya University
著者所属(英)
en
Nara Institute of Science and Technology
著者所属(英)
en
Nara Institute of Science and Technology
著者所属(英)
en
Nara Institute of Science and Technology
著者名 倶羅, 真也

× 倶羅, 真也

倶羅, 真也

Search repository
高道, 慎之介

× 高道, 慎之介

高道, 慎之介

Search repository
戸田, 智基

× 戸田, 智基

戸田, 智基

Search repository
ニューピッグ, グラム

× ニューピッグ, グラム

ニューピッグ, グラム

Search repository
サクティ, サクリアニ

× サクティ, サクリアニ

サクティ, サクリアニ

Search repository
中村, 哲

× 中村, 哲

中村, 哲

Search repository
著者名(英) Shinya, Kura

× Shinya, Kura

en Shinya, Kura

Search repository
Shinnosuke, Takamichi

× Shinnosuke, Takamichi

en Shinnosuke, Takamichi

Search repository
Tomoki, Toda

× Tomoki, Toda

en Tomoki, Toda

Search repository
Graham, Neubig

× Graham, Neubig

en Graham, Neubig

Search repository
Sakriani, Sakti

× Sakriani, Sakti

en Sakriani, Sakti

Search repository
Satoshi, Nakamura

× Satoshi, Nakamura

en Satoshi, Nakamura

Search repository
論文抄録
内容記述タイプ Other
内容記述 言語学習等への応用を見据え,非母語話者により発話された音声に対して,発話リズムを補正する技術が研究されている.代表的な手法として,母語話者の音声を参照音声として,動的時間伸縮を用いて音声特徴量系列を変形することで,補正音声を合成する枠組みが提案されている.柔軟な発話リズム補正が可能となる一方で,音声分析合成処理による音質劣化は避けられない.本稿では,音声分析合成処理による音質劣化を回避する補正法として,動的時間伸縮と音声波形加工処理による発話リズム補正法を提案する.時間伸縮規則を獲得する際には,統計的声質変換を適用することで,話者性の差異が音声スペクトルパラメータに与える影響を緩和するとともに,非母語話者音声に見られる音素挿入誤りにも対処する.日本語母語話者による英語音声 (日本人英語) を用いた実験的評価から,提案法により,音質劣化を緩和しつつ,より自然な継続長を持つ英語音声を合成できることを示す.また,時間伸縮により生じる局所的な音質劣化の影響について,音声スペクトルパラメータの変調スペクトルを用いて分析する.
論文抄録(英)
内容記述タイプ Other
内容記述 There are several attempts at correcting durational patterns of non-native speech towards language learning. One of the typical approaches modifies a speech parameter sequence with Dynamic Time Warping (DTW) using native speech as the reference, generating corrected speech from the modified speech parameter sequence. Although this approach makes it possible to flexibly modify durational patterns of non-native speech, quality of the corrected speech significantly degrades due to the use of analysis-synthesis process to generate the corrected speech. In this report, we propose a method for correcting durational patterns using direct waveform modification for per forming DTW. In calculating a temporal warping function, statistical voice conversion is effectively used to reduce an adverse effect caused by speaker differences. Moreover, phoneme insertion often observed in non-native speech is also handled. We conducted an experimental evaluation using English speech read by Japanese, demonstrating that the proposed method was capable of flexibly modifying durational patterns while avoiding quality degradation caused by the analysis-synthesis process. Furthermore, waveform segments suffering from quality degradation caused by temporal warping was analyzed using the modulation spectrum of spectral parameters.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10442647
書誌情報 研究報告音声言語情報処理(SLP)

巻 2015-SLP-109, 号 4, p. 1-6, 発行日 2015-11-25
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8663
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-20 18:03:50.966792
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3