<?xml version='1.0' encoding='UTF-8'?>
<OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
  <responseDate>2026-04-11T21:39:37Z</responseDate>
  <request identifier="oai:ipsj.ixsq.nii.ac.jp:00210260" metadataPrefix="jpcoar_1.0" verb="GetRecord">https://ipsj.ixsq.nii.ac.jp/oai</request>
  <GetRecord>
    <record>
      <header>
        <identifier>oai:ipsj.ixsq.nii.ac.jp:00210260</identifier>
        <datestamp>2025-01-19T18:12:45Z</datestamp>
        <setSpec>1164:5336:10549:10550</setSpec>
      </header>
      <metadata>
        <jpcoar:jpcoar xmlns:datacite="https://schema.datacite.org/meta/kernel-4/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcndl="http://ndl.go.jp/dcndl/terms/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:jpcoar="https://github.com/JPCOAR/schema/blob/master/1.0/" xmlns:oaire="http://namespace.openaire.eu/schema/oaire/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rioxxterms="http://www.rioxx.net/schema/v2.0/rioxxterms/" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns="https://github.com/JPCOAR/schema/blob/master/1.0/" xsi:schemaLocation="https://github.com/JPCOAR/schema/blob/master/1.0/jpcoar_scm.xsd">
          <dc:title>合成音声歌唱のポルタメントの統計的性質に基づくLSTMに入力する特徴量の検討</dc:title>
          <jpcoar:creator>
            <jpcoar:creatorName>田中, 瑞穂</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:creator>
            <jpcoar:creatorName>竹川, 佳成</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:creator>
            <jpcoar:creatorName>平田, 圭二</jpcoar:creatorName>
          </jpcoar:creator>
          <datacite:description descriptionType="Other">近年，音声合成ソフトによる歌唱を用いた楽曲が増加している．それに伴い，人間歌唱を模倣する歌声自動合成システムが開発されている．しかし，合成音声歌唱には，歌唱の平坦さを軽減するためにユーザが生み出した固有の歌唱技術（急なピッチ変化や短いヴィブラートなど）が存在する．これらの歌唱技術は人間が歌唱することが想定されていないため，従来の人間歌唱を対象とした歌唱モデルでは効率よく学習，推定することが難しいと考えられる．そこで本研究では，UTAU のポルタメントについて統計を取り，その統計結果から特徴量を検討し，音声合成歌唱の表情付けのためのパラメータを LSTM を使用して学習，推定する．ポルタメントの統計では，各要素ごとのポルタメントの出現率とポルタメントの要素の傾向について調べた．その結果，音のタイプ，音高，音価がポルタメントの出現率に影響を与えていることがわかった．また，ポルタメントに用いる線の形状は重要視されていなかった．これらの統計的性質の観察結果から，学習に用いる特徴量を決定し，LSTM モデルで学習，推定を行う．このモデルを使用してポルタメントを付与した音声と従来手法で付与した音声の比較実験を行ったところ，抑揚の有無と歌唱の自然さ共に従来手法の方が高い評価を得た．しかし，一部楽曲の歌唱の自然さは，提案手法の方が高い評価を得た．</datacite:description>
          <dc:publisher xml:lang="ja">情報処理学会</dc:publisher>
          <datacite:date dateType="Issued">2021-03-09</datacite:date>
          <dc:language>jpn</dc:language>
          <dc:type rdf:resource="http://purl.org/coar/resource_type/c_18gh">technical report</dc:type>
          <jpcoar:identifier identifierType="URI">https://ipsj.ixsq.nii.ac.jp/records/210260</jpcoar:identifier>
          <jpcoar:sourceIdentifier identifierType="ISSN">2188-8914</jpcoar:sourceIdentifier>
          <jpcoar:sourceIdentifier identifierType="NCID">AA12049625</jpcoar:sourceIdentifier>
          <jpcoar:sourceTitle>研究報告エンタテインメントコンピューティング（EC）</jpcoar:sourceTitle>
          <jpcoar:volume>2021-EC-59</jpcoar:volume>
          <jpcoar:issue>25</jpcoar:issue>
          <jpcoar:pageStart>1</jpcoar:pageStart>
          <jpcoar:pageEnd>8</jpcoar:pageEnd>
          <jpcoar:file>
            <jpcoar:URI label="IPSJ-EC21059025.pdf">https://ipsj.ixsq.nii.ac.jp/record/210260/files/IPSJ-EC21059025.pdf</jpcoar:URI>
            <jpcoar:mimeType>application/pdf</jpcoar:mimeType>
            <jpcoar:extent>1.5 MB</jpcoar:extent>
            <datacite:date dateType="Available">2023-03-09</datacite:date>
          </jpcoar:file>
        </jpcoar:jpcoar>
      </metadata>
    </record>
  </GetRecord>
</OAI-PMH>
