2024-03-28T23:09:58Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001540282023-04-27T10:00:04Z01164:05064:08574:08575
基本周波数推定法の性能を概観するフレームワークの試作Prototype of a framework for overviewing the performance of F0 estimatorsjpn音楽の推定・識別http://id.nii.ac.jp/1001/00153994/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=154028&item_no=1&attribute_id=1&file_no=1Copyright (c) 2016 by the Information Processing Society of Japan山梨大学和歌山大学森勢, 将雅河原, 英紀本稿では,基本周波数 (F0) 推定法の性能を概観するためのフレームワーク TUSK を提案し,計算機シミュレーションにより性能の確認を行う.F0 推定法は,時間波形の特徴やスペクトルの特徴に基づく方法など,多数の方法がすでに提案されている.それぞれの方法は,音声データベースに収録された音声により性能を評価し有効性が検証されている一方,データベースの音声にも F0 や音色の偏りが存在することから,正確な優劣を議論することは容易ではない.本研究では,F0 推定法にはそれぞれ性能を発揮する特性の音声や収録環境があるという仮説のもと,優劣をつけるのではなく性能を概観し,ユーザが F0 推定法を選択する手がかりを与えることを目指す.提案する TUSK では,音声・歌声分析に必要な,ビブラートや耐雑音性などの項目について人工的に生成した音源による評価を実施し,各項目についての性能を計測することを可能にする.本稿では,TUSK のコンセプトと各評価項目について示し,近年提案された高性能なF0推定法を用いた比較評価により有効性を示す.This article represents a framework for overviewing the performance of fundamental frequency (F0) estimator and evaluates its effectiveness. Many F0 estimators have been proposed, and their effectivenesses have been evaluated by speech databases. On the other hand, since the evaluation result depends on the speech database used for the evaluation, it is difficult to fairly evaluate the estimators. The framework, named TUSK, does not rank the estimators but attempts to overview them. In this article, we introduce the concept of TUSK and evaluation criteria, and its effectiveness is examined by several modern F0 estimators.AN10438388研究報告音楽情報科学(MUS)2016-MUS-1101162016-02-222188-87522016-02-17