@techreport{oai:ipsj.ixsq.nii.ac.jp:00211529, author = {内藤, 悟嗣 and 齋藤, 康之 and Satoshi, Naito and Yasuyuki, Saito}, issue = {20}, month = {Jun}, note = {歌声合成技術やカラオケの採点技術などのシステム構築には,歌声の特徴を音素単位で解析する必要があり,ある音素と音源の時間的な対応付け作業をアノテーションという.手動によるアノテーションは,精密な解析結果が得られる一方で,甚大な時間と労力を要する.そのため自動でアノテーションするツールが開発された.しかし,ツールに付属している音響モデルは話声や読み上げ音声に対して学習されており,高音や長音の特性を持つ歌声に対しては認識精度が低下するという問題がある.以上の問題点を解決するために,本研究は隠れマルコフモデルを用いて歌声に対して学習した歌声特化の音響モデルを構築する.そして,高音・長音を含む歌声における音素の発声時刻の推定精度について,先行研究で構築された話声音響モデルによる推定結果と比較・評価を行う., The purpose of this study is to construct an acoustic model trained on singing voices. For the construction of systems such as singing voice synthesis technology and scoring technology for karaoke, it is necessary to analyze the characteristics of singing voices. In manual phonetic analysis, it takes a great deal of time and effort to correspond sentences to speech sounds. For this reason, automatic annotation tools have been developed. However, the acoustic model attached to the tools is trained on spoken voices, and the recognition accuracy of singing voices is reduced. In order to solve the above problems, we construct an acoustic model trained on singing voices using hidden Markov model, and compare and evaluate it with conventional methods.}, title = {歌声の高音・長音の分析に特化した音響モデルの構築}, year = {2021} }