@techreport{oai:ipsj.ixsq.nii.ac.jp:00199670, author = {高道, 慎之介 and 三井, 健太郎 and 齋藤, 佑樹 and 郡山, 知樹 and 丹治, 尚子 and 猿渡, 洋 and Shinnosuke, Takamichi and Kentaro, Mitsui and Yiki, Saito and Tomoki, Koriyama and Naoko, Tanji and Hiroshi, Saruwatari}, issue = {7}, month = {Oct}, note = {深層学習を含む機械学習技術の発展により,音声合成は機械学習タスクになっている.音声合成研究の加速のために我々は,学術機関だけでなく民間企業からも容易にアクセス可能な日本語音声コーパスを開発しており,その一環として 2017 年に JSUT コーパスを公開した.このコーパスは,end-to-end 型音声合成に向けて,単一話者による 10 時間の読み上げ音声データを含むよう設計された.音声変換や多数話者モデリングなどの一層多様な音声合成研究の加速を見据え,本研究では 3 スタイル (通常,ささやき,および裏声) ・100 話者の音声データを含む JVS コーパスを構築した結果を報告する.このコーパスは,22 時間のパラレル読み上げ音声を含む30 時間の音声データが含む.本コーパスは,プロジェクトページにて入手できる.}, title = {JVS:フリーの日本語多数話者音声コーパス}, year = {2019} }