@techreport{oai:ipsj.ixsq.nii.ac.jp:00195035, author = {秋田, 祐哉 and 上乃, 聖 and 三村, 正人 and 河原, 達也 and Yuya, Akita and Sei, Ueno and Masato, Mimura and Tatsuya, Kawahara}, issue = {34}, month = {Mar}, note = {我々は,効率的な字幕付与を実現するために,音声認識を用いたオンラインの自動字幕作成システムを運用している.本システムの特徴の 1 つに,より精度の高い音声認識のために,サーバ上で認識用のモデルを対象の音声に適応させて認識を実施できることがある.これまでの本システムの運用において,適応したモデルをユーザ端末上の音声認識でも利用できるようにする機能の要望があった.また,本システムの運用を行っている間に音声認識の技術はいっそう進展し,最近では全てのモデルを 1 つのニューラルネットワークに統合した,End-to-End 型音声認識が有望となってきている.本稿では,我々の字幕作成システムについて,これらの実装を行って利便性や性能を改善したので報告する., We have been running an online captioning system with the automatic speech recognition (ASR) technology for efficient captioning of speech materials. One of the key characteristics in the system is the capability of automatic adaptation of ASR models to the target speech. During operation of the system so far, we received requests from users to provide adapted models for ASR-based captioning on user PC. In the meanwhile, the ASR technology has significantly advanced in recent years, and the state-of-the-art End-to-End framework, where all ASR models are integrated into a single neural network, is considered promising. In this report, we will describe the implementation of these functionalities to the system.}, title = {音声認識を用いた字幕作成システムの改良}, year = {2019} }