Item type |
SIG Technical Reports(1) |
公開日 |
2016-03-01 |
タイトル |
|
|
タイトル |
方言の音声認識モデル構築に向けた音声データ収集の効率化検討 |
タイトル |
|
|
言語 |
en |
|
タイトル |
A Study of an Improvement Approach to Collect Speech Data for a Dialect Speech Recognition Model |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
一般発表-調査と分析- |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
(株)日立ソリューションズ東日本 |
著者所属 |
|
|
|
(株)日立ソリューションズ東日本 |
著者所属 |
|
|
|
(株)日立ソリューションズ東日本 |
著者所属 |
|
|
|
岩手県立大学ソフトウェア情報学部 |
著者所属(英) |
|
|
|
en |
|
|
Hitachi Solutions East Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Hitachi Solutions East Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Hitachi Solutions East Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Faculty of Software and Information Science, Iwate Prefectural University |
著者名 |
吉田, 裕範
松本, 和芳
関, 義則
榑松, 理樹
|
著者名(英) |
Hironori, Yoshida
Kazuyoshi, Matsumoto
Yoshinori, Seki
Masaki, Kurematsu
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,方言音声認識システムの学習用音声データのラベル付け作業の効率化について述べる.ラベル付け作業とは,現地で収録した方言音声データへカナ文字を関連付け機械学習のための識別情報を作成することである.従来のラベル付け作業は,音声解析ソフトで音声波形を図示した後は,手作業が大部分を占め,作業効率が悪い.今回,ラベル付け作業負荷の軽減,時間短縮を図る手法として,従来手法のように事前に音響モデルを事前準備することなく,音素開始時間に関連する特徴量を算出し,音素の区切り位置となる時間をラベル付け作業者に対して情報提示する手法を検討した.これにより,方言音声に関する知識や経験の無い作業者でもラベル付け作業を効率よく進められる仕組みを整備する. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In this paper, we describe the efficiency of labeling work of training speech data of dialect speech recognition system. The labeling work of training speech data, is to create a information associated with the Kana character to the dialect voice data was recorded in the field. The conventional labeling work, after illustrating the speech waveform in voice analysis software, manually accounted for a large part, it is poor work efficiency. This time, reduce labeling workloads, as a method for shortening time without Prerequisite an acoustic model in advance as in the conventional method, and calculates a feature amount associated with the phoneme start time, a phoneme segmentation positions It was investigated a method to information presentation time against labeling workers.As a result, to develop a mechanism to be efficiently advance the labeling work even in the absence of the worker of knowledge and experience about the dialect voice. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA1221543X |
書誌情報 |
研究報告ヒューマンコンピュータインタラクション(HCI)
巻 2016-HCI-167,
号 10,
p. 1-5,
発行日 2016-03-01
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8760 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |