Item type |
SIG Technical Reports(1) |
公開日 |
2017-03-03 |
タイトル |
|
|
タイトル |
音声認識による難入力語の検出を用いた講義の文字通訳支援システム |
タイトル |
|
|
言語 |
en |
|
タイトル |
Support System for Lecture Captioning Using Detection of Input-difficult Words by Automatic Speech Recognition |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
システム開発 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
名古屋大学大学院情報科学研究科メディア科学専攻 |
著者所属 |
|
|
|
大同大学情報学部情報システム学科 |
著者所属 |
|
|
|
名古屋大学大学院情報科学研究科メディア科学専攻 |
著者所属 |
|
|
|
名古屋大学大学院情報科学研究科メディア科学専攻 |
著者所属 |
|
|
|
名古屋大学大学院情報科学研究科メディア科学専攻 |
著者所属(英) |
|
|
|
en |
|
|
Department of Media Science, Graduate School of Information Science, Nagoya University |
著者所属(英) |
|
|
|
en |
|
|
Department of Computer Science, School of Informatics, Daido University |
著者所属(英) |
|
|
|
en |
|
|
Department of Media Science, Graduate School of Information Science, Nagoya University |
著者所属(英) |
|
|
|
en |
|
|
Department of Media Science, Graduate School of Information Science, Nagoya University |
著者所属(英) |
|
|
|
en |
|
|
Department of Media Science, Graduate School of Information Science, Nagoya University |
著者名 |
池田, 直史
竹内, 義則
松本, 哲也
工藤, 博章
大西, 昇
|
著者名(英) |
Naofumi, Ikeda
Yoshinori, Takeuchi
Tetsuya, Matsumoto
Hiroaki, Kudo
Noboru, Ohnishi
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
聴覚障害者が出席する講義や講演における情報保障の 1 つとして,パソコン文字通訳がある.本研究では,文字通訳者にとって聞き取りづらかったり,入力に手間がかかったりする語を 「難入力語」 と定義し,音声認識により難入力語を自動で検出し,文字通訳者に提示するシステムを提案する.システムでは,事前に講義に用いるプレゼンテーションスライドが得られることを仮定し,まずスライドから難入力語を自動抽出する.その後,音声認識による難入力語の検出性能を向上させるために,難入力語をクエリとして用いて Web 検索を行い,音声認識の言語モデルの適応を行う.音声認識によって検出された難入力語は,文字通訳用エディタ上に提示される.提示されている難入力語は,対応する各キーを押す簡単な操作により,入力中の文章に挿入することができる.提案システムを用いた文字通訳実験を行った結果,難入力語の提示 ・ 挿入機能を使用して作成された字幕の方が,使用しない場合に比べて,講義の意味内容をより正しく伝えているという評価が得られた. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
PC captioning is one of information supports in lectures. In this study, we define the words that it is difficult to listen to and takes long time to input as "input-difficult words". We propose a system to detect input-difiScult words by automatic speech recognition (ASR), and present it to captionists. We assume that presentation slides are provided beforehand, and input-difficult words are extracted from the slides automatically. Next, in order to improve the detection rate of input-difficult words, we adapt the language model of ASR. The detected input-difficult words are presented on an editor for captioning. Captionists can insert the detected input-difficult words into the sentence by pressing the corresponding keys. We conducted captioning experiments with the proposed system. As a result, the transcription with proposed system depicted lecture content more accurately than when not using the system. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12752949 |
書誌情報 |
研究報告アクセシビリティ(AAC)
巻 2017-AAC-3,
号 5,
p. 1-6,
発行日 2017-03-03
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2432-2431 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |