Item type |
Trans(1) |
公開日 |
2018-10-30 |
タイトル |
|
|
タイトル |
不正抑止効果の高い音声対話型AI帳票の実現に向けた取り組み―多段階話者適応方式の提案 |
タイトル |
|
|
言語 |
en |
|
タイトル |
An Approach to Realize an Artificial-intelligence Voice-activated Electronic Forms Having Cheat Deterrent Effect ― A Proposal of Multi-layer Speaker Adaptation |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[コンシューマ・デバイス論文] AI帳票,ヒアラブルデバイス,耳音響認証,音声認識,話者適応 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
株式会社NECソリューションイノベータ |
著者所属 |
|
|
|
株式会社NECソリューションイノベータ |
著者所属 |
|
|
|
株式会社NECソリューションイノベータ |
著者所属 |
|
|
|
株式会社NECソリューションイノベータ |
著者所属 |
|
|
|
株式会社NECソリューションイノベータ |
著者所属(英) |
|
|
|
en |
|
|
NEC Solution Innovator, Ltd. |
著者所属(英) |
|
|
|
en |
|
|
NEC Solution Innovator, Ltd. |
著者所属(英) |
|
|
|
en |
|
|
NEC Solution Innovator, Ltd. |
著者所属(英) |
|
|
|
en |
|
|
NEC Solution Innovator, Ltd. |
著者所属(英) |
|
|
|
en |
|
|
NEC Solution Innovator, Ltd. |
著者名 |
古明地, 秀治
坂口, 基彦
田淵, 仁浩
服部, 浩明
奥村, 明俊
|
著者名(英) |
Shuji, Komeiji
Motohiko, Sakaguchi
Masahiro, Tabuchi
Hiroaki, Hattori
Akitoshi, Okumura
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,検査工程において,不正抑止効果の高い音声対話型AI帳票の実現のために,ヒアラブルデバイスとの組合せを提唱する.また,ヒアラブルデバイスとの組合せにおいて課題になる,音声対話型AI帳票の音声認識エンジンVoiceDoの認識精度劣化を防止する多段階話者適応方式を提案する.音声対話型AI帳票にヒアラブルデバイスを組み合わせることで,検査データに対して「いつ」の情報だけでなく,耳音響認証技術により得られる「誰が」と高精度位置測位技術により得られる「どこで」の情報を付加することができる.これらの情報は検査データの確証になるため,不正を働く心理的障壁を上げる.また,提案する多段話者適応技術により,74%だったVoiceDoの単語認識精度が,97%に改善され,不正抑止効果の高い音声対話型AI帳票実現の見通しを得た. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
This paper proposes an artificial-intelligence powered, voice-activated electronic forms (AI-forms) having cheat deterrent effect by exploiting hearable device. Besides, this paper also proposes a multi-layer speaker adaptation which covers the defect of automatic speech recognition (ASR) engine, VoiceDo employed by AI-forms with hearable device hearable device. The combination of the AI-forms and the hearable device enables to attach the additional information of not only “when” but also “who” and “where” to inspection data. The information of “who” and “where” can be identified by acoustic ear authentication and high accuracy positioning technology supported by hearable device. These additional information make it more difficult for workers to make falsify data without inconsistencies, and as a result, these enforce a psychological barrier to cheat. Besides, the experiment of multi-layer speaker adaptation achieved 97% ASR accuracy from 74%. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12628043 |
書誌情報 |
情報処理学会論文誌コンシューマ・デバイス&システム(CDS)
巻 8,
号 3,
p. 1-8,
発行日 2018-10-30
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2186-5728 |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |