Item type |
SIG Technical Reports(1) |
公開日 |
2018-01-19 |
タイトル |
|
|
タイトル |
不正抑止効果の高い音声対話AI帳票の実現に向けた取り組み―多段階話者適応方式の提案― |
タイトル |
|
|
言語 |
en |
|
タイトル |
An approach to realize an artificial-intelligence powered voiceactivated electronic forms having cheat deterrent effect - A proposal of multi-layer speaker adaptation - |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
システムモデルとサービス |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
(株)NECソリューションイノベータ |
著者所属 |
|
|
|
(株)NECソリューションイノベータ |
著者所属 |
|
|
|
(株)NECソリューションイノベータ |
著者所属 |
|
|
|
(株)NECソリューションイノベータ |
著者所属 |
|
|
|
(株)NECソリューションイノベータ |
著者所属(英) |
|
|
|
en |
|
|
NEC Solution Innovator, Ltd. |
著者所属(英) |
|
|
|
en |
|
|
NEC Solution Innovator, Ltd. |
著者所属(英) |
|
|
|
en |
|
|
NEC Solution Innovator, Ltd. |
著者所属(英) |
|
|
|
en |
|
|
NEC Solution Innovator, Ltd. |
著者所属(英) |
|
|
|
en |
|
|
NEC Solution Innovator, Ltd. |
著者名 |
古明地, 秀治
坂口, 基彦
田淵, 仁浩
服部, 浩明
奥村, 明俊
|
著者名(英) |
Shuji, Komeiji
Motohiko, Sakaguchi
Masahiro, Tabuchi
Hiroaki, Hattori
Akitoshi, Okumura
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿では,不正抑止効果の高い音声対話型 AI 帳票の実現のために,ヒアラブルデバイスとの組み合わせを提唱する.また,ヒアラブルデバイスとの組み合わせにおいて課題になる,音声対話型 AI 帳票の音声認識エンジン VoiceDo の認識精度劣化を防止する多段階話者適応方式を提案する.音声対話型AI帳票にヒアラブルデバイスを組み合わせることで,検査データに対して 「いつ」 の情報だけでなく,耳音響認証技術により得られる 「誰により」 と高精度位置測位技術により得られる 「どこで」 の情報を付加することができる.これにより,矛盾のない形でデータの改竄 ・ 捏造するのが難しくなり,検査作業者が不正をする心理的障壁を上げることができる.また,提案する多段話者適応技術により,74% だった VoiceDo の単語認識精度が,97% に改善され,不正抑止効果の高い音声対話型 AI 帳票実現の見通しを得た. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
This paper proposes an artificial-intelligence powered, voice-activated electronic forms (AI-forms) having cheat deterrent effect by exploiting hearable device. Besides, this paper also proposes a multi-layer speaker adaptation which covers the defect of automatic speech recognition (ASR) engine, VoiceDo employed by AI-forms with hearable device hearable device. The combination of the AI-forms and the hearable device enables to attach the additional information of not only "when" but also "by who" and "where" to inspection data. The information of "by who" and "where" can be identified by acoustic ear authentication and high accuracy positioning technology supported by hearable device. These additional information make it more difficult for workers to make falsify data without inconsistencies, and as a result, these enforce a psychological barrier to cheat. Besides, the experiment of multi-layer speaker adaptation achieved 97% ASR accuracy from 74%. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12628338 |
書誌情報 |
研究報告デジタルコンテンツクリエーション(DCC)
巻 2018-DCC-18,
号 3,
p. 1-7,
発行日 2018-01-19
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8868 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |