Item type |
SIG Technical Reports(1) |
公開日 |
2015-10-23 |
タイトル |
|
|
タイトル |
IBM WatsonのSaaS型音声認識・音声合成サービス |
タイトル |
|
|
言語 |
en |
|
タイトル |
IBM Watson Speech To Text Service and Text To Speech Service |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
日本アイ・ビー・エム株式会社東京基礎研究所 |
著者所属 |
|
|
|
日本アイ・ビー・エム株式会社東京基礎研究所 |
著者所属 |
|
|
|
日本アイ・ビー・エム株式会社東京基礎研究所 |
著者所属(英) |
|
|
|
en |
|
|
IBM Watson Multimodal, IBM Japan Ltd. |
著者所属(英) |
|
|
|
en |
|
|
IBM Watson Multimodal, IBM Japan Ltd. |
著者所属(英) |
|
|
|
en |
|
|
IBM Watson Multimodal, IBM Japan Ltd. |
著者名 |
立花, 隆輝
福田, 隆
長野, 徹
|
著者名(英) |
Ryuki, Tachibana
Takashi, Fukuda
Tohru, Nagano
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,ディープラーニング技術によって音声認識精度は一般に大きく向上した.IBM でも国内外の研究所でニューラルネットワークの構造や学習方法を改善する研究や,特定の用途や環境に適応するための研究などを複数の言語について行っている.基礎的な研究も行っている一方で,企業での応用現場での要求を直接聞き,単語誤り精度の削減のみに留まらない実用性を意識した研究も行っていることに特徴がある.このような研究成果を生かし,IBM は 2015 年 7 月から複数の言語について音声認識と音声合成の Software-as-a-Service (SaaS) 型サービスの提供を始めた.本報告では,このサービスにも一部が実用されている IBM の国内外研究所の近年の主な研究成果を概観する. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Recent advancements in the deep learning technology area have greatly improved the accuracy of Automatic Speech Recognition (ASR) in general. The research laboratories of global IBM are also conducting research in this area toward better topologies and better training methods of neural-network-based acoustic and language models, as well as research of adaptation methods to new environments and new usage scenarios. While rather fundamental research themes are sometimes studied, it is also ne of the characteristics of our approaches that we sometimes target on practical usefulness at customers’ fields beyond simple eduction of word error rates. Using such research achievements, IBM started new Software-as-a-Service (SaaS) of Automatic peech Recognition (ASR) and Text To Speech (TTS) in July 2015 for multiple languages. In this paper, we introduce some of ecent main research achievements of our research laboratories. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2015-SLP-108,
号 6,
p. 1-6,
発行日 2015-10-23
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |