| Item type |
SIG Technical Reports(1) |
| 公開日 |
2024-02-22 |
| タイトル |
|
|
タイトル |
音光変換デバイス「ブリンキー」の分散配置に基づく発話検出のシミュレーション評価 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Simulation Evaluation of Speech Detection Based on Distributed Sound-to-Light Conversion Device Blinkies |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
ポスターセッション3 EA/SIP |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
東京都立大学システムデザイン研究科 |
| 著者所属 |
|
|
|
東京都立大学システムデザイン研究科 |
| 著者所属 |
|
|
|
東京都立大学システムデザイン研究科/日本電信電話株式会社 |
| 著者所属 |
|
|
|
東京都立大学システムデザイン研究科/東海大学情報理工学部 |
| 著者所属 |
|
|
|
東京都立大学システムデザイン研究科 |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Systems Design, Tokyo Metropolitan University |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Systems Design, Tokyo Metropolitan University |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Systems Design, Tokyo Metropolitan University / NTT Corporation |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Systems Design, Tokyo Metropolitan University / School of Information Science and Technology, Tokai University |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Systems Design, Tokyo Metropolitan University |
| 著者名 |
本山, 智司
植野, 夏樹
安田, 昌弘
木下, 裕磨
小野, 順貴
|
| 著者名(英) |
Satoshi, Motoyama
Natsuki, Ueno
Masahiro, Yasuda
Yuma, Kinoshita
Nobutaka, Ono
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本研究では,分散配置した音光変換デバイス「ブリンキー」を活用した発話検出を目的とする.本稿では初期検討として,ブリンキーにおける音光変換を音響シーン分類の損失に基づき End-to-End 学習するフレームワークを発話検出に応用する.音光変換に用いる deep neural network (DNN) の学習のために室内音響伝搬をシミュレーションして作成したブリンキーの観測音と正解ラベルからなるデータセットの作成を行った.作成したデータを使用して発話検出に使用するノードの個数を変更して実験を行い,提案手法においてより多くのノードを用いることで発話検出の精度が向上することを確認した. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
The purpose of this study is speech detection using the distributed sound-to-light conversion device Blinkies. As an initial study, this paper applies a framework for End-to-End learning of sound-to-light conversion in acoustic scene recognition using Blinkies to speech detection based on the loss of acoustic scene classification. To train the deep neural network for sound-to-light conversion, we created a dataset consisting of Blinky’s observed sounds created by simulating room acoustic propagation and labels. Experiments were conducted using the created data with different numbers of nodes used for speech detection, and it was confirmed that the accuracy of speech detection is improved by using more nodes in the proposed method. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
| 書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2024-SLP-151,
号 82,
p. 1-6,
発行日 2024-02-22
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |