@techreport{oai:ipsj.ixsq.nii.ac.jp:00232552, author = {本山, 智司 and 植野, 夏樹 and 安田, 昌弘 and 木下, 裕磨 and 小野, 順貴 and Satoshi, Motoyama and Natsuki, Ueno and Masahiro, Yasuda and Yuma, Kinoshita and Nobutaka, Ono}, issue = {82}, month = {Feb}, note = {本研究では,分散配置した音光変換デバイス「ブリンキー」を活用した発話検出を目的とする.本稿では初期検討として,ブリンキーにおける音光変換を音響シーン分類の損失に基づき End-to-End 学習するフレームワークを発話検出に応用する.音光変換に用いる deep neural network (DNN) の学習のために室内音響伝搬をシミュレーションして作成したブリンキーの観測音と正解ラベルからなるデータセットの作成を行った.作成したデータを使用して発話検出に使用するノードの個数を変更して実験を行い,提案手法においてより多くのノードを用いることで発話検出の精度が向上することを確認した., The purpose of this study is speech detection using the distributed sound-to-light conversion device Blinkies. As an initial study, this paper applies a framework for End-to-End learning of sound-to-light conversion in acoustic scene recognition using Blinkies to speech detection based on the loss of acoustic scene classification. To train the deep neural network for sound-to-light conversion, we created a dataset consisting of Blinky’s observed sounds created by simulating room acoustic propagation and labels. Experiments were conducted using the created data with different numbers of nodes used for speech detection, and it was confirmed that the accuracy of speech detection is improved by using more nodes in the proposed method.}, title = {音光変換デバイス「ブリンキー」の分散配置に基づく発話検出のシミュレーション評価}, year = {2024} }