音光変換デバイス「ブリンキー」の分散配置に基づく発話検出のシミュレーション評価

本山, 智司; 植野, 夏樹; 安田, 昌弘; 木下, 裕磨; 小野, 順貴; Satoshi, Motoyama; Natsuki, Ueno; Masahiro, Yasuda; Yuma, Kinoshita; Nobutaka, Ono

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

音光変換デバイス「ブリンキー」の分散配置に基づく発話検出のシミュレーション評価

https://ipsj.ixsq.nii.ac.jp/records/232552

名前 / ファイル	ライセンス	アクション
IPSJ-SLP24151082.pdf (2.2 MB)	Copyright (c) 2024 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
SLP:会員：¥0, DLIB:会員：¥0

Item type

SIG Technical Reports(1)

公開日

2024-02-22

タイトル

音光変換デバイス「ブリンキー」の分散配置に基づく発話検出のシミュレーション評価

タイトル

言語

タイトル

Simulation Evaluation of Speech Detection Based on Distributed Sound-to-Light Conversion Device Blinkies

言語

jpn

キーワード

主題Scheme

Other

主題

ポスターセッション3 EA/SIP

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_18gh

資源タイプ

technical report

著者所属

東京都立大学システムデザイン研究科

著者所属

東京都立大学システムデザイン研究科

著者所属

東京都立大学システムデザイン研究科／日本電信電話株式会社

著者所属

東京都立大学システムデザイン研究科／東海大学情報理工学部

著者所属

東京都立大学システムデザイン研究科

著者所属(英)

Graduate School of Systems Design, Tokyo Metropolitan University

著者所属(英)

Graduate School of Systems Design, Tokyo Metropolitan University

著者所属(英)

Graduate School of Systems Design, Tokyo Metropolitan University / NTT Corporation

著者所属(英)

Graduate School of Systems Design, Tokyo Metropolitan University / School of Information Science and Technology, Tokai University

著者所属(英)

Graduate School of Systems Design, Tokyo Metropolitan University

著者名

本山, 智司
植野, 夏樹
安田, 昌弘
木下, 裕磨
小野, 順貴

著者名(英)

Satoshi, Motoyama
Natsuki, Ueno
Masahiro, Yasuda
Yuma, Kinoshita
Nobutaka, Ono

論文抄録

内容記述タイプ

Other

内容記述

本研究では，分散配置した音光変換デバイス「ブリンキー」を活用した発話検出を目的とする．本稿では初期検討として，ブリンキーにおける音光変換を音響シーン分類の損失に基づき End-to-End 学習するフレームワークを発話検出に応用する．音光変換に用いる deep neural network (DNN) の学習のために室内音響伝搬をシミュレーションして作成したブリンキーの観測音と正解ラベルからなるデータセットの作成を行った．作成したデータを使用して発話検出に使用するノードの個数を変更して実験を行い，提案手法においてより多くのノードを用いることで発話検出の精度が向上することを確認した．

論文抄録(英)

内容記述タイプ

Other

内容記述

The purpose of this study is speech detection using the distributed sound-to-light conversion device Blinkies. As an initial study, this paper applies a framework for End-to-End learning of sound-to-light conversion in acoustic scene recognition using Blinkies to speech detection based on the loss of acoustic scene classiﬁcation. To train the deep neural network for sound-to-light conversion, we created a dataset consisting of Blinky’s observed sounds created by simulating room acoustic propagation and labels. Experiments were conducted using the created data with diﬀerent numbers of nodes used for speech detection, and it was conﬁrmed that the accuracy of speech detection is improved by using more nodes in the proposed method.

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN10442647

書誌情報

研究報告音声言語情報処理（SLP）

巻 2024-SLP-151, 号 82, p. 1-6, 発行日 2024-02-22

ISSN

収録物識別子タイプ

ISSN

収録物識別子

2188-8663

Notice

SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-19 10:24:35.280467

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

音光変換デバイス「ブリンキー」の分散配置に基づく発話検出のシミュレーション評価

× 本山, 智司

× 植野, 夏樹

× 安田, 昌弘

× 木下, 裕磨

× 小野, 順貴

× Satoshi, Motoyama

× Natsuki, Ueno

× Masahiro, Yasuda

× Yuma, Kinoshita

× Nobutaka, Ono

Versions

Share

Cite as

エクスポート