ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 全国大会
  2. 83回
  3. 人工知能と認知科学

視聴覚統合に基づく音源定位と音区間検出の自己教師あり学習

https://ipsj.ixsq.nii.ac.jp/records/214983
https://ipsj.ixsq.nii.ac.jp/records/214983
40c7df27-a1e6-485e-91b1-27b8fea6dd14
名前 / ファイル ライセンス アクション
IPSJ-Z83-2Q-05.pdf IPSJ-Z83-2Q-05.pdf (1.1 MB)
Copyright (c) 2021 by the Information Processing Society of Japan
Item type National Convention(1)
公開日 2021-03-04
タイトル
タイトル 視聴覚統合に基づく音源定位と音区間検出の自己教師あり学習
言語
言語 jpn
キーワード
主題Scheme Other
主題 人工知能と認知科学
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_5794
資源タイプ conference paper
著者所属
早大/産総研
著者所属
産総研
著者所属
産総研
著者所属
産総研
著者所属
早大
著者所属
早大
著者名 升山, 義紀

× 升山, 義紀

升山, 義紀

Search repository
坂東, 宜昭

× 坂東, 宜昭

坂東, 宜昭

Search repository
佐々木, 洋子

× 佐々木, 洋子

佐々木, 洋子

Search repository
大西, 正輝

× 大西, 正輝

大西, 正輝

Search repository
矢田部, 浩平

× 矢田部, 浩平

矢田部, 浩平

Search repository
及川, 靖広

× 及川, 靖広

及川, 靖広

Search repository
論文抄録
内容記述タイプ Other
内容記述 ロボットが周囲の音環境を理解し行動するには、どの物体がいつ音を発しているか認識することが重要である。近年、音画像データの解析の中でも会議映像の解析ではDNNを用いた手法が高い性能を実現している。しかし、様々な音源が存在する実環境で収録されたデータに対し「各物体がいつ音を発しているか」という教師データを作成するのは容易ではない。本稿では、画像内の音源物体を検出するDNNと、各物体がいつ音を発しているかを推定するDNNの自己教師あり学習法を提案する。この学習法は教師データの代わりに、多チャネル音響信号の空間モデルを活用する。音源として人物を複数含む全方位画像と多チャネル混合音を合成し、動作を定性的に確認した。
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN00349328
書誌情報 第83回全国大会講演論文集

巻 2021, 号 1, p. 363-364, 発行日 2021-03-04
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 16:22:30.824450
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3