動画内話者の音声強調における特定背景音声の透過

吉永, 朋矢; 田中, 啓太郎; 森島, 繁生

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

動画内話者の音声強調における特定背景音声の透過

https://ipsj.ixsq.nii.ac.jp/records/230017

名前 / ファイル	ライセンス	アクション
IPSJ-Z85-5S-06.pdf (377.7 kB)	Copyright (c) 2023 by the Information Processing Society of Japan

Item type

National Convention(1)

公開日

2023-02-16

タイトル

動画内話者の音声強調における特定背景音声の透過

言語

jpn

キーワード

主題Scheme

Other

主題

人工知能と認知科学

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_5794

資源タイプ

conference paper

著者所属

早大

著者所属

早大

著者所属

早大

著者名

吉永, 朋矢
田中, 啓太郎
森島, 繁生

論文抄録

内容記述タイプ

Other

内容記述

本稿では，ノイズ環境で人が話している動画から，その話者の音声と動画外の特定人物の音声の混合音を抽出する手法を提案する．近年，深層学習により多ドメイン情報処理技術が向上し，視覚情報を用いて動画内の話者の音声を抽出する研究は急速に発展している．しかし多くの場合，動画外の音声は一様に抑制されてしまう．本研究では，事前に収録した特定話者の音声を参照して，動画内の話者の音声と動画外の所望の音声を同時に抽出する枠組みを構築する．動画外の音声に対する時変注意機構と，動画内または動画外の音声を遮断する訓練方法により，推定精度の向上を図る．実験により，推定精度とモデルの軽量さの観点で提案手法の有効性を確認した．

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN00349328

書誌情報

第85回全国大会講演論文集

巻 2023, 号 1, p. 443-444, 発行日 2023-02-16

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-19 11:19:24.206802

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

動画内話者の音声強調における特定背景音声の透過

× 吉永, 朋矢

× 田中, 啓太郎

× 森島, 繁生

Versions

Share

Cite as

エクスポート