WEKO3
アイテム
発話を先読みしマイクミュート制御をするマルチモーダル発話検知技術
https://ipsj.ixsq.nii.ac.jp/records/219675
https://ipsj.ixsq.nii.ac.jp/records/2196753cad41e6-c9cc-4675-b990-73a5e6d8a2a2
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2022 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Symposium(1) | |||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2022-07-06 | |||||||||||||||
タイトル | ||||||||||||||||
タイトル | 発話を先読みしマイクミュート制御をするマルチモーダル発話検知技術 | |||||||||||||||
言語 | ||||||||||||||||
言語 | jpn | |||||||||||||||
資源タイプ | ||||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||||
資源タイプ | conference paper | |||||||||||||||
著者所属 | ||||||||||||||||
NTTドコモ | ||||||||||||||||
著者所属 | ||||||||||||||||
NTTドコモ | ||||||||||||||||
著者所属 | ||||||||||||||||
NTTドコモ | ||||||||||||||||
著者所属 | ||||||||||||||||
NTTドコモ | ||||||||||||||||
著者所属 | ||||||||||||||||
NTTドコモ | ||||||||||||||||
著者名 |
山田, 仰
× 山田, 仰
× 瀧上, 順也
× 仲, 信彦
× 吉村, 健
× 太田, 賢
|
|||||||||||||||
論文抄録 | ||||||||||||||||
内容記述タイプ | Other | |||||||||||||||
内容記述 | 本研究では,音声通話における自動マイクミュート制御のために,従来技術を用いた場合の2つの課題である,話頭切れと周囲雑音の誤検知を防止するため,口唇の変動に基づき発話開始を先読みしてマイクを有効化し,口唇の変動と音声信号に基づき非発話中と推定されたときにマイクを無効化するミュート制御手法を提案する.また本研究では,共話を行っているオンラインコミュニケーションの収録動画を用いて提案技術の評価を行い,収録動画の全発話の内の 99.1% の発話を話頭切れを含む発話区間の欠損無く検出でき,共話のユースケースでも十分に実用性があることを示す. | |||||||||||||||
書誌情報 |
マルチメディア,分散,協調とモバイルシンポジウム2022論文集 巻 2022, p. 705-709, 発行日 2022-07-06 |
|||||||||||||||
出版者 | ||||||||||||||||
言語 | ja | |||||||||||||||
出版者 | 情報処理学会 |