WEKO3
アイテム
口パク動画の発話内容推測における距離学習に基づく精度向上手法
https://ipsj.ixsq.nii.ac.jp/records/229941
https://ipsj.ixsq.nii.ac.jp/records/2299418a49cff2-1c3d-44e3-8a65-e359f6b37bde
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
| Item type | National Convention(1) | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2023-02-16 | |||||||||||
| タイトル | ||||||||||||
| タイトル | 口パク動画の発話内容推測における距離学習に基づく精度向上手法 | |||||||||||
| 言語 | ||||||||||||
| 言語 | jpn | |||||||||||
| キーワード | ||||||||||||
| 主題Scheme | Other | |||||||||||
| 主題 | 人工知能と認知科学 | |||||||||||
| 資源タイプ | ||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||
| 資源タイプ | conference paper | |||||||||||
| 著者所属 | ||||||||||||
| 早大 | ||||||||||||
| 著者所属 | ||||||||||||
| 早大 | ||||||||||||
| 著者所属 | ||||||||||||
| 早稲田大学理工学術院総合研究所 | ||||||||||||
| 著者名 |
柏木, 爽良
× 柏木, 爽良
× 田中, 啓太郎
× 森島, 繁生
|
|||||||||||
| 論文抄録 | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | 本稿では,声を出さない口パク時の唇の動画から発話内容を推測する手法を提案する.一般に唇の動きは,声を出す通常の話し方(有声動作)と声を出さない口パク時の話し方(無声動作)とで異なる.しかし,既存データセットの多くは有声動作で構成され,無声動作の発話内容を推測する場合も有声動作データセットで訓練されたモデルが使用されるため,無声動作に対する予測精度が有声動作に対する予測精度を大きく下回る問題がある.有声動作と無声動作の違いを吸収し同等精度での予測を実現するため,唇の動きの最小単位であるvisemeに対し距離学習を行う枠組みを提案する.実験を通し,無声動作に対して3%以上精度が向上することを示す. | |||||||||||
| 書誌レコードID | ||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||
| 収録物識別子 | AN00349328 | |||||||||||
| 書誌情報 |
第85回全国大会講演論文集 巻 2023, 号 1, p. 287-288, 発行日 2023-02-16 |
|||||||||||
| 出版者 | ||||||||||||
| 言語 | ja | |||||||||||
| 出版者 | 情報処理学会 | |||||||||||