WEKO3
アイテム
Keypoint特徴量によるフォトリアリスティック発話動画像生成の安定化
https://ipsj.ixsq.nii.ac.jp/records/234629
https://ipsj.ixsq.nii.ac.jp/records/234629bb939635-6e88-4b2b-9335-5dd5b822e323
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2026年6月7日からダウンロード可能です。
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
非会員:¥660, IPSJ:学会員:¥330, MUS:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2024-06-07 | |||||||||||
タイトル | ||||||||||||
タイトル | Keypoint特徴量によるフォトリアリスティック発話動画像生成の安定化 | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | ポスターセッション1 | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
資源タイプ | technical report | |||||||||||
著者所属 | ||||||||||||
東北大学 | ||||||||||||
著者所属 | ||||||||||||
東北大学 | ||||||||||||
著者所属 | ||||||||||||
東北大学 | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Tohoku University | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Tohoku University | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Tohoku University | ||||||||||||
著者名 |
ジョ, シカイ
× ジョ, シカイ
× 能勢, 隆
× 伊藤, 彰則
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 音声からそれに対応するフォトリアルな発話動画像生成を行う手法は,動画コンテンツの自動生成や対話システムなどへの応用が期待されている.従来の手法では,顔特徴点として OpenFace により抽出されたランドマークを利用しているが,顔以外の部分の再現が不安定になる問題があった.本稿では,顔領域以外にも拡張が可能な Keypoint 特徴量を導入し,動画像の安定化を図る.客観評価および主観評価により OpenFace のみの場合に比べて安定した発話動画像が得られることを示す. | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AN10438388 | |||||||||||
書誌情報 |
研究報告音楽情報科学(MUS) 巻 2024-MUS-140, 号 17, p. 1-5, 発行日 2024-06-07 |
|||||||||||
ISSN | ||||||||||||
収録物識別子タイプ | ISSN | |||||||||||
収録物識別子 | 2188-8752 | |||||||||||
Notice | ||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |