WEKO3
アイテム
StyleGANを用いたテキストによる人物画像の服装編集手法
https://ipsj.ixsq.nii.ac.jp/records/224532
https://ipsj.ixsq.nii.ac.jp/records/224532d2cd5380-d2e2-4e9c-8ef0-e9a44f221394
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2023-02-20 | |||||||||||
| タイトル | ||||||||||||
| タイトル | StyleGANを用いたテキストによる人物画像の服装編集手法 | |||||||||||
| 言語 | ||||||||||||
| 言語 | jpn | |||||||||||
| キーワード | ||||||||||||
| 主題Scheme | Other | |||||||||||
| 主題 | 画像処理 | |||||||||||
| 資源タイプ | ||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
| 資源タイプ | technical report | |||||||||||
| 著者所属 | ||||||||||||
| 現在,筑波大学 | ||||||||||||
| 著者所属 | ||||||||||||
| 現在,筑波大学 | ||||||||||||
| 著者所属 | ||||||||||||
| 現在,筑波大学 | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| Presently with University of Tsukuba | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| Presently with University of Tsukuba | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| Presently with University of Tsukuba | ||||||||||||
| 著者名 |
吉川, 天斗
× 吉川, 天斗
× 遠藤, 結城
× 金森, 由博
|
|||||||||||
| 論文抄録 | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | 本研究では,人物全身画像を対象に StyleGAN の生成画像をテキスト入力によって制御する問題に取り組む.既存手法では対象ドメインを人や動物の顔に絞っており,人物全身画像のように服装や体型などの多様性が高いドメインには適していない.そこで本研究では,ネットワークアーキテクチャの工夫と推論時のマスク処理によって,人物全身画像でも高品質なテキスト制御を実現する.提案手法では,既存手法と同様に StyleGAN の潜在変数をテキストに従って操作する Mapper Network を学習させるアプローチを採用する.しかし,既存手法の Mapper Network ではテキストが正確に画像に反映されないため,Transformer をベースとしたネットワークアーキテクチャを提案する.また,テキストとは無関係な領域の編集を避けるため,推論時の特徴空間におけるマスク処理を導入する.実験結果を通して,提案手法では既存手法よりも高品質な人物全身画像のテキスト制御が可能であることを示す. | |||||||||||
| 書誌レコードID | ||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||
| 収録物識別子 | AN10100541 | |||||||||||
| 書誌情報 |
研究報告コンピュータグラフィックスとビジュアル情報学(CG) 巻 2023-CG-189, 号 17, p. 1-8, 発行日 2023-02-20 |
|||||||||||
| ISSN | ||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||
| 収録物識別子 | 2188-8949 | |||||||||||
| Notice | ||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
| 出版者 | ||||||||||||
| 言語 | ja | |||||||||||
| 出版者 | 情報処理学会 | |||||||||||