@article{oai:ipsj.ixsq.nii.ac.jp:00231843, author = {石幡, 柊介 and 折原, 良平 and 清, 雄一 and 田原, 康之 and 大須賀, 昭彦 and Syuusuke, Ishihata and Ryohei, Orihara and Yuichi, Sei and Yasuyuki, Tahara and Akihiko, Ohsuga}, issue = {1}, journal = {情報処理学会論文誌}, month = {Jan}, note = {近年,StyleGANを画像編集タスクに適用する研究が進められている.画像編集タスクは背景画像の編集にも適用可能だが,背景画像は顔画像などの前景画像に比べて多様であるため,画像の編集性能が低下する.また,編集内容を的確にシステムに伝えることが難しいため,コンテント編集が困難という問題もある.たとえば自然言語による画像編集では編集対象となる背景画像のオブジェクトの指定が曖昧となるため,編集された画像は編集者にとって好ましくないものとなってしまう.一方でセマンティックセグメンテーションを使用すれば編集者の意図するコンテントの編集ができると考える.本研究ではGAN Inversionと呼ばれるタスクにおいて,セマンティックセグメンテーションマスクを取り入れた,エンコーダベースのGAN Inversion手法であるHyperStyleを基にしたフレームワークを提案する.GAN Inversionで求められる画像の再構成品質を維持しつつ,従来のスタイル編集性能を持ちながら,コンテント編集も可能にする.実験を行った結果,定性的な評価では本モデルが画像のコンテントとスタイルを別々に編集できることを確認した., Recently,research has been conducted on applying StyleGAN to image editing tasks. Although the technique can be applied to editing background images, because they are more diverse than foreground images such as face images, editability is compromised. In addition, content editing is difficult because it is difficult to accurately convey the edited content to the system. For example, because natural language instructions can be ambiguous, edited images become undesirable for the user. Therefore, a semantic segmentation mask can be used to edit content as intended by the editor. In our study, we propose a framework based on HyperStyle, an encoder-based GAN Inversion method that incorporates a semantic segmentation mask in a task called GAN Inversion. Our method can edit the image style and content independently while maintaining the quality of image reconstruction required by GAN Inversion. As a result, the qualitative evaluation confirms that our model enabled the editing of image content and style separately.}, pages = {83--96}, title = {セマンティックセグメンテーションを利用したGAN Inversionによる背景画像の編集手法の提案}, volume = {65}, year = {2024} }