@techreport{oai:ipsj.ixsq.nii.ac.jp:00232737, author = {宮田, 優一 and 井上, 勝文 and 吉岡, 理文}, issue = {46}, month = {Feb}, note = {Stable Diffusion では,入力画像の各画素と入力テキストの各単語間の関連度を表す Cross Attention を計算しており,そのAttention Weight を用いた領域分割手法が提案されている.またこの領域分割手法では,入力画像の各画素間の関連度を表す Self Attention を用いた,領域分割結果の洗練も行う.領域分割精度を向上するには,Cross Attention の精度向上と Self Attention による洗練方法の改善が課題となる.本研究では前者の課題に対し,Attention Weight 以外の要素も考慮したベクトルノルムという手法の導入を提案する.また,本研究では後者の課題に対し,複数存在する Attention Weight を合計した領域分割結果を洗練する代わりに個別に洗練する手法と,Self Attention に対するベクトルノルムの導入を提案する.本研究では,提案手法の有効性を複数のデータセットで検証する.}, title = {Stable DiffusionのCross Attentionに基づく領域分割へのベクトルノルム導入の検討}, year = {2024} }