Item type |
SIG Technical Reports(1) |
公開日 |
2022-03-04 |
タイトル |
|
|
タイトル |
三次元情報を考慮した人物画像の意味的領域分割 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
顔画像処理とパラメタライズ |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
現在,筑波大学 |
著者所属 |
|
|
|
現在,筑波大学 |
著者所属 |
|
|
|
現在,筑波大学 |
著者所属 |
|
|
|
現在,筑波大学 |
著者所属(英) |
|
|
|
en |
|
|
Presently with University of Tsukuba |
著者所属(英) |
|
|
|
en |
|
|
Presently with University of Tsukuba |
著者所属(英) |
|
|
|
en |
|
|
Presently with University of Tsukuba |
著者所属(英) |
|
|
|
en |
|
|
Presently with University of Tsukuba |
著者名 |
奥山, 裕大
金森, 由博
遠藤, 結城
三谷, 純
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
人物画像の各ピクセルに対して髪やシャツ,スカートなど写っているもののラベルを推定する意味的領域分割が盛んに研究されている.現在の主流であるニューラルネットワークを用いた手法は RGB 画像のみを入力として,主に色の違いに基づいて領域を判断している.しかし,例えば同じ色のスーツの上下 (ジャケットとパンツ) など,色情報のみでは衣服の境界を識別できない場合がある.そこで本研究では既存手法とは異なり,人物に関する三次元情報を活用することで人物画像の意味的領域分割の精度を向上させる.三次元情報としては法線マップに着目し,人物画像から別途推定して利用する.本研究では,Transformer に基づく最新のネットワークに基づき,RGB 画像のみを入力とするネットワークと法線情報を入出力に含むネットワークによるアンサンブルを検討した.最終的な意味ラベルを決めるための Soft Voting の方法として,個別ネットワークが出力する確率の単純平均と,不確実性に基づく加重平均を検討した.提案するアンサンブル手法により,RGB 画像のみを入力とした場合に比べて精度良く意味ラベルを推定できることを示す. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10100541 |
書誌情報 |
研究報告コンピュータグラフィックスとビジュアル情報学(CG)
巻 2022-CG-185,
号 9,
p. 1-8,
発行日 2022-03-04
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8949 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |