WEKO3
アイテム
ワイヤフレームとの同時学習による単一画像からの深度推定
https://ipsj.ixsq.nii.ac.jp/records/204451
https://ipsj.ixsq.nii.ac.jp/records/2044510055feaa-febe-4b21-b216-c78b43112638
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2020 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2020-05-07 | |||||||||
タイトル | ||||||||||
タイトル | ワイヤフレームとの同時学習による単一画像からの深度推定 | |||||||||
タイトル | ||||||||||
言語 | en | |||||||||
タイトル | Depth Estimation from Single Image by Simultaneous Learning with Wireframe | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
キーワード | ||||||||||
主題Scheme | Other | |||||||||
主題 | 卒論スポットライトセッション | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
資源タイプ | technical report | |||||||||
著者所属 | ||||||||||
東邦大学/現在,筑波大学 | ||||||||||
著者所属 | ||||||||||
東邦大学 | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
Toho University / Presently with University of Tsukuba | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
Toho University | ||||||||||
著者名 |
水沼, 佑太
× 水沼, 佑太
× 数藤, 恭子
|
|||||||||
論文抄録 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | 近年,単一画像からの機械学習を用いた深度推定手法が多数試みられている.しかし,十分な精度を得ることは難しく,その一つの要因として物理的な情報が不足していることが考えられる.そこで本研究では三次元構造の情報を補うデータを同時に学習する機械学習ベースの手法を提案する.具体的には,深度とワイヤフレームを同時に学習するネットワークを構築する.ワイヤフレームは,画像上で消失線とみなせるような平行な線分の組を含むことから深度情報を補う可能性と,また,平面同士の境界線を構成することから境界付近の推定精度を高める可能性を期待した.評価実験では,構築したネットワークを用いて深度のみを学習した場合と比較した.目視による評価では,一部の入力画像において,提案手法により線分で構成される人工物の輪郭や壁と床の境界線付近などで物理的な矛盾の減少が確認された.また,画素値の誤差を表す RMSE や,画像の類似度を表す SSIM を用いた評価では,提案手法により局所的に良好な学習ができることが確認された. | |||||||||
論文抄録(英) | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | In recent years, many depth estimation methods using machine learning from a single image have been attempted. However, if the information on the three-dimensional structure of the training data is insufficient, inconsistency may occur. In this article, we propose a machine learning-based method that simultaneously learns data that supplements three-dimensional structure information. Specifically, we construct a network that learns depth and wireframe at the same time by using wireframe as 3D structure information. Wireframes include a set of parallel line segments that can be regarded as vanishing lines on the image, We expected the possibility that supplementing depth information is improved, and the accuracy of estimation near the boundary is improved by forming a boundary between planes. In the evaluation experiment, we compared it with the case where only the depth was learned using the constructed network. In the visual evaluation, in some input images, it was confirmed that the proposed method reduced the inconsistency in the contour of the artificial object composed of line segments, and near the boundary between the wall and the floor. In the evaluation using RMSE, which represents the error of the pixel value, and SSIM, which represents the similarity of the images, it was confirmed that the proposed method could locally perform good learning. | |||||||||
書誌レコードID | ||||||||||
収録物識別子タイプ | NCID | |||||||||
収録物識別子 | AA11131797 | |||||||||
書誌情報 |
研究報告コンピュータビジョンとイメージメディア(CVIM) 巻 2020-CVIM-222, 号 19, p. 1-5, 発行日 2020-05-07 |
|||||||||
ISSN | ||||||||||
収録物識別子タイプ | ISSN | |||||||||
収録物識別子 | 2188-8701 | |||||||||
Notice | ||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
出版者 | ||||||||||
言語 | ja | |||||||||
出版者 | 情報処理学会 |