@techreport{oai:ipsj.ixsq.nii.ac.jp:00233864,
 author = {青木, 勇樹 and 小林, 尚輝 and 大越, 匡 and 中澤, 仁},
 issue = {17},
 month = {May},
 note = {本研究では,一般物体検出と CNN および LSTM を組み合わせることで,物体の特徴や数に着目した新しいモデルを提案する.近年,GPS に依存しない画像ベースの自己位置推定において,深層学習ベースの様々な手法が数多く研究されている.一方,従来の手法は物体単位での特徴が適切に考慮されておらず,同様の物体が多く写る室内環境に適していないことが課題が挙げられた.そこで,本手法では一般物体検出の YOLOv8 でクロップした検出物体に対し,CNN で特徴抽出を行い,さらに LSTM によって 1 つの特徴量に統合することで,複数個の物体特徴を考慮した位置推定を実現する.大学内の研究室データセットを使用した実験により,提案手法は同じ層数を持つ全体画像を入力とした CNN モデルと比較して,14.4% 高い精度を達成することが明らかになった.この結果より,屋内の位置推定において,物体特徴に着目した手法を探求することの有望な可能性を示した., In this work, we propose a novel model that focuses on object features by combining object detection with CNN and LSTM networks. In recent years, a multitude of deep learning-based methods for Visual Localization, have been extensively researched. However, conventional methods do not adequately account for object-level features. Therefore, it is difficult to use indoors where similar objects appear frequently. Our method applies CNN for feature extraction on detected objects cropped by YOLOv8, an object detection algorithm, and then integrates these features into a single feature vector using LSTM, enabling location estimation that takes into account multiple object features. Experiments using the new indoor dataset of our laboratory room have revealed that our proposed method achieves a 14.4% higher accuracy compared to CNN models that input the whole image with the same number of layers. These results demonstrate the promising potential of exploring methods focused on object features for indoor localization.},
 title = {一般物体検出とLSTMを用いた画像に基づく屋内位置推定},
 year = {2024}
}