@techreport{oai:ipsj.ixsq.nii.ac.jp:00174458, author = {瀬川, 雄太 and 川本, 一彦 and 岡本, 一志}, issue = {49}, month = {Aug}, note = {本研究では,学習済み DCNN (deep convolutional neural network) の fine-tuning を利用した,画像分類ベースの一人称行動認識を行う手法を提案する.画像認識問題において state-of-the-art な DCNN の学習や,学習済み DCNN モデルの fine-tuning のような再学習は魅力的な手法である.しかしながら,必要となる訓練データを正解ラベルとともに大量収集することはコストが高い.一方で,一人称視点行動に付随する物体は映像中に現れやすく,かつ映像を通して見えの変化が小さいため,これを認識するための画像生成は容易に行うことができる.そこで,行動に付随する物体の画像を人工的に生成し背景画像と合成することで,一人称行動認識に向けた訓練画像を用意する.人工訓練データセットを用いて,学習済み DCNN モデルにおける最終層を fine-tuning し,domain-specific な応用の検証を行う.実験では,実際に撮影した一人称視点映像 20 種について,画像分類ベースの一人称読書行動認識の精度を評価する.人工訓練データセットに関する検証として,背景画像選択および人工本画像のための生成処理選択が,識別精度に与える影響を調査する.前者の検証において,ImageNet 画像を背景合成した訓練画像を用いて,ImageNet データセットを学習済みの Inception-v3 モデルを fine-tuning した場合に最も精度が高く,F 値にして 91.8% であった.後者の検証において,本表面のテクスチャを描画する処理が最も識別精度を高めることがわかり,この処理を付加した訓練画像による評価ではいずれも 85% 以上の F 値を得た.}, title = {画像分類を用いた一人称行動認識}, year = {2016} }