@techreport{oai:ipsj.ixsq.nii.ac.jp:02002175, author = {中根,睦仁 and 下口,泰輝 and 大川,颯己 and 小池,誠 and 野村,祐一郎 and 峰野,博史}, issue = {14}, month = {May}, note = {近年,深層生成モデルを用いた生成データ拡張(Generative Data Augmentation)が,画像認識や物体検出などの分野で注目を集めている.特に農業分野においては,天候や栽培時期の制約により画像データの収集が困難であることから,生成データによる教師データの補完が有効であるとされる.本研究では,農作物画像に対してナレッジグラフとGPT-4Vを組み合わせることで,自動的かつ構造的に整合性のあるプロンプトを生成し,それに基づく教師データの拡張を行う手法を提案する.具体的には,対象画像を空・地面・植物の3要素に分割し,それぞれに対して条件付き拡散モデルを用いたエッジ画像ベースの生成学習を行う.各要素の生成には,GPT-4Vによって画像から得られた情報とナレッジグラフに基づいて生成されたプロンプトを用い,その後,各生成画像をレイヤー順に合成することで高精度な合成画像を得る.本研究では,提案手法の詳細とその評価結果について報告する.}, title = {ナレッジグラフとGPT-4Vを用いた農作物画像向けプロンプト生成とデータ拡張の自動化}, year = {2025} }