| Item type |
SIG Technical Reports(1) |
| 公開日 |
2025-05-22 |
| タイトル |
|
|
言語 |
ja |
|
タイトル |
ナレッジグラフとGPT-4Vを用いた農作物画像向けプロンプト生成とデータ拡張の自動化 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Automated Prompt Generation and Data Extension for Crop Images Using Knowledge Graph and GPT-4V |
| 言語 |
|
|
言語 |
jpn |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
静岡大学大学院総合科学技術研究科情報学専攻 |
| 著者所属 |
|
|
|
静岡大学大学院総合科学技術研究科情報学専攻 |
| 著者所属 |
|
|
|
静岡大学大学院総合科学技術研究科情報学専攻 |
| 著者所属 |
|
|
|
静岡大学学術員情報学領域 |
| 著者所属 |
|
|
|
静岡大学学術員情報学領域 |
| 著者所属 |
|
|
|
静岡大学学術員情報学領域/静岡大学グリーン科学技術研究所 |
| 著者名 |
中根,睦仁
下口,泰輝
大川,颯己
小池,誠
野村,祐一郎
峰野,博史
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,深層生成モデルを用いた生成データ拡張(Generative Data Augmentation)が,画像認識や物体検出などの分野で注目を集めている.特に農業分野においては,天候や栽培時期の制約により画像データの収集が困難であることから,生成データによる教師データの補完が有効であるとされる.本研究では,農作物画像に対してナレッジグラフとGPT-4Vを組み合わせることで,自動的かつ構造的に整合性のあるプロンプトを生成し,それに基づく教師データの拡張を行う手法を提案する.具体的には,対象画像を空・地面・植物の3要素に分割し,それぞれに対して条件付き拡散モデルを用いたエッジ画像ベースの生成学習を行う.各要素の生成には,GPT-4Vによって画像から得られた情報とナレッジグラフに基づいて生成されたプロンプトを用い,その後,各生成画像をレイヤー順に合成することで高精度な合成画像を得る.本研究では,提案手法の詳細とその評価結果について報告する. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12628327 |
| 書誌情報 |
研究報告コンシューマ・デバイス&システム(CDS)
巻 2025-CDS-43,
号 14,
p. 1-8,
発行日 2025-05-22
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8604 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |