@techreport{oai:ipsj.ixsq.nii.ac.jp:00234173, author = {田邊, 光 and 柳井, 啓司}, issue = {42}, month = {May}, note = {本研究では,多様な知識に基づく推論が可能な大規模視覚言語モデルを食事画像からのカロリー量推定に活用する二つの方法の有効性を検証する.一つ目は大規模視覚言語モデルをファインチューニングする方法であり,Nutrition5k における評価で既存手法に匹敵する結果となった.二つ目は食品体積推定モデルを導入する方法であり,ゼロショットカロリー量推定について複数の指標で優れた結果となった.}, title = {大規模視覚言語モデルを用いた食事画像からのカロリー量推定}, year = {2024} }