@techreport{oai:ipsj.ixsq.nii.ac.jp:00241089, author = {岡本, 瞬 and 飯塚, 里志 and 福井, 和広 and Shun, Okamoto and Satoshi, Iizuka and Kazuhiro, Fukui}, issue = {30}, month = {Nov}, note = {近年,Facebook や X,Flickr などのソーシャルネットワーキングサービス(SNS)が急速に発展している.その中でも,ファッションに関する投稿は,ビジュアルコンテンツに時代や流行が反映されるため,マーケティング戦略の観点からも多くの注目を集めている.しかし,現時点では,ファッション投稿に特化した SNS の人気度予測のための手法は十分に研究されていない.そこで本研究では,日本のファッション SNS「WEAR」から 30 万件以上の投稿データを収集し,投稿されたファッション画像,ハッシュタグ情報,閲覧数,ユーザー情報などを含む新たなファッション SNS データセットを構築する.さらに,視覚言語モデルを用いた,ファッション投稿の意味情報を効果的に抽出する Vision to Fashion Text Annotation (ViFTA) モジュールを導入したファッション SNS の人気度予測フレームワークを提案する.新たなファッション SNS データセットを用いて,提案フレームワークと既存の SNS 人気度予測手法との比較実験を行い,提案フレームワークが最も高い精度を実現することを示す., In recent years, Social Networking Services (SNS) such as Facebook, X, and Flickr have developed rapidly. Among these, fashion-related posts have gained significant attention from a marketing strategy perspective, as visual content reflects trends and eras. However, to date, methods for predicting the popularity of SNS posts specifically focused on fashion have not been sufficiently researched. In this study, we collect over 300,000 post data from Japan’s fashion SNS “WEAR”, constructing a new fashion SNS dataset that includes fashion images, hashtag information, view counts, and user information. We propose a fashion SNS popularity prediction framework that incorporates a Vision to Fashion Text Annotation (ViFTA) module, which effectively extracts semantic information from fashion posts using visual-language models. Comparative experiments between the proposed framework and existing SNS popularity prediction methods are conducted using the new fashion SNS dataset, demonstrating that the proposed framework achieves the highest accuracy.}, title = {マルチモーダル特徴量を用いたファッションSNSにおける人気度予測}, year = {2024} }