@techreport{oai:ipsj.ixsq.nii.ac.jp:00241591, author = {多田, 智貴 and 林, 克彦 and 上垣外, 英剛 and 松野, 省吾}, issue = {16}, month = {Dec}, note = {Wikipedia には幅広い種類の記事や画像があるが,その中でも特筆すべき特徴を持ったコンテンツを集めた項目が存在する.例えば,珍妙で面白い記事を集めた “珍項目”,百科事典として優れた記事・画像を集めた “秀逸な記事” と “秀逸な画像” などが挙げられる.現状,このような特筆すべき項目に対する登録記事数は少なく,登録に必要な審査や議論が停滞している.この理由としては,登録の是非が判定者の主観に依存する場合が多く,判定が難しいことが考えられる.本稿では特筆すべき項目に対する登録自動化に向けて,大規模言語モデル(LLM)や大規模画像言語モデル(LVLM)が持つ登録判定能力の調査を実施した.実験では珍項目記事とその他の閲覧数の多い記事を対象として,LLM が分類可能かを分析した.実験より,珍項目への登録判定に対して LLM は有効であると判明した.また,実在しない記事が誤登録されるという課題に対処するために,架空の記事を検出可能か検証し,LLM の事実検証能力の高さを確認した.加えて,秀逸な画像候補を対象として,LVLM を用いた登録分類を行った.結果として,画像に LVLM を用いた場合では,分類精度が低く,登録判定が困難であった.本稿より,LLM を記事の登録手続きに応用することは十分現実的であるが,LVLM を画像の登録手続きに応用することには課題があると分かった.なお,本稿で使用したデータは GitHub で公開済みである(https://github.com/UTokyo-HayashiLab/WikipediaFeaturedCategory).}, title = {登録に議論が必要なWikipedia項目への自動登録に向けた調査}, year = {2024} }