@techreport{oai:ipsj.ixsq.nii.ac.jp:00218701, author = {浅野, 歴 and 谷津, 元樹 and 森田, 武史}, issue = {11}, month = {Jun}, note = {ソーシャルロボットが画像入力より得られる周辺状況に基づいた発話を行う際,駄洒落等のユーモアを付加できれば,ユーザはロボットに対しより高い親近感を持ちうると考えられる.関連研究として,駄洒落を含む画像キャプション生成手法が提案されている.この画像キャプション生成モデルの構築には,画像とその描画内容に即した駄洒落文のペアを集めたデータセットが必要となるが,現在,日本語を対象とした本データセットは公開されておらず,本データセット作成コストが高いという課題がある.そこで,本研究では既存のキャプション生成モデルやオブジェクト検出を用いて画像から重要語を抽出し,駄洒落文を収集したコーパスから画像に合った駄洒落文を選択するためのランキング手法を提案する.MS COCO データセットからランダムに選択した 10 枚の画像に対して提案手法を用いて各画像に合った駄洒落文を選択し,10 名の被験者に「駄洒落文が画像に対して適切であるか」を質問し,5 段階評価を行った.その結果,評価値の平均は 3.11 となり「どちらともいえない」を若干上回る結果が得られた.}, title = {キャプション及び物体認識ラベルを用いた画像に関連する駄洒落文の選択手法}, year = {2022} }