@techreport{oai:ipsj.ixsq.nii.ac.jp:00224590, author = {児玉, 道成 and 齊藤, 剛史 and Michinari, Kodama and Takeshi, Saitoh}, issue = {24}, month = {Feb}, note = {視覚情報のみを用いて発話内容を推定する読唇技術は,教師あり学習の一種であり,大規模なデータセットが望まれている.しかし,発話シーンの収集はコストがかかる問題がある.そこで本論文では,収集コストを抑えるために,少数データで学習するアプローチの中で,メタ学習を用いる手法を検討する.読唇用公開データセット LRW および SSSD,比較用として行動認識公開データセット UCF101 の三つのデータセットを用いて,ProtoNet や DeepBDC など幾つかのメタ学習手法を用いて認識実験を実施した.その結果,UCF101 に比べると LRW とSSSD では低い認識精度であった.本稿では実施した実験結果を報告する., Lip-reading technology, which estimates utterance content using only visual information, is a kind of supervised learning, and a large-scale data set is desired. However, collecting utterance scenes is costly. Therefore, in this paper, in order to reduce the collection cost, we consider a method that uses meta learning in the approach of learning with a small number of data. Recognition experiments were conducted using several meta learning methods such as ProtoNet and DeepBDC using three datasets: public datasets LRW and SSSD for lip-reading, and public action recognition dataset UCF101 for comparison. As a result, compared to UCF101, LRW and SSSD had lower recognition accuracy. In this paper, we report the experimental results.}, title = {メタ学習を用いた単語読唇の検討}, year = {2023} }