@techreport{oai:ipsj.ixsq.nii.ac.jp:00212206, author = {池内, 省吾 and 南條, 浩輝 and 馬, 青}, issue = {6}, month = {Jul}, note = {具体的な事物や概念などについての説明テキストから,それを表す語(用語)を見つけだす用語検索について述べる.説明テキストが与えられたとき,まず Web 検索を行い,その Web 検索結果(文書)の中から用語候補を抽出しユーザに提示することで用語検索を行う手法を提案する.BERT を用いた文章読解では,検索質問と文書を BERT の入力として与え,文書中から答えとなる区間を求めている.本研究でも BERT を用いて検索質問とその答えとなる用語を含むと考えられる Web 文書から用語を抽出することで用語検索を行えるか調査を行う.その際,複数の Web 文書からの用語候補の統合も行う.さらに,検索質問についても文章読解で扱われていた論理的に答えを導き出せる「整った検索質問」ではなく,ユーザが生成する「整っていない検索質問」での用語検索も調査する.実験の結果,Wikipedia のような比較的整った文書に限らない一般の Web 文書から用語の検索は難しいタスクであること,クエリが整ったものではない場合はさらに難しいことを確認した.また,複数文書からの用語候補の抽出を行い,頻度に基づいて単純にランク付けすることで,1 位に用語を 20~30% 程度の精度で,10 位以内に用語を 40% 程度の精度で見つけられることが分かった.}, title = {BERTを用いたWeb文書からの用語検索}, year = {2021} }