@techreport{oai:ipsj.ixsq.nii.ac.jp:00226738, author = {酒井, 敏彦 and 千綿, 伸彦 and 峯, 恒憲 and Toshihiko, Sakai and Nobuhiko, Chiwata and Tsunenori, Mine}, issue = {1}, month = {Jun}, note = {材料科学分野において,データ駆動型の材料設計が検討されている.その一環として文書から抽出した技術データの活用では,材料科学分野の研究者視点で整理された材料組成等の情報が重要であり,機械的に抽出する手法が求められている.本研究では,特許文書から材料を構成する構成物や比率等の表現抽出を行うため固有表現抽出を用いる.固有表現抽出の精度向上には,抽出対象の手掛かりとなる「手掛かり表現」が用いられるが,手掛かり語の新たな獲得に大きなコストを必要としていた.そこで,本研究では,材料科学技術表現抽出の新手法を提案する.提案手法では,抽出対象の固有表現を識別する固有表現と抽出対象の固有表現の手掛かり語を抽出するための手掛かり語タグを設計した.手掛かり語タグの固有表現抽出過程で,手掛かり語も同時抽出する.実験では,手掛かり語タグが抽出対象タグの抽出精度向上に寄与すること,手掛かり語タグを加えたとしても,全体の抽出性能が劣化しないこと,及び,新たな手掛かり語が獲得できることを示した.}, title = {手掛かり語タグを用いた特許文書の材料科学技術表現抽出}, year = {2023} }