2024-03-29T06:31:10Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001788032023-04-27T10:00:04Z01164:04179:09105:09161
遷移型句構造解析に基づく論文PDF中の数式XML解析jpnhttp://id.nii.ac.jp/1001/00178715/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=178803&item_no=1&attribute_id=1&file_no=1Copyright (c) 2017 by the Information Processing Society of Japan奈良先端科学技術大学院大学奈良先端科学技術大学院大学奈良先端科学技術大学院大学澤井, 裕一郎進藤, 裕之松本, 裕治数式は科学技術論文において多くの情報を担う重要な要素であり,論文の意味理解や高度な検索のためには,論文中の数式の高精度な構造解析が求められる.本研究では,科学技術論文の PDF ファイルに含まれる数式を対象に,数式の構造記述に特化した XML の一種である MathML 形式を予測するタスクに取り組む.特に,PDF ファイルから抽出した文字 ・ 図形情報の系列を入力として,XML の木構造を同定する句構造解析の問題として捉え,従来の遷移型句構造解析の手法を拡張して適用する.そして,医学分野の論文に含まれる数式データを用いて評価実験を行い,解析性能を報告する.AN10115061研究報告自然言語処理(NL)2017-NL-23113182017-05-082188-87792017-04-28