ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 自然言語処理(NL)
  3. 2023
  4. 2023-NL-255

化学工学関連論文中の命名法に基づく変数定義予測手法

https://ipsj.ixsq.nii.ac.jp/records/225290
https://ipsj.ixsq.nii.ac.jp/records/225290
8ce8c531-e4f6-44b4-819c-79032131f47b
名前 / ファイル ライセンス アクション
IPSJ-NL23255003.pdf IPSJ-NL23255003.pdf (1.2 MB)
Copyright (c) 2023 by the Institute of Electronics, Information and Communication Engineers This SIG report is only available to those in membership of the SIG.
NL:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2023-03-11
タイトル
タイトル 化学工学関連論文中の命名法に基づく変数定義予測手法
タイトル
言語 en
タイトル Variable Description Prediction Method Based on Nomenclature in Chemical Engineering Domain Papers
言語
言語 jpn
キーワード
主題Scheme Other
主題 学習・推定
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
京都大学大学院情報学研究科
著者所属
京都大学大学院情報学研究科
著者所属(英)
en
Graduate School of Informatics, Kyoto University
著者所属(英)
en
Graduate School of Informatics, Kyoto University
著者名 加藤, 祥太

× 加藤, 祥太

加藤, 祥太

Search repository
加納, 学

× 加納, 学

加納, 学

Search repository
著者名(英) Shota, Kato

× Shota, Kato

en Shota, Kato

Search repository
Manabu, Kano

× Manabu, Kano

en Manabu, Kano

Search repository
論文抄録
内容記述タイプ Other
内容記述 製造業における物理モデル構築に要する多大な労力を削減するために,著者らは文献情報から物理モデルを自動で構築するシステム(Automated physical model builder; AutoPMoB)の実現を目指している.本研究では, AutoPMoB の実現に必要な要素技術の1つである文献からの変数定義抽出技術の開発に取り組む.化学プロセス関連論文には変数記号と変数定義の一覧である Nomenclature が含まれる場合があるが,Nomenclature が存在しない場合には文中から変数定義を正確に抽出する必要がある.本研究では変数定義抽出対象の論文以外に含まれる Nomenclature が変数定義抽出に有用か否かを検証した.入力の形式を変更しながら複数の BERT をファインチューニングして変数記号-変数定義ペアの正誤を判定した結果,XML 形式の変数記号を入力した場合が最高の性能(Precision: 0.955, Recall: 0.646)を達成した.さらなる精度向上には,論文の分野や変数の周りのテキストなど,変数記号と定義以外の情報を入力する方法や前処理方法の工夫が必要である.
論文抄録(英)
内容記述タイプ Other
内容記述 Digital twins require a physical model, but physical model building requires significant effort. To streamline the arduous task, we aim to develop a system that automatically builds physical models from literature databases. This study investigated whether the performance of variable definition extraction can be improved by incorporating nomenclatures from papers other than the target papers. We fine-tuned multiple BERT models while changing the input format and evaluated which format was most effective in identifying the correct pairs of variable symbols and variable definitions. The best performance (Precision: 0.955, Recall: 0.646) was achieved when variable symbols were input in XML format.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10115061
書誌情報 研究報告自然言語処理(NL)

巻 2023-NL-255, 号 3, p. 1-4, 発行日 2023-03-11
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8779
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 12:51:11.415170
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3