Item type |
SIG Technical Reports(1) |
公開日 |
2023-03-11 |
タイトル |
|
|
タイトル |
化学工学関連論文中の命名法に基づく変数定義予測手法 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Variable Description Prediction Method Based on Nomenclature in Chemical Engineering Domain Papers |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
学習・推定 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
京都大学大学院情報学研究科 |
著者所属 |
|
|
|
京都大学大学院情報学研究科 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics, Kyoto University |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Informatics, Kyoto University |
著者名 |
加藤, 祥太
加納, 学
|
著者名(英) |
Shota, Kato
Manabu, Kano
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
製造業における物理モデル構築に要する多大な労力を削減するために,著者らは文献情報から物理モデルを自動で構築するシステム(Automated physical model builder; AutoPMoB)の実現を目指している.本研究では, AutoPMoB の実現に必要な要素技術の1つである文献からの変数定義抽出技術の開発に取り組む.化学プロセス関連論文には変数記号と変数定義の一覧である Nomenclature が含まれる場合があるが,Nomenclature が存在しない場合には文中から変数定義を正確に抽出する必要がある.本研究では変数定義抽出対象の論文以外に含まれる Nomenclature が変数定義抽出に有用か否かを検証した.入力の形式を変更しながら複数の BERT をファインチューニングして変数記号-変数定義ペアの正誤を判定した結果,XML 形式の変数記号を入力した場合が最高の性能(Precision: 0.955, Recall: 0.646)を達成した.さらなる精度向上には,論文の分野や変数の周りのテキストなど,変数記号と定義以外の情報を入力する方法や前処理方法の工夫が必要である. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Digital twins require a physical model, but physical model building requires significant effort. To streamline the arduous task, we aim to develop a system that automatically builds physical models from literature databases. This study investigated whether the performance of variable definition extraction can be improved by incorporating nomenclatures from papers other than the target papers. We fine-tuned multiple BERT models while changing the input format and evaluated which format was most effective in identifying the correct pairs of variable symbols and variable definitions. The best performance (Precision: 0.955, Recall: 0.646) was achieved when variable symbols were input in XML format. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
書誌情報 |
研究報告自然言語処理(NL)
巻 2023-NL-255,
号 3,
p. 1-4,
発行日 2023-03-11
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |