| Item type |
SIG Technical Reports(1) |
| 公開日 |
2021-07-20 |
| タイトル |
|
|
タイトル |
複数の補助教師データセットを用いた固有表現抽出の学習手法 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Learning Method for Named Entity Recognition with Multiple Auxiliary Training Data |
| 言語 |
|
|
言語 |
jpn |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
同志社大学 |
| 著者所属 |
|
|
|
富士通株式会社 |
| 著者所属 |
|
|
|
同志社大学 |
| 著者所属 |
|
|
|
富士通株式会社 |
| 著者所属 |
|
|
|
富士通株式会社 |
| 著者所属 |
|
|
|
同志社大学 |
| 著者名 |
市川, 智也
渡邊, 大貴
田村, 晃裕
岩倉, 友哉
馬, 春鵬
加藤, 恒夫
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
固有表現抽出(Named Entity Recognition; NER)は,テキストからの知識獲得に用いる要素技術の一つであり,化学物質や医療の知識抽出に用いられている.NER の精度改善のため,対象タスクの教師データとは別の教師データを補助教師データとして用いるマルチタスク学習である補助学習が提案されている.従来の補助学習では補助教師データとして 1 種類の教師データしか用いていない.そこで,本研究では,複数種類の教師データを補助教師データとして活用する NER の学習手法を提案する.具体的には,補助教師データ毎の補助学習を順次行うことで,対象タスクのモデルを補助教師データの種類の数だけファインチューニングする方法と,全種類の教師データを一つの補助学習で用いる方法の 2 種類の学習手法を提案する.評価実験では,化学物質名抽出タスクにおいて,7種類の化学/科学技術分野の補助教師データを用いて提案手法の評価を行った.その結果,提案手法は従来手法よりも精度が高く,複数の補助教師データを用いることで精度が向上することを確認した. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
| 書誌情報 |
研究報告自然言語処理(NL)
巻 2021-NL-249,
号 4,
p. 1-7,
発行日 2021-07-20
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |