| Item type |
SIG Technical Reports(1) |
| 公開日 |
2022-09-22 |
| タイトル |
|
|
タイトル |
CrossWeighの日本語NERデータセットへの適用 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Applying CrossWeigh to the Japanese NER Dataset |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
知識,メタデータ |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
茨城大学工学部情報工学科 |
| 著者所属 |
|
|
|
茨城大学大学院理工学研究科情報科学領域 |
| 著者所属(英) |
|
|
|
en |
|
|
Department of Computer and Information Sciences, College of Engineering, Ibaraki University |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Science and Engineering, Department of Computer and Information Sciences, Ibaraki University |
| 著者名 |
西村, 柾人
新納, 浩幸
|
| 著者名(英) |
Masato, Nishimura
Hiroyuki, Shinnou
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
通常,教師あり学習は訓練データには誤りがないという前提で学習が行われるが,実際には誤りを含む場合も多い.特に NER のデータセットはラベルの定義に曖昧なものがあり,複数の作業者でのタグ付けには誤りが生じやすい.このような背景から Wang らは誤ったラベルの付いたデータセットから NER のモデルを学習する CrossWeigh を提案した.本論文では CrossWeigh をストックマーク株式会社が提供している,Wikipedia の日本語 NER データセットに適用し,CrossWeigh の効果を確認する.同時に,このデータセット内の誤りの検出を試みる. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
| 書誌情報 |
研究報告自然言語処理(NL)
巻 2022-NL-253,
号 21,
p. 1-5,
発行日 2022-09-22
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |