@techreport{oai:ipsj.ixsq.nii.ac.jp:00220251, author = {西村, 柾人 and 新納, 浩幸 and Masato, Nishimura and Hiroyuki, Shinnou}, issue = {21}, month = {Sep}, note = {通常,教師あり学習は訓練データには誤りがないという前提で学習が行われるが,実際には誤りを含む場合も多い.特に NER のデータセットはラベルの定義に曖昧なものがあり,複数の作業者でのタグ付けには誤りが生じやすい.このような背景から Wang らは誤ったラベルの付いたデータセットから NER のモデルを学習する CrossWeigh を提案した.本論文では CrossWeigh をストックマーク株式会社が提供している,Wikipedia の日本語 NER データセットに適用し,CrossWeigh の効果を確認する.同時に,このデータセット内の誤りの検出を試みる.}, title = {CrossWeighの日本語NERデータセットへの適用}, year = {2022} }