WEKO3
アイテム
機械翻訳と多言語RoBERTaを利用した日本語での攻撃的な言葉の自動検出
https://ipsj.ixsq.nii.ac.jp/records/230194
https://ipsj.ixsq.nii.ac.jp/records/230194a7b4b94c-8158-4a93-b85f-f556b30dacea
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
| Item type | National Convention(1) | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2023-02-16 | |||||||||||
| タイトル | ||||||||||||
| タイトル | 機械翻訳と多言語RoBERTaを利用した日本語での攻撃的な言葉の自動検出 | |||||||||||
| 言語 | ||||||||||||
| 言語 | jpn | |||||||||||
| キーワード | ||||||||||||
| 主題Scheme | Other | |||||||||||
| 主題 | 人工知能と認知科学 | |||||||||||
| 資源タイプ | ||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||
| 資源タイプ | conference paper | |||||||||||
| 著者所属 | ||||||||||||
| 東北大 | ||||||||||||
| 著者所属 | ||||||||||||
| 東北大 | ||||||||||||
| 著者所属 | ||||||||||||
| 東北大 | ||||||||||||
| 著者名 |
藤原, 知樹
× 藤原, 知樹
× 伊藤, 彰則
× 能勢, 隆
|
|||||||||||
| 論文抄録 | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | 攻撃的な言葉の検出に類する研究は英語環境下では盛んに行われているものの、日本語環境下での研究はあまり盛んではなく、公開されているコーパスも存在しない。そこで、機械翻訳や多言語データで事前学習済みの言語モデルを活用することで、外国語のコーパスを利用して日本語対応の検出モデルを構築した。本研究では、複数の言語モデルおよび学習条件を比較するとともに、文の有害度を推定する日本語対応のAPIとも性能比較を行う。また、評価データについても正確なデータがないため、ノイズが含まれる3種類の評価データに対する検出性能の平均をとることで各モデルの性能評価を行う。 | |||||||||||
| 書誌レコードID | ||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||
| 収録物識別子 | AN00349328 | |||||||||||
| 書誌情報 |
第85回全国大会講演論文集 巻 2023, 号 1, p. 817-818, 発行日 2023-02-16 |
|||||||||||
| 出版者 | ||||||||||||
| 言語 | ja | |||||||||||
| 出版者 | 情報処理学会 | |||||||||||