機械翻訳と多言語RoBERTaを利用した日本語での攻撃的な言葉の自動検出

藤原, 知樹; 伊藤, 彰則; 能勢, 隆

WEKO3

lat lon distance

[[sub_check.contents]]

[[sub_radio.contents]]

Field does not validate

[[sub_attr.contents]]　

インデックスツリー

アイテム

機械翻訳と多言語RoBERTaを利用した日本語での攻撃的な言葉の自動検出

https://ipsj.ixsq.nii.ac.jp/records/230194

名前 / ファイル	ライセンス	アクション
IPSJ-Z85-4W-03.pdf (732.6 kB)	Copyright (c) 2023 by the Information Processing Society of Japan

Item type

National Convention(1)

公開日

2023-02-16

タイトル

機械翻訳と多言語RoBERTaを利用した日本語での攻撃的な言葉の自動検出

言語

jpn

キーワード

主題Scheme

Other

主題

人工知能と認知科学

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_5794

資源タイプ

conference paper

著者所属

東北大

著者所属

東北大

著者所属

東北大

著者名

藤原, 知樹
伊藤, 彰則
能勢, 隆

論文抄録

内容記述タイプ

Other

内容記述

攻撃的な言葉の検出に類する研究は英語環境下では盛んに行われているものの、日本語環境下での研究はあまり盛んではなく、公開されているコーパスも存在しない。そこで、機械翻訳や多言語データで事前学習済みの言語モデルを活用することで、外国語のコーパスを利用して日本語対応の検出モデルを構築した。本研究では、複数の言語モデルおよび学習条件を比較するとともに、文の有害度を推定する日本語対応のAPIとも性能比較を行う。また、評価データについても正確なデータがないため、ノイズが含まれる3種類の評価データに対する検出性能の平均をとることで各モデルの性能評価を行う。

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN00349328

書誌情報

第85回全国大会講演論文集

巻 2023, 号 1, p. 817-818, 発行日 2023-02-16

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-19 11:15:05.002256

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

機械翻訳と多言語RoBERTaを利用した日本語での攻撃的な言葉の自動検出

× 藤原, 知樹

× 伊藤, 彰則

× 能勢, 隆

Versions

Share

Cite as

エクスポート