WEKO3
アイテム
WRIME-MT:日英・日中ソーシャルメディア対訳データセットの構築
https://ipsj.ixsq.nii.ac.jp/records/2002815
https://ipsj.ixsq.nii.ac.jp/records/200281517031ea8-2f43-43ac-b83a-2738d1928173
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
2027年6月29日からダウンロード可能です。
|
Copyright (c) 2025 by the Information Processing Society of Japan
|
|
| 非会員:¥660, IPSJ:学会員:¥330, NL:会員:¥0, DLIB:会員:¥0 | ||
| Item type | SIG Technical Reports(1) | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2025-06-29 | |||||||||||
| タイトル | ||||||||||||
| 言語 | ja | |||||||||||
| タイトル | WRIME-MT:日英・日中ソーシャルメディア対訳データセットの構築 | |||||||||||
| 言語 | ||||||||||||
| 言語 | jpn | |||||||||||
| キーワード | ||||||||||||
| 主題Scheme | Other | |||||||||||
| 主題 | 対訳・評価 | |||||||||||
| 資源タイプ | ||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
| 資源タイプ | technical report | |||||||||||
| 著者所属 | ||||||||||||
| 情報通信研究機構 | ||||||||||||
| 著者所属 | ||||||||||||
| 愛媛大学/大阪大学 | ||||||||||||
| 著者所属 | ||||||||||||
| 情報通信研究機構 | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| NICT | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| Ehime University / The University of Osaka | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| NICT | ||||||||||||
| 著者名 |
東山,翔平
× 東山,翔平
× 梶原,智之
× 内山,将夫
|
|||||||||||
| 論文抄録 | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | 自然言語処理・機械翻訳において,ユーザ生成テキストは,逸脱的現象への対処が課題となる難しいドメインの1つである.本研究では,日本語ユーザ生成テキストの機械翻訳タスクと,同タスクにおける逸脱的表記のテキスト正規化に焦点を当て,評価用対訳データセットWRIME-MTの構築を行った.WRIME-MTは,日本語ソーシャルメディア投稿の原文テキストに,英語訳・中国語訳と,逸脱的表記の正規化情報や固有名などの言語情報が付与されたデータセットであり,日本語ユーザ生成テキストの機械翻訳評価において既存データセットを補完する位置づけとなる.本データセットを用いて,多言語および日本語中心の翻訳特化モデル・汎用言語モデルの翻訳精度評価を行い,最先端の自動正規化モデルによる正規化適用について一定の有効性を確認した. | |||||||||||
| 書誌レコードID | ||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||
| 収録物識別子 | AN10115061 | |||||||||||
| 書誌情報 |
研究報告自然言語処理(NL) 巻 2025-NL-264, 号 7, p. 1-14, 発行日 2025-06-29 |
|||||||||||
| ISSN | ||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||
| 収録物識別子 | 2188-8779 | |||||||||||
| Notice | ||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
| 出版者 | ||||||||||||
| 言語 | ja | |||||||||||
| 出版者 | 情報処理学会 | |||||||||||