WEKO3
アイテム
ローマ字・カタカナ・キリル文字併用アイヌ語RoBERTa・DeBERTaモデルの開発
https://ipsj.ixsq.nii.ac.jp/records/224181
https://ipsj.ixsq.nii.ac.jp/records/224181677bb42d-c6a6-42e2-bf82-7aedc3ccefac
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2023-02-11 | |||||||
| タイトル | ||||||||
| タイトル | ローマ字・カタカナ・キリル文字併用アイヌ語RoBERTa・DeBERTaモデルの開発 | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 京都大学人文科学研究所附属東アジア人文情報学研究センター | ||||||||
| 著者名 |
安岡, 孝一
× 安岡, 孝一
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 書写言語としてのアイヌ語は,ローマ字 (ラテンアルファベット)・カタカナ・キリル文字など,多彩な文字と記法によって記述されてきた.その一方,抱合語としてのアイヌ語は,日本語や欧米諸語とは全く異なる言語構造を持つことから,これらの言語向けの RoBERTa・DeBERTa モデルは,そのままではアイヌ語に適用できない.本発表では,ローマ字・カタカナ・キリル文字で書かれたアイヌ語に対し,RoBERTa・DeBERTa モデルを開発する手法を示し,さらに形態素解析・係り受け解析への応用について考察する. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN1010060X | |||||||
| 書誌情報 |
研究報告人文科学とコンピュータ(CH) 巻 2023-CH-131, 号 7, p. 1-7, 発行日 2023-02-11 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 2188-8957 | |||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||