| Item type |
Symposium(1) |
| 公開日 |
2020-12-05 |
| タイトル |
|
|
タイトル |
多重の読みを持つ宣命コーパスの構築 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Construction of the corpus of "Senmyō" with multiple readings |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
コーパス; 上代日本語; テキスト; 形態素解析 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
| 著者所属 |
|
|
|
国立国語研究所 |
| 著者所属 |
|
|
|
中央大学 |
| 著者所属 |
|
|
|
昭和女子大学 |
| 著者所属 |
|
|
|
国立国語研究所 |
| 著者所属(英) |
|
|
|
en |
|
|
National Institute for Japanese Language and Linguistics, Chuo University, Showa Women's University, National Institute for Japanese Language and Linguistics |
| 著者名 |
呉, 寧真
池田, 幸恵
須永, 哲也
小木曽, 智信
|
| 著者名(英) |
Neisin, Go Yukie Ikeda Tetsuya Sunaga Toshinobu Ogiso
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
国立国語研究所の『日本語歴史コーパス』の一部として,8世紀に書かれた『続日本紀』宣命を収録する「奈良時代編Ⅱ宣命」を追加・公開した.上代の公的文書は一般に漢文体で書かれ,原文の解読が難しい.一方,宣命は和文体で,助詞・助動詞等が一字一音の万葉仮名を用いて書かれており,音読が困難な時代のテキストの読解と発音を知る重要な日本語資料である.コーパス化にあたっては,漢字と万葉仮名によって表記されている原文を,独自の漢字仮名交じりテキストに変換して形態論情報を付与していた.また,他の資料では一般的に音読する漢語を訓読している場合など,表記と単語情報とが単純に対応しない問題を解決するために,同一箇所に複数の形態論情報を付与した. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
As a part of the Corpus of Historical Japanese, the National Institute for Japanese Language and Linguistics created a morphologically annotated corpus of the senmyō in the “Shoku Nihongi,” written in the 8th century. During this period official Japanese texts were usually written in Classical Chinese, but senmyō were written in native Japanese. Because function words such as particles and adverbs are written in these texts in man'yōgana, which indicate pronunciations, senmyō constitute a very important material of the Japanese language providing the reading and pronunciation of texts from a period for which transliteration is difficult. In making this corpus, we prepared both the original Chinese text and the translated Japanese text and made it possible to refer to both texts at the same time. In order to resolve difficulties where the notation and word information do not simply correspond to each other (for example, in cases of uncommon readings for Chinese characters), we provided multiple entries in the morphological information assigned to the item in question. |
| 書誌情報 |
じんもんこん2020論文集
巻 2020,
p. 253-260,
発行日 2020-12-05
|
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |