Item type |
Symposium(1) |
公開日 |
2018-11-24 |
タイトル |
|
|
タイトル |
キリシタン資料のローマ字原文対応和文テキストの作成 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Creating parallel texts of "Christian materials" in Muromachi era: the original Romanized Text and its transliteration to Japanese characters |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
corpus\n |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
texts\n |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
morphological analysis\n |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
christian materials |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
国立国語研究所 |
著者所属 |
|
|
|
国立国語研究所 |
著者所属 |
|
|
|
国立国語研究所 |
著者所属(英) |
|
|
|
en |
|
|
National Institute for Japanese Language and Linguistics |
著者所属(英) |
|
|
|
en |
|
|
National Institute for Japanese Language and Linguistics |
著者所属(英) |
|
|
|
en |
|
|
National Institute for Japanese Language and Linguistics |
著者名 |
片山, 久留美
小木曽, 智信
中村, 壮範
|
著者名(英) |
Kurumi, Katayama
Toshinobu, Ogiso
Takenori, Nakamura
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
国立国語研究所で構築中の『日本語歴史コーパス』に『室町時代編Ⅱキリシタン資料』として『天草版平家物語』『天草版伊曽保物語』の2作品が追加された.これらの資料は原本がポルトガル式ローマ字により表記されており,当時の発音を知ることができる資料として日本語研究上重要な位置を占める.コーパス化にあたっては,ローマ字テキストと和文テキストを用意し両者をアラインメントにより対応付けることで二つのテキストを同時に参照可能にした.その際,仮の和文テキストを作成して形態素解析を行い,付与された形態論情報を利用することによって,均質性の高い独自の和文テキストを自動で出力したほか,ローマ字テキストと和文テキストのアラインメント作業も効率よく行うことが可能となった. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
The National Institute for Japanese Language and Linguistics created a morphologically annotated corpus of the “Christian Materials” (Kirishitan Shiryō) written in the Muromachi era. The original texts of the Christian Materials “Feiqe no Monogatari” and “Esopo no Fabulas” were written in the Roman alphabet with Portuguese spellings that were current in the 16th century. For the study of the phonetics and morphology of the Japanese language at that time, we had to make it possible to align the original Romanized texts with corresponding texts transliterated into Japanese characters. To conduct this task, we prepared intermediate texts with Japanese orthography in conformance with previous research, and performed a morphological analysis on those texts with a parser using information from our dictionary for Late Middle Japanese. In this way we were able to both automatically generate Japanese texts with a high level of regularity and also align the original Roman alphabet texts and their Japanese character counterparts into parallel texts in an efficient manner. |
書誌情報 |
じんもんこん2018論文集
巻 2018,
p. 89-96,
発行日 2018-11-24
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |