@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00192447,
 author = {片山, 久留美 and 小木曽, 智信 and 中村, 壮範 and Kurumi, Katayama and Toshinobu, Ogiso and Takenori, Nakamura},
 book = {じんもんこん2018論文集},
 month = {Nov},
 note = {国立国語研究所で構築中の『日本語歴史コーパス』に『室町時代編Ⅱキリシタン資料』として『天草版平家物語』『天草版伊曽保物語』の2作品が追加された.これらの資料は原本がポルトガル式ローマ字により表記されており,当時の発音を知ることができる資料として日本語研究上重要な位置を占める.コーパス化にあたっては,ローマ字テキストと和文テキストを用意し両者をアラインメントにより対応付けることで二つのテキストを同時に参照可能にした.その際,仮の和文テキストを作成して形態素解析を行い,付与された形態論情報を利用することによって,均質性の高い独自の和文テキストを自動で出力したほか,ローマ字テキストと和文テキストのアラインメント作業も効率よく行うことが可能となった., The National Institute for Japanese Language and Linguistics created a morphologically annotated corpus of the “Christian Materials” (Kirishitan Shiryō) written in the Muromachi era. The original texts of the Christian Materials “Feiqe no Monogatari” and “Esopo no Fabulas” were written in the Roman alphabet with Portuguese spellings that were current in the 16th century. For the study of the phonetics and morphology of the Japanese language at that time, we had to make it possible to align the original Romanized texts with corresponding texts transliterated into Japanese characters. To conduct this task, we prepared intermediate texts with Japanese orthography in conformance with previous research, and performed a morphological analysis on those texts with a parser using information from our dictionary for Late Middle Japanese. In this way we were able to both automatically generate Japanese texts with a high level of regularity and also align the original Roman alphabet texts and their Japanese character counterparts into parallel texts in an efficient manner.},
 pages = {89--96},
 publisher = {情報処理学会},
 title = {キリシタン資料のローマ字原文対応和文テキストの作成},
 volume = {2018},
 year = {2018}
}