ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. シンポジウム
  2. シンポジウムシリーズ
  3. じんもんこんシンポジウム
  4. 2018

キリシタン資料のローマ字原文対応和文テキストの作成

https://ipsj.ixsq.nii.ac.jp/records/192447
https://ipsj.ixsq.nii.ac.jp/records/192447
0666792e-b9ea-4ec2-b6dd-a802a42d9f3b
名前 / ファイル ライセンス アクション
IPSJ-CH2018014.pdf IPSJ-CH2018014.pdf (1.6 MB)
Copyright (c) 2018 by the Information Processing Society of Japan
オープンアクセス
Item type Symposium(1)
公開日 2018-11-24
タイトル
タイトル キリシタン資料のローマ字原文対応和文テキストの作成
タイトル
言語 en
タイトル Creating parallel texts of "Christian materials" in Muromachi era: the original Romanized Text and its transliteration to Japanese characters
言語
言語 jpn
キーワード
主題Scheme Other
主題 corpus\n
キーワード
主題Scheme Other
主題 texts\n
キーワード
主題Scheme Other
主題 morphological analysis\n
キーワード
主題Scheme Other
主題 christian materials
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_5794
資源タイプ conference paper
著者所属
国立国語研究所
著者所属
国立国語研究所
著者所属
国立国語研究所
著者所属(英)
en
National Institute for Japanese Language and Linguistics
著者所属(英)
en
National Institute for Japanese Language and Linguistics
著者所属(英)
en
National Institute for Japanese Language and Linguistics
著者名 片山, 久留美

× 片山, 久留美

片山, 久留美

Search repository
小木曽, 智信

× 小木曽, 智信

小木曽, 智信

Search repository
中村, 壮範

× 中村, 壮範

中村, 壮範

Search repository
著者名(英) Kurumi, Katayama

× Kurumi, Katayama

en Kurumi, Katayama

Search repository
Toshinobu, Ogiso

× Toshinobu, Ogiso

en Toshinobu, Ogiso

Search repository
Takenori, Nakamura

× Takenori, Nakamura

en Takenori, Nakamura

Search repository
論文抄録
内容記述タイプ Other
内容記述 国立国語研究所で構築中の『日本語歴史コーパス』に『室町時代編Ⅱキリシタン資料』として『天草版平家物語』『天草版伊曽保物語』の2作品が追加された.これらの資料は原本がポルトガル式ローマ字により表記されており,当時の発音を知ることができる資料として日本語研究上重要な位置を占める.コーパス化にあたっては,ローマ字テキストと和文テキストを用意し両者をアラインメントにより対応付けることで二つのテキストを同時に参照可能にした.その際,仮の和文テキストを作成して形態素解析を行い,付与された形態論情報を利用することによって,均質性の高い独自の和文テキストを自動で出力したほか,ローマ字テキストと和文テキストのアラインメント作業も効率よく行うことが可能となった.
論文抄録(英)
内容記述タイプ Other
内容記述 The National Institute for Japanese Language and Linguistics created a morphologically annotated corpus of the “Christian Materials” (Kirishitan Shiryō) written in the Muromachi era. The original texts of the Christian Materials “Feiqe no Monogatari” and “Esopo no Fabulas” were written in the Roman alphabet with Portuguese spellings that were current in the 16th century. For the study of the phonetics and morphology of the Japanese language at that time, we had to make it possible to align the original Romanized texts with corresponding texts transliterated into Japanese characters. To conduct this task, we prepared intermediate texts with Japanese orthography in conformance with previous research, and performed a morphological analysis on those texts with a parser using information from our dictionary for Late Middle Japanese. In this way we were able to both automatically generate Japanese texts with a high level of regularity and also align the original Roman alphabet texts and their Japanese character counterparts into parallel texts in an efficient manner.
書誌情報 じんもんこん2018論文集

巻 2018, p. 89-96, 発行日 2018-11-24
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-20 00:08:38.467188
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3