WEKO3
アイテム
古文・現代語訳並列コーパスによる古語・現代語辞書の構築
https://ipsj.ixsq.nii.ac.jp/records/100660
https://ipsj.ixsq.nii.ac.jp/records/100660bcc5e9b1-b049-4eca-8015-7ae8b23ed291
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2008 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Symposium(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2014-04-01 | |||||||
タイトル | ||||||||
タイトル | 古文・現代語訳並列コーパスによる古語・現代語辞書の構築 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Construction of Ancient-Modern Word Dictionary from Parallel Corpus of Ancient Writings and Their Translations in Modern Language | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
資源タイプ | conference paper | |||||||
著者所属 | ||||||||
立命館大学情報理工学部 | ||||||||
著者所属 | ||||||||
立命館大学情報理工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
College of Information Science and Engineering, Ritsumeikan University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
College of Information Science and Engineering, Ritsumeikan University | ||||||||
著者名 |
木村, 文則
× 木村, 文則
|
|||||||
著者名(英) |
Fuminori, Kimura
× Fuminori, Kimura
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年,古い文書の電子テキスト化が進んでいるが,これらに対して現代語で行われているような自然言語処理技術を適用することは,十分な語彙量がある古語辞書などの言語資源が不足しているため現状では困難である.そこで本論文では,古文・現代語訳並列コーパスを用いた日本語の古語・現代語辞書の自動構築手法を提案する.古文・現代語訳並列コーパスとは,ある古文の文と,それに対する現代語訳の文が対になった文書群のことである.対となったコーパスを用いて,古文の文とその現代語訳の文に出現する単語を比較し,その出現傾向を解析することにより,古語と現代語との対応を獲得する.これにより,古語と現代語の対訳辞書の構築を行う.また,提案した手法による,現代語単語と古語Nグラムの出現傾向の類似度を算出する実験を行った. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Recently, an increasing number of ancient documents are being digitized in text form, but it is difficult to apply natural language processing techniques to these documents because the language resources for ancient languages, such as archaic dictionaries that have sufficient vocabularies, are scarce. In this paper, we propose a method for constructing an ancient-modern Japanese dictionary using parallel corpus of ancient writings and their translations in modern language. The parallel corpus consists of document pairs in the same language but in ancient and modern versions. From this corpus, we try to acquire equivalent pairs of archaic and modern word by analyzing the frequencies of word occurrences in a sentence in ancient language and its corresponding modern language translation. In this way, we construct an ancient-modern word dictionary. Besides, we conducted an experiment of calculating similarities of occurrence frequencies of archaic and modern words. | |||||||
書誌情報 |
じんもんこん2008論文集 巻 2008, p. 119-124, 発行日 2008-12-13 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |