WEKO3
アイテム
小規模なコーパスを用いた仮名漢字混じり文と仮名文の対応づけ
https://ipsj.ixsq.nii.ac.jp/records/72553
https://ipsj.ixsq.nii.ac.jp/records/72553f5795130-a5a7-4f57-ae79-380fbd501a11
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-01-21 | |||||||
タイトル | ||||||||
タイトル | 小規模なコーパスを用いた仮名漢字混じり文と仮名文の対応づけ | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Correspondence between Kana-Kanji sentence and Katakana sentence using small corpus | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | NL-2 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京理科大学大学院理工学研究科情報科学専攻 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information Sciences, Graduate School of Tokyo University of Science | ||||||||
著者名 |
山口, 文彦
× 山口, 文彦
|
|||||||
著者名(英) |
Fumihiko, Yamaguchi
× Fumihiko, Yamaguchi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | イースター島には Rongorongo と呼ばれる未解読文字が遺されている.Rongorongo を歌を歌うように読んでいたという記録があるため,Rongorongo の記号列と現地の古い歌が対応するか否かを統語的に調べる研究を行った.しかし,未解読言語が対象であるために正解を設定できず,結果を評価することが難しい.そこで,既知の言語を用いた同様の問題を設定し,手法の評価を行った.本論文では,日本語の仮名漢字混じりの文と,片仮名のみの文を用いて,それらの対応付けを見つけるある手法について報告する.この手法は,文を文字単位に分割する以上の言語に関する知識をできるだけ用いないように留意している.結果として,仮名漢字混じり文とその読みを正しく表している仮名文との対応付けを見つけることができた.また,出現頻度の高い文字の種類が少ない場合に誤判定されることが分かった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Undeciphered script called Rongorongo is remained in Easter Island. There are some records that Rongorongo is read as singing. Thus, the correspondence between Rongorongo and the old local chants are researched syntactically. However, as the collect answer is unknown, it's difficult to evaluate the results. Therefore, by setting similar problem in known language, the method is thought to be evaluated. In this paper, a method is reported to find the correspondence between Japanese sentence, which contains both kana and Kanji, and the sentence, which contains Katakana. As results, the collect correspondence is found which is between a Kanji sentence and the Katakana sentence which represents its reading. And it is clarified that the method misjudges when there are few number of kinds of frequent characters. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
研究報告 自然言語処理(NL) 巻 2011-NL-200, 号 6, p. 1-6, 発行日 2011-01-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |