2024-03-29T18:14:51Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000835972024-03-29T05:26:34Z01164:04179:06657:06851
統計的機械翻訳システムを利用した日本語音韻変化処理Japanese Phonological Processing with Statistical Machine Translation Systemsjpn翻訳・曖昧性解消http://id.nii.ac.jp/1001/00083591/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=83597&item_no=1&attribute_id=1&file_no=1Copyright (c) 2012 by the Information Processing Society of Japan名古屋大学大学院情報科学研究科名古屋大学大学院情報科学研究科小川泰弘外山勝彦膠着語に分類される言語には,語幹に接辞が接続することにより語が構成されるという共通点があるが,音韻変化に関しては言語ごとの差異が大きい.そのため,膠着語の文生成においては言語に依存した音韻変化処理が必要である.従来は,言語ごとに規則を記述するルールベースな手法が採られてきたが,本研究では,日本語を対象として,統計的手法によりどの程度の精度が実現できるかを検証する.一方,言語学的な観点から見ると,そもそも語幹や接辞の基底形がどのような形になるかという問題がある.日本語においても複数の説が提唱されているが,どれが正しいかという決め手に欠けている.そこで,統計的な処理の立場から考えた場合,どの基底形が適切かという点についても考察する.While words consist of stems and affixes in agglutinative languages, the differences among the languages with respect to phonological change are large. This result requires a specific phonological processing depending on each language for sentence generation in agglutinative languages. Although rule-based methods have been studied so far are, we adopt statistical methods and evaluate them in this paper. On the other hand, we have another linguistic problem to clarify what is a base form of a stem or an affix. Although Japanese linguists have proposed several theories about it, there is no discussion on which is right. Therefore, we also consider which a suitable base form is from the viewpoint of statistical processing.AN10115061研究報告自然言語処理(NL)2012-NL-20831102012-08-262012-08-16