@techreport{oai:ipsj.ixsq.nii.ac.jp:00049120, author = {森, 信介 and 長尾, 眞 and Shinsuke, Mori and Makoto, Nagao}, issue = {27(1995-NL-112)}, month = {Mar}, note = {入力文を単語に分割し品詞を付加する形態素解析は、日本語処理における基本的な処理である。英語の品詞タグ付けと異なりコーパスに基づく形態素解析の試みはあまり行なわれていない。本論文では、コーパスに基づく形態素解析の新しい手法を提案する。我々の提案は次のように要約される。)各形態素の語彙化、)附属語列の登録、)マルコフモデルの重ね合わせ。これらのアイデアは形態素解析に特有ではなく、他のコーパスに基づく手法に応用できる。以上のアイデアに基づく形態素解析器を作成し、EDRコーパスに対して実験を行なった結果、非常に高い精度を得た。, Morphological analysis, which segments the input sentence into words and attaches part-of-speeches to them, is the most fundamental process of Japanese language processing. Contrary to English part-of-speech tagging, only few attempts have so far been made at corpus-based Japanese morphological analysis. In this paper we propose a novel method for corpus-based Japanese morphological analysis. Our proposals are summarized as follows: 1) lexicalization of all morphemes; 2) memorization of particle sequence; 3) superposition of Markov models. These ideas are so general that one can apply them to other corpus-based applications. We conducted experiments on EDR corpus and obtained the considerably high accuracy.}, title = {形態素bi - gramと品詞bi - gramの重ね合わせによる形態素解析}, year = {1996} }