@techreport{oai:ipsj.ixsq.nii.ac.jp:00061960,
 author = {持橋, 大地 and 山田, 武士 and 上田, 修功 and Daichi, Mochihashi and Takeshi, Yamada and Naonori, Ueda},
 issue = {36(2009-NL-190)},
 month = {Mar},
 note = {本論文では,教師データや辞書を全く必要とせず,あらゆる言語に適用できる教師なし形態素解析器および言語モデルを提案する。観測された文字列を,文字 n グラム ‐ 単語 n グラムをノンパラメトリックベイズ法の枠組で統合した確率モデルからの出力とみなし,MCMC 法と動的計画法を用いて,繰り返し 「単語」 を推定する。提案法は,あらゆる言語の生文字列から直接,高精度で未知語のない n グラム言語モデルを構築する方法ともみなすことができる。, This paper proposes a novel unsupervised morphological analyzer of arbitrary language that does not need any supervised segmentation nor dictionary. Assuming a string as the output from a nonparametric Bayesian hierarchical n-gram language model of words and characters, "words" are iteratively estimated during inference by a combination of MCMC and an efficient dynamic programming. This model can also be considered as a method to learn an accurate n-gram language model directly from characters without any "word" information.},
 title = {ベイズ階層言語モデルによる教師なし形態素解析},
 year = {2009}
}