@techreport{oai:ipsj.ixsq.nii.ac.jp:00082924, author = {笹田, 鉄郎 and 森, 信介 and Graham, Neubig and 河原, 達也 and Tetsuro, Sasada and Shinsuke, Mori and Graham, Neubig and Tatsuya, Kawahara}, issue = {8}, month = {Jul}, note = {本論文では、素性頻度ファイルと部分的アノテーションコーパスを用いて単語分割器を学習する枠組みについて提案する。一般分野のコーパスから作成した素性頻度ファイルを参照すると、そのコーパスを直接参照しているかのように単語分割器を再学習することが可能である。また、部分的アノテーションコーパスの作成により、低い人的コストで高い分野適応性を実現できる。提案する枠組みを用いて分野適応を行った結果、単語分割の精度が改善されることを確認した。, This paper propose a framework of training a word segmenter from a feature frequency file and partially annotated corpora. A feature frequency file enable users to rebuild a word segmenter as if they use the original corpora. Patially annotated corpora make it possible to achieve domain adaptation with a minimum amount of annotation. In a domain adaptation experiment, we observed an improvement in the word segmentation accuracy.}, title = {素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習}, year = {2012} }