@techreport{oai:ipsj.ixsq.nii.ac.jp:00048475, author = {村田, 真樹 and 馬青 and 井佐原, 均 and Masaki, Murata and Ma, Qing and Hitoshi, Isahara}, issue = {86(2001-NL-145)}, month = {Sep}, note = {われわれはこれまで,できるだけ少量の訓練データで実用的な品詞タグづけシステムを構築する目的で伸縮性入力ニューロタガー,ニューラルネットワークとBrillの誤り駆動学習を融合したハイブリッド型ニューロタガーを提案してきた。これらのタガーでは多品詞語を含む小規模タイ語コーパスを学習データとして,それぞれ94.4%,95.5%という高い精度(多品詞語のみを測定対象)で品詞のタグづけをした。本研究では,新たに決定リスト,最大エントロピー法,サポートベクトルマシン法の三つの機械学習法を用いるタイ語のタグづけの手法を提案し,それらを用いて品詞タグづけを行った。結果はサポートベクトルマシンがもっともよい精度(96.1%)を出し,さらにタイ語の品詞タグづけの精度向上を実現することになった。本稿では,手法間の比較や精度向上の原因についての考察も行なう。, The elastic-input neuro tagger and the hybrid neuro tagger combined the neural network and Brill's error-driven learning have already been proposed for the purpose of constructing a practical tagger that uses as little training data as possible. When a small Thai corpus is used for training, these taggers have tagging accuracies of 94.4% and 95.5% (accounting only for the ambiguous words in part of speech), respectively. In this study, we developed new tagging methods using the three machine learning methods: decision-list, maximum entropy, and support vector machine methods. We then performed tagging experiments using these methods. Our results showed that the support vector machine method has the best precision (96.1%), and that it is capable of improving the accuracy of tagging in the Thai language. Finally, we theoretically examined the above-mentioned methods and discussed how improvements have been made.}, title = {機械学習を用いたタイ語の品詞タグづけ}, year = {2001} }