@techreport{oai:ipsj.ixsq.nii.ac.jp:00048244, author = {王, 小捷 and 松本, 裕治 and Wang, Xiaojie and Matsumoto, Yuji}, issue = {108(2003-NL-158)}, month = {Nov}, note = {この論文は、語義曖昧性解消性脳を改善する方法を提案する。教師付分類器の特徴スペースを、語義が付けられたサンプルおよび偽似訓練データの両方からの特徴を組み合わせることにより拡張する。偽似訓練データを自動的に集めることができる方法を提案し,特徴スペースが十分に大きな規模まで拡張することができることを示す。また、語義が付けられたサンプル中に見えない単語の確率は偽似訓練データ中のその頻度によって平滑されるので、見えない特徴を区別することが出来る。実験は、この方法によってもたらされた著しい改善を示した。, This paper suggests a method to improve quality for word sense disambiguation. Feature spaces of supervised classifiers are extended and enhanced by combining features both from tagged samples and pseudo samples. Since pseudo samples can be collected automatically, feature spaces can be extended to a scale large enough, and probabilities for unseen words in tagged samples are smoothed according to its frequency in pseudo samples, which enable distinguishing between features unseen in tagged samples. Experiments have shown a significant improvement brought by this method.}, title = {偽似訓練データを用いた語義曖昧性解消の改善}, year = {2003} }