2024-03-29T09:45:42Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001581522022-10-21T05:24:51Z00581:08417:08420
文脈と意味の対応密度最大化による教師なし語義曖昧性解消Density Maximization of Context-to-sense Mapping for Unsupervised Word Sense Disambiguationjpn[一般論文] all-words,語義曖昧性解消,多義性解消,教師なし学習http://id.nii.ac.jp/1001/00158118/Journal Articlehttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=158152&item_no=1&attribute_id=1&file_no=1Copyright (c) 2016 by the Information Processing Society of Japan三菱電機株式会社情報技術総合研究所/早稲田大学国際情報通信研究センター東海大学情報通信学部早稲田大学基幹理工学部谷垣, 宏一撫中, 達司匂坂, 芳典本論文では,大量入手が容易なラベルなしコーパスを利用して,対象テキストの全単語の語義曖昧性解消(all-words WSD)を実現する教師なし学習方式を提案する.all-words WSDは膨大な種類の語義を扱うことから,高コストな語義ラベル付きコーパスの構築を必要としない教師なし方式の実現が期待される.提案法は,コーパスにおける語の出現文脈と語義の対応のまとまりの良さに着目し,両者の直積の密度を最大化するように確率的な対応を求めることで教師なしall-words WSDを実現する.SemEvalデータセットを用いた評価実験結果より,類似文脈に出現する異なり語が十分得られれば,ラベルなしコーパスだけで信頼性の高い曖昧性解消が可能なことを示す.This paper proposes a novel unsupervised method employing large amount of unlabeled text corpora for all-words word sense disambiguation (WSD), which requires to discriminate huge variety of senses, thus unsupervised methods are desired to avoid constructing costly sense-labeled corpora. Given unlabeled corpora and a dictionary, the proposed method bases on the coherent correspondences between word contexts and word senses, and finds the all-words' senses that maximize mapping density in context-to-sense product metric space. Experimental results confirmed the efficacy of our unsupervised method by showing the reliability of disambiguation if sufficient variations of word-types are provided in similar context.AN00116647情報処理学会論文誌573106910792016-03-151882-77642016-03-11