2024-03-29T10:28:38Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001284462023-11-17T02:17:36Z06504:08089:08094
d-bigramを用いた単語のクラスタリングWord Clustering Using D-bigramjpnhttp://id.nii.ac.jp/1001/00128631/Conference Paperhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=128446&item_no=1&attribute_id=1&file_no=1慶應義塾大学 理工学研究科 計算機科学専攻慶應義塾大学 理工学研究科 計算機科学専攻慶應義塾大学 理工学研究科 計算機科学専攻慶應義塾大学 理工学研究科 計算機科学専攻慶應義塾大学 理工学研究科 計算機科学専攻慶應義塾大学 理工学研究科 計算機科学専攻佐藤, 健吾堤, 純也孫, 大江延澤, 志保佐野, 智久中西, 正和単語の使われ方による単語の自動的な分類の手法は、科学的、実践的見地から興味が持たれている。例えば、・言語学的な構造の分布や語彙の獲得における疑問に対する、精神的あるいは計算的な学習の展望にどのような関係があるか。・どうやって希薄なデータをうまく処理したり、統計的な言語モデルを生成するか。といった問題が挙げられる。巨大なコーパスになると、大部分がsparseデータになってしまうため、信頼性が低くなってしまうことが良く知られている。この問題に対してsparseデータを"似ている"イベントで代用することが考えられるが、類似度を単語のクラスや対応するモデルの生成に直接使う方法は明らかになっていない。本論文では、d-bigram[2]を用いた単語のクラスタリングの方法について考察し、どのようなクラスタが生成されるかを検証する。AN00349328全国大会講演論文集第51回人工知能と認知科学781995-09-202015-01-20