2024-03-28T23:33:20Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000795602022-10-21T05:24:51Z00581:06276:06633
Co-STAR:上位下位関係獲得のための共訓練アルゴリズムCo-STAR: A Co-training Style Algorithm for Hyponymy Relation Acquisitionjpn特集:情報爆発時代におけるIT基盤技術http://id.nii.ac.jp/1001/00079560/Journal Articlehttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=79560&item_no=1&attribute_id=1&file_no=1Copyright (c) 2011 by the Information Processing Society of Japan情報通信研究機構情報通信研究機構/NHK放送技術研究所情報通信研究機構情報通信研究機構情報通信研究機構呉鍾勲山田, 一郎鳥澤健太郎デ・サーガステイン橋本, 力本論文では,構造化されたテキストと構造化されていないテキストを情報源として,単語間の上位下位関係を高精度に獲得する共訓練アルゴリズムCo-STAR(Co-training Style Algorithm for hyponymy Relation acquisition)を提案する.Co-STARにおける2つの独立な上位下位関係の獲得処理は各々のテキストから抽出した異なる手がかりを利用し,得られた知識を交換することにより共訓練を行う.従来の共訓練とは異なり,Co-STARは2つの異なる情報源の共通するインスタンスから効果的な学習データを獲得することで,精度の向上を実現する.実験では,構造化テキストとして日本語のWikipediaを,非構造化テキストとして5,000万のWebページを対象とし,大規模な上位下位関係獲得の処理を行い,Co-STARの有効性を示した.また,Co-STARはノイズの含まれる学習データを利用した場合でも頑健に動作することを確認した.This paper proposes a co-training style algorithm called Co-STAR that acquires hyponymy relations simultaneously from structured and unstructured text. In Co-STAR, two independent processes for hyponymy relation acquisition - one handling structured text and the other handling unstructured text - collaborate by repeatedly exchanging the knowledge they acquired about hyponymy relations. Unlike conventional co-training, the two processes in Co-STAR are applied to different source texts and training data. We show the effectiveness of this algorithm through experiments on large-scale hyponymy-relation acquisition from Japanese Wikipedia and Web texts. We also show that Co-STAR is robust against noisy training data.AN00116647情報処理学会論文誌5212357435872011-12-151882-77642011-12-09