@techreport{oai:ipsj.ixsq.nii.ac.jp:00050179, author = {大川原雄也 and 大囿忠親 and 新谷, 虎松 and Yuya, OKAWARA and Tadachika, OZONO and Toramatsu, SHINTANI}, issue = {110(2006-ICS-145)}, month = {Oct}, note = {本稿は 記事を対象に記事間の関係を特徴付けるパターンを発見し 記事のトピックの抽出及びトピックの追跡を目的とする.本手法では 記事の言語モデルを学習して抽出を行う.言語モデルにはクラスモデルを用い クラスモデルによって記事をクラスタリングする.トピックの抽出は 作成されたクラスタにラベル付けをすることに相当する.クラスタのラベルは クラスタに属する記事の内容を表す語のうち 重要度が高い語で構成される.これらの語は クラスモデルを用いたクラスタリングの際に抽出可能である.トピックの追跡は作成されたクラス多感の類似度を計算し 類似度が高いクラスタを時間軸上に配置することで行われる.}, title = {知的WebサービスのためのXML文書からの情報抽出}, year = {2006} }