@techreport{oai:ipsj.ixsq.nii.ac.jp:00086768, author = {牧田, 健作 and 鈴木, 浩子 and 小池, 大地 and 宇津呂, 武仁 and 河田, 容英 and Kensaku, Makita and Hiroko, Suzuki and Daichi, Koike and Takehito, Utsuro and Yasuhide, Kawada}, issue = {11}, month = {Nov}, note = {本論文では,特定のキーワードをクエリとして収集したブログ記事集合を対象として,ブログ記事集合中の話題の広がりを俯瞰することを目的として, Wikipedia を知識源とする分野トピックモデルを提案し,その推定法,および,ブログ記事集合への適用結果について述べる.具体的には,ブログ記事集合から抽出した Wikipedia エントリタイトルに対して, 「地球温暖化」 における 「気象学・天文学・生物学・エネルギー・工業」 といった分野に対応するトピックモデルを推定し,その特性を分析する.特に,この Wikipedia を知識源とする分野トピックモデルを,ブログ記事集合から推定した通常のトピックモデルと比較して,両者の特性の違いを分析し,ブログ記事集合中の話題の広がりを俯瞰する目的において両者が相補的な関係にあることを示す., In order to address the issue of quickly overviewing the distribution of the contents of the collection of blog posts, this paper proposes a framework of estimating a topic model, namely “a domain topic model”, which is a topic model estimated with the texts of Wikipedia entries extracted from the collection of blog posts. In this “domain topic model” of Wikipedia entries, each topic represents domains such as meteorology, astronomy, biology, energy, and industry, that are closely related to a query term, e.g., “global warming”. We compare the proposed approach of topic modeling with Wikipedia knowledge source and the standard topic modeling without Wikipedia knowledge source. Both topic modeling results have quite different nature and contribute to quickly overviewing the search result of blog posts in a quite complementary fashion.}, title = {Wikipediaを知識源とする分野トピックモデルの推定と分析}, year = {2012} }