WEKO3
アイテム
Latent Dirichlet Allocationにおける決定論的オンラインベイズ学習
https://ipsj.ixsq.nii.ac.jp/records/66270
https://ipsj.ixsq.nii.ac.jp/records/662701294b191-3493-4ba5-8f22-a1189ea1e2f0
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-09-21 | |||||||
タイトル | ||||||||
タイトル | Latent Dirichlet Allocationにおける決定論的オンラインベイズ学習 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Online learning for Latent Dirichlet Allocaiton | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 学習 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属 | ||||||||
東京大学情報基盤センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Sience and Technology, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Interfaculty Initiative in Information Studies | ||||||||
著者名 |
佐藤, 一誠
× 佐藤, 一誠
|
|||||||
著者名(英) |
Issei, Sato
× Issei, Sato
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年、機械学習やデータマイニングにおいて、トピックモデルと呼ばれる確率的生成モデルの研究が盛んに行われている.本研究では,代表的なトピックモデルの 1 つである Latent Dirichlet allocation (LDA) のオンライン学習手法を提案する.従来の LDA のオンライン学習手法は,サンプリング手法に基づいており,大量のテキストストリームデータに対して,学習速度や収束性の保証の問題がある.また,トピック分布の分布である Dirichlet 分布のパラメータ推定をオンラインで学習していないという問題があった.本研究では,Dirichlet 分布のパラメータを含め,LDA におけるパラメータのオンライン学習を行い,その局所解への収束性を保証する.また,文書モデルの実験において一括 (batch) 学習と同程度の性能があることを示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | One of the important approaches for Knowledge discovery and Data mining is to estimate unobserved variables because latent variables can indicate hidden and specific properties of observed data. Latent Dirichlet allocation(LDA) plays a important role in unobserved document modeling where latent variables indicate topics in documents. We introduce online learning algorithm for LDA based on variational Bayes in the case that documents arrive in a continuous stream and a large number of documents are accumulated. In an experiment using real data, this online method performs as well as batch learning in LDA. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2009-NL-193, 号 7, p. 1-6, 発行日 2009-09-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |