Item type |
SIG Technical Reports(1) |
公開日 |
2021-07-13 |
タイトル |
|
|
タイトル |
LiNGAMを用いた大量変数の因果探索処理に向けた計算カーネルの高速化の検討 |
タイトル |
|
|
言語 |
en |
|
タイトル |
A Study on speeding up Causal Search Process for Large Number of Variables Using LiNGAM |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
高性能計算 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
富士通株式会社 |
著者所属 |
|
|
|
富士通株式会社 |
著者所属 |
|
|
|
富士通株式会社 |
著者所属 |
|
|
|
富士通株式会社 |
著者所属 |
|
|
|
富士通株式会社 |
著者所属 |
|
|
|
富士通株式会社 |
著者所属 |
|
|
|
富士通株式会社 |
著者名 |
栗原, 康志
川上, 健太郎
山崎, 雅文
松田, 一仁
山田, 芙夕楓
田原, 司睦
横山, 乾
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
多次元ベクトルとして測定されたビッグデータから,ベクトルデータを構成する各変数間の因果 (主従) 関係を推定する統計的因果探索と呼ばれる処理がある.ベクトルデータの内,独立した変数成分が非ガウス分布であることを仮定できる場合,変数間の因果関係は LiNGAM (Linear Non-Gaussian Acyclic Model) アルゴリズムで解けることが知られている.Python を用いた LiNGAM の実装が OSS として公開されているが,現状は 1 台の PC で実行することを前提とされており,100 変数からなるデータの因果探索に約 200 秒,1000 変数で約 60 時間かかっている.我々は LiNGAM を適用可能とする領域を拡大するため,1 万変数以上を対象とする因果探索を目標にしている.LiNGAM の計算時間は変数の数の約 3 乗に比例するため,1 万変数以上を対象とする因果探索を行う場合,現状では数年~数十年かかることが予想される.本稿では,1 万変数以上の因果探索を実用的な計算時間で行うために,計算カーネルの高速化の方法を検討したので,これを報告する. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
From big data measured as multidimensional vectors, there is a process called statistical causal search that estimates the causal (principal-agent) relationship between each variable that constitutes the vector data. It is known that the causal relationship between variables can be solved by the Linear Non-Gaussian Acyclic Model (LiNGAM) algorithm if the independent variable components in the vector data can be assumed to be non-Gaussian. A Python implementation of LiNGAM has been released as OSS, but it is currently assumed to be run on a single PC. It takes about 200 seconds to perform causal search for data consisting of 100 variables, and about 60 hours for data consisting of 1000 variables. In order to expand the area of applicability of LiNGAM, we are aiming for a causal search targeting more than 10,000 variables. However, since the computation time of LiNGAM is proportional to the number of variables to the third power, it is currently expected to take several years to several 10 years. In this paper, in order to achieve causal inference for more than 10,000 variables in a practical computation time, we have investigated a method to speed up the computation kernel, and will report on this method in this paper. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10463942 |
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC)
巻 2021-HPC-180,
号 26,
p. 1-8,
発行日 2021-07-13
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8841 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |