WEKO3
アイテム
決定木の並列化とその評価
https://ipsj.ixsq.nii.ac.jp/records/29563
https://ipsj.ixsq.nii.ac.jp/records/295631e114897-abd6-4df6-8de5-dccdb6bccef4
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-08-02 | |||||||
タイトル | ||||||||
タイトル | 決定木の並列化とその評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Parallelization of Decision Tree Algorithm and its Performance Evaluation | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
新情報処理開発機構並列応用東芝研究室 | ||||||||
著者所属 | ||||||||
新情報処理開発機構並列応用東芝研究室 | ||||||||
著者所属 | ||||||||
新情報処理開発機構並列応用東芝研究室 | ||||||||
著者所属 | ||||||||
新情報処理開発機構並列応用東芝研究室 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Parallel Application Toshiba Laboratory Real World Computing Partnership | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Parallel Application Toshiba Laboratory Real World Computing Partnership | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Parallel Application Toshiba Laboratory Real World Computing Partnership | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Parallel Application Toshiba Laboratory Real World Computing Partnership | ||||||||
著者名 |
久保田, 和人
仲瀬, 明彦
酒井, 浩
小柳, 滋
× 久保田, 和人 仲瀬, 明彦 酒井, 浩 小柳, 滋
|
|||||||
著者名(英) |
Kazuto, Kubota
Akihiko, Nakase
Hiroshi, Sakai
Shigeru, Oyanagi
× Kazuto, Kubota Akihiko, Nakase Hiroshi, Sakai Shigeru, Oyanagi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 数百ギガから数テラバイトクラスのデータに対するデータマイニングを実用時間で行えるシステムの構築を検討している。その知見を得るために、データマイニングの代表的な手法である決定木を並列化して高速化し、百メガバイト程度のベンチマークデータおよび実データを用いて効果を調べた。決定木では、ルートから順にノードが生成されていく。1つのノード内の処理を並列化する手法(ノード内並列)と、複数のノードを並列に処理する手法(ノード間並列)を実装し、C4.5というフリーソフトをSMPマシンをターゲットとして並列化した。プロファイリングで処理のボトルネックを調べ、その部分のスレッドプログラミングを用いて並列化した。ノード内並列は、データの性質によらず8CPUで3倍から6倍程度の高速化が図れた。ノード間並列は、生成される木の偏りに大きく影響を受け、4倍程度高速化されたものから、全く高速化されないものもあった。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We are planning to develop a practical data-mining system to the data of form several 100giga byte to tera byte class. In order to obtain the knowledge for the construction of the system, the decision tree which is the typical technique of a data-mining is parallelized and accelerated. It applied to the data of a 100mega byte class, and was evaluated using benchmark data and real data. On the decision tree, nodes are generated from a root node to leaf nodes. The technique (intra-node parallel) of parallelizing processing in one node and the technique (inter-node parallel) of processing two or more nodes in parallel were implemented. A free software called C4.5 was parallelized for SMP machine. The bottleneck of processing was investigated by profiling and it was parallelized using thread programming. The effect of intra-node parallization was not affected by the characteristic of data, but was able to attain improvement in the speed of 3 to about 6 times by 8 CPUs. Inter-node parallization received influence in the deviation of the tree generated greatly, and there was from what was accelerated about 4 times to what is not accelerated at all. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC) 巻 1999, 号 66(1999-HPC-077), p. 161-166, 発行日 1999-08-02 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |