WEKO3
アイテム
データマイニングのアルゴリズム記述を容易にする拡張行列演算の提案
https://ipsj.ixsq.nii.ac.jp/records/16609
https://ipsj.ixsq.nii.ac.jp/records/166092244b810-2edc-4f9a-b91c-98c96aaa49b2
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Trans(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-08-15 | |||||||
タイトル | ||||||||
タイトル | データマイニングのアルゴリズム記述を容易にする拡張行列演算の提案 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Extended Matrix Operations for Describing Data Mining Algorithms | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 通常論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 科学技術振興機構さきがけ研究21 | ||||||||
著者所属 | ||||||||
東京大学大学院情報理工学系研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology The University of Tokyo,PRESTO 21 Japan Science and Technology Agency | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology The University of Tokyo | ||||||||
著者名 |
松田, 一孝
× 松田, 一孝
|
|||||||
著者名(英) |
Kazutaka, Matsuda
× Kazutaka, Matsuda
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 計算機性能の向上およびそれにともなうデータ量の増加により,知識発見,データマイニングの重要性が高まってきている.その処理には多くのメモリ,高い演算能力が必要とされ並列分散化の必要があり,個々の問題に対しては様々な並列分散化が施されている.しかし,一般に並列分散アルゴリズムの記述を行うことは難しい.本研究では,データマイニングにおける並列分散アルゴリズムの記述を容易にすることを目的として,「拡張行列演算」と呼ぶ並列アルゴリズム記述の枠組みを提案する.この枠組みは行列演算の加算および乗算の演算子を一般化したものである.枠組みの持つ計算パターンは少ないが,行列演算のアナロジがアルゴリズム記述を容易かつ簡潔にしており,また問題に対し適切な演算子を定義することができるためそのその表現力は高い.行列計算の並列化に関する研究は多く,同様にこの枠組みの分散並列化も行うことができる.計算パターンが少ないことはプログラムの代数的な取扱いが容易となる利点も持つ.本論文では,枠組みの概要,いくつかのデータマイニングのアルゴリズム記述例を示し,実験を通してこの枠組みの有用性を示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The increase of machine power and the existence of the concomitant huge-sized database have made knowledge discovery and data mining possible and more important. Processing such massive date requires huge computational power and memory as well, which calls for distributed and parallel treatments. Although there have been many case studies of parallelizing data mining algorithms in ad hoc manners, describing parallel and distributed data mining algorithms is still a hard task. In this paper, we propose a framework, called extended matrix operations, for describinig parallel and distributed data mining algorithms in a general and uniform way. This framework is a generalization of matrix operations whose operators of addition and multiplication are generalized. This framework has the following advantages: analogy to usual matrix operations makes intuitive and concise description of algorithms; user can implement many algorithms through giving proper definitions of the generalized operators; limited number of computation patterns makes algebraic treatments of programs easy. Matrix operations have a large number of researchs on parallelization, which also apply to our framework. We explain the framework and demonstrate how concisely data miming algorithms are described in our framework. Effectiveness of our framework is examined by experiments. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11464814 | |||||||
書誌情報 |
情報処理学会論文誌プログラミング(PRO) 巻 46, 号 SIG11(PRO26), p. 1-15, 発行日 2005-08-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7802 | |||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |