| Item type |
SIG Technical Reports(1) |
| 公開日 |
2025-03-15 |
| タイトル |
|
|
言語 |
ja |
|
タイトル |
スパースな離散データを対象とした非負値行列因子分解の補正によるクラスタリング手法の提案 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Store Clustering Using Non-Negative Matrix Factorization on Sparse Discrete Data |
| 言語 |
|
|
言語 |
jpn |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
名古屋工業大学 |
| 著者所属 |
|
|
|
名古屋工業大学 |
| 著者所属 |
|
|
|
名古屋工業大学 |
| 著者所属 |
|
|
|
名古屋工業大学 |
| 著者所属 |
|
|
|
中部大学 |
| 著者所属 |
|
|
|
名古屋工業大学 |
| 著者所属(英) |
|
|
|
en |
|
|
Nagoya Institute of Technology |
| 著者所属(英) |
|
|
|
en |
|
|
Nagoya Institute of Technology |
| 著者所属(英) |
|
|
|
en |
|
|
Nagoya Institute of Technology |
| 著者所属(英) |
|
|
|
en |
|
|
Nagoya Institute of Technology |
| 著者所属(英) |
|
|
|
en |
|
|
Chubu University |
| 著者所属(英) |
|
|
|
en |
|
|
Nagoya Institute of Technology |
| 著者名 |
丸井,佑太
武藤,敦子
島,孔介
森山,甲一
松井,藤五郎
犬塚,信博
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
非負値行列因子分解(NMF)は高次元データの分析に広く活用されており,次元削減や特徴抽出に役立てられている.しかし,NMFでは観測行列と生成行列,ならびに生成行列の因子間でスケールが一致しない問題があり,このため因子間の比較が困難となり,解釈性が損なわれる可能性がある.飲食店や小売店の購買行列,言語分野における文書行列など,NMFではスパースな離散データを扱うことも多い.本研究では,そのようなスパースな離散データを対象とする.これは提案手法が微小値を無視する性質を持ち,スパースなデータを前提とするためである.このようなデータにおける分解後の生成行列に対し,離散表現における非ゼロ値の最小値である1を基準にスケーリングする手法を提案する.この手法により,観測行列とのスケールを統一し,因子間の比較を可能にするとともに,解釈性を向上させる.また,このスケーリング手法に基づく寄与度を用いたクラスタリング手法を提案し,スケーリングを行わない場合や主成分分析(PCA)を用いた手法との比較をすることで,その有効性を検証した. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Non-negative Matrix Factorization (NMF) has been widely utilized for analyzing high-dimensional data, serving purposes such as dimensionality reduction and feature extraction. However, NMF has a limitation in that the scales of the observed matrix and the factorized matrices, as well as the scales among the factors within the factorized matrices, are inconsistent. This inconsistency makes it difficult to compare factors and can potentially compromise interpretability. NMF is often applied to sparse and discrete datasets, such as purchase matrices in the food and retail industries or document matrices in the field of linguistics. In this study, we focus on such sparse and discrete data, as the proposed method assumes sparsity by ignoring small values. We propose a scaling method that adjusts the factorized matrices by setting 1, the minimum non-zero value in the discrete representation, as the baseline for scaling. This method unifies the scale between the observed matrix and the factorized matrices, enabling factor comparison and improving interpretability. Furthermore, we propose a clustering method based on the contribution values calculated using this scaling method. We validate its effectiveness by comparing it with cases where scaling is not performed and with methods utilizing Principal Component Analysis (PCA). |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10505667 |
| 書誌情報 |
研究報告数理モデル化と問題解決(MPS)
巻 2025-MPS-152,
号 13,
p. 1-6,
発行日 2025-03-15
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8833 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |