Item type |
SIG Technical Reports(1) |
公開日 |
2018-06-06 |
タイトル |
|
|
タイトル |
Post Clustering Inference とシングルセル解析への応用 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Post Clustering Inference, with Application to Single Cell Analysis |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
IBISML一般セッション |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
名古屋工業大学 |
著者所属 |
|
|
|
名古屋工業大学 |
著者所属 |
|
|
|
名古屋大学 |
著者所属 |
|
|
|
名古屋工業大学/理化学研究所/物質・材料研究機構 |
著者所属(英) |
|
|
|
en |
|
|
Nagoya Institute of Technology |
著者所属(英) |
|
|
|
en |
|
|
Nagoya Institute of Technology |
著者所属(英) |
|
|
|
en |
|
|
University of Nagoya |
著者所属(英) |
|
|
|
en |
|
|
Nagoya Institute of Technology / RIKEN / National Institute for Materials Science |
著者名 |
井上, 茂乗
梅津, 佑太
坪田, 庄真
竹内, 一郎
|
著者名(英) |
Shigenori, Inoue
Yuta, Umezu
Shoma, Tsubota
Ichiro, Takeuchi
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
顧客データや遺伝子発現量データなど,背後に複数のサブグループをもつようなデータは数多く存在する.このようなデータに対する解析手法の一つにクラスタリングがある.クラスタリングは,標本の類似度に基づき,データをいくつかのクラスタに分割し,得られたクラスタに関する何らかの知見を得ることを目標とする.そのため,クラスタリング結果から各クラスタの特徴を吟味することは,データの本質的な構造を理解するうえでも非常に重要な課題である.これまで,数多くのクラスタリング手法に関する研究が行われてきたが,クラスタリング後の各クラスタの特徴に関する統計的推論についての議論はほとんどない.本研究では,K 平均法適用後の各クラスタの特徴における仮説検定を,Selective Inference の枠組みで定式化する.提案手法を人工データと医療分野において注目を集めているシングルセルデータに対して適用することで,その有用性を確認する. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
There are many data with several subgroups, such as customer data and gene expression data and so on. One way to analyze such data is clustering. It aims to divide the data into several clusters based on the similarity of samples and obtain knowledge on the resulting clusters. Therefore, examining the features of each cluster from the result of clustering is a very important task for understanding the essential structure of data. Various clustering methods have been studied so far, but none of them have focused on statistical guarantee for the features after clustering. In this study, we develop the framework of selective inference for a hypothesis testing problem of the features in each cluster after iiT-means clustering. We confirm the usefulness of the proposed method through synthetic data and single cell data analysis. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10505667 |
書誌情報 |
研究報告数理モデル化と問題解決(MPS)
巻 2018-MPS-118,
号 3,
p. 1-8,
発行日 2018-06-06
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8833 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |