2024-03-30T00:44:15Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001976632024-03-29T05:26:34Z01164:05352:09740:09828
乳がんデータセットを用いた主成分分析を用いた教師なし学習による変数選択法と部分的最小二乗回帰との比較Comparison between the principal components analysis based unsupervised feature extraction and the partial least squares regression using the breast cancer datasetjpnhttp://id.nii.ac.jp/1001/00197573/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=197663&item_no=1&attribute_id=1&file_no=1Copyright (c) 2019 by the Information Processing Society of Japan琉球大学大学院理工学研究科琉球大学大学院理工学研究科現在,琉球大学工学部藤澤, 孝太中村, 晃輔宮田, 龍太本研究では,主成分分析を用いた教師なし学習による変数選択法(PCAUFE)の実データに対する有用性を評価する.具体的には,乳がん患者の遺伝子発現プロファイルにPCAUFEを適用し,生理学的に裏付けされた乳がん関連遺伝子をどれだけ選択できるか検証する.その結果,約7000個ある候補から67個に限定でき,うち6個が既知の乳がん関連遺伝子であった.教師あり学習を用いた従来手法では5個しか拾えなかったので,PCAUFEの方が検出力が高いと考えられる.In this study, we evaluated the performance of the principal components analysis based unsupervised feature (PCAUFE) extraction with a real data set. Concretely, the PCAUFE was applied to the gene expression profiles and verified how many genes physiologically related to breast cancer could be selected. As a result, approximately 7,000 candidates could be limited to 67 genes. Moreover, 6 of them were known as the genes related to breast cancer, while the conventional method using supervised learning i.e., partial least squares regression (PLSR) could pick up only the 5 genes. Therefore, we concluded that the PCAUFE could be more powerful method of feature selection.AA12055912研究報告バイオ情報学(BIO)2019-BIO-5860162019-06-102188-85902019-06-07