@techreport{oai:ipsj.ixsq.nii.ac.jp:02008108, author = {田口,善弘 and Turki,Turki}, issue = {8}, month = {Mar}, note = {本稿では、我々が提案する主成分分析(PCA)およびテンソル分解(TD)に碁づく教師なし特徴抽出(FE)法の改良版について、その詳細なアルゴリズムと生物学的有効性を解説する。これまで我々が開発してきたTD/PCAに碁づくFE法は、薬剤転用やバイオマーカー探索など広範なゲノム解析に応用され、その有用性が示されてきた。しかし、従来の手法には、選択される遺伝子数が保守的すぎ(過少であり)、偽陰性の懸念がある点や、導出されるP値の分布が理論的な帰無仮説(ガウス分布)と完全に一致しないという統計的な課題が残されていた。そこで本研究では、P値のヒストグラムが帰無仮説に可能な限り一致するように、特異値ベクトルの標準偏差をデータ駆動的に最適化する新たなアルゴリズムを導入した。これにより、理論的な仮定と実データの乖離を補正し、統計的に妥当な遺伝子選択が可能となる。実際のRNA-seqデータ(腎淡明細胞癌、マウス肝臓モデル等)を用いた検証の結果、本手法はDESeq2やedgeRといった負の二項分布や分散関係を経験的に仮定する必要がある最先端の従来法と比較して、より多くの、かつ生物学的により合理的(Gene Ontologyタームの濃縮などにより評価)な発現変動遺伝子(DEG)を選択できることを示した。本手法は、特にサンプル数が少なく次元数が高い(Small-N, Large-P)問題において、強力なツールとなる。}, title = {適応的テンソル分解およびPCAに基づく教師なし特徴抽出法は従来法よりも生物学的に妥当な発現変動遺伝子を選択する}, year = {2026} }