@techreport{oai:ipsj.ixsq.nii.ac.jp:00234943, author = {川上, 瞬汰 and 林田, 守広 and ナチェル, ホセ and 丸山, 修}, issue = {56}, month = {Jun}, note = {気管支上皮細胞から取得した遺伝子発現データから肺がんを予測する大規模言語モデルを応用した機械学習手法を考察する.膨大なタンパク質アミノ酸配列から学習された ProtT5 モデルを用いて各遺伝子に対応するタンパク質をベクトルへ変換し,クラスタリングする.同じクラスタに分類された遺伝子を発現量の平均値を取ることでまとめ,勾配ブースティングによって肺がん予測を行う.クラスタ数を変化させ予測精度を比較する.}, title = {ProtT5を用いたタンパク質クラスタリングと勾配ブースティングによる遺伝子発現データからの肺がん予測}, year = {2024} }