@techreport{oai:ipsj.ixsq.nii.ac.jp:00234907, author = {屋代, 凜太郎 and 安尾, 信明 and 関嶋, 政和}, issue = {20}, month = {Jun}, note = {薬物標的相互作用 (Drug-Target Interaction,DTI) の予測はドラッグリポジショニング,ヒット化合物の探索,副作用の可能性の調査など創薬の場面において重要である.しかし DTI の予測の実験的手法は時間,金銭どちらの面でもコストがかかることが知られており,in silico 技術を用いた予測手法が開発されてきた.in silico で DTI 予測を行う際に用いられるデータベースとして,Drug Bank やTherapeuric Target Database (TTD) が例に挙げられる.DrugBank は PubMed からアノテーションされた薬剤に関するデータベースであり,DTI 予測モデルを学習する際はこのようなデータベースから学習データを作成する必要がある.データベースを作成する際には PubMed などにある論文からデータを取得する必要があるが,PubMed 上でも年間数百万件の新規の論文が追加されている.このような大量な論文の中から手動で適切な DTI を抽出することは現実的でなく,DTI の抽出を自動化することが望まれている.本研究では自然言語処理の性能が優れている大規模言語モデルの一つである Llama3-8B モデルを用いてファインチューニングを行い,論文情報から DTI を抽出するモデルを作成および,プロンプトの変更による性能の変化や汎化性能の向上の評価を行った.}, title = {大規模言語モデルを用いた薬物標的相互作用抽出}, year = {2024} }