@techreport{oai:ipsj.ixsq.nii.ac.jp:00226718, author = {山際, 宏明 and 橋本, 竜馬 and 荒金, 究 and 村上, 賢 and 大山, 百々勢 and 下平, 英寿 and 岡田, 眞里子 and Hiroaki, Yamagiwa and Ryoma, Hashimoto and Kiwamu, Arakane and Ken, Murakami and Momose, Oyama and Hidetoshi, Shimodaira and Mariko, Okada}, issue = {63}, month = {Jun}, note = {自然言語処理は様々な応用分野で利用されており,skip-gram などのモデルを用いてテキスト中の単語を埋め込みと呼ばれる特徴ベクトルに変換することが一般的である.近年,生物学の分野でも自然言語処理の有用性が注目されており,概念の正規化を施した約 3000 万件の PubMed abstracts から学習した BioConceptVec が提案されている.一般に skip-gram では単語の埋め込みを加減算することによりアナロジータスクが解けるとされており,例えば king − man + woman から queen を予測できる.本研究では生物学的パスウェイの種類を関係性とみなし,薬剤と遺伝子の組についてアナロジータスクの実験を行った.その結果,同じパスウェイに属する薬剤と遺伝子の組についてパスウェイの関係性を表すベクトルを定義することで,アナロジータスクの高い精度が確認された., Natural language processing (NLP), often employing models like skip-gram, is widely utilized across numerous application domains to convert words in text into feature vectors known as word embeddings. The utility of this approach has recently been noted in the field of biology, with the introduction of BioConceptVec, a model trained on about 30 million PubMed abstracts using normalized concepts. In general, skip-gram can solve analogy tasks by manipulating word embeddings, such as predicting queen from king − man + woman. In this study, we applied this principle to biological pathways, conducting analogy tasks for pairs of drugs and genes, treating pathway types as relationships. Our results demonstrated high accuracy in these tasks when defining a vector to represent the pathway relationship for pairs of drugs and genes that belong to the same pathway.}, title = {生物学的パスウェイを用いたBioConceptVecにおけるアナロジータスク}, year = {2023} }