Item type |
SIG Technical Reports(1) |
公開日 |
2023-06-22 |
タイトル |
|
|
タイトル |
生物学的パスウェイを用いたBioConceptVecにおけるアナロジータスク |
タイトル |
|
|
言語 |
en |
|
タイトル |
Analogy Tasks in BioConceptVec using Biological Pathways |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
IBISML |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
京都大学 |
著者所属 |
|
|
|
京都大学 |
著者所属 |
|
|
|
大阪大学蛋白質研究所 |
著者所属 |
|
|
|
大阪大学蛋白質研究所 |
著者所属 |
|
|
|
京都大学 |
著者所属 |
|
|
|
京都大学/理化学研究所 |
著者所属 |
|
|
|
大阪大学蛋白質研究所 |
著者所属(英) |
|
|
|
en |
|
|
Kyoto University |
著者所属(英) |
|
|
|
en |
|
|
Kyoto University |
著者所属(英) |
|
|
|
en |
|
|
Institute for Protein Research, Osaka University |
著者所属(英) |
|
|
|
en |
|
|
Institute for Protein Research, Osaka University |
著者所属(英) |
|
|
|
en |
|
|
Kyoto University |
著者所属(英) |
|
|
|
en |
|
|
Kyoto University / RIKEN |
著者所属(英) |
|
|
|
en |
|
|
Institute for Protein Research, Osaka University |
著者名 |
山際, 宏明
橋本, 竜馬
荒金, 究
村上, 賢
大山, 百々勢
下平, 英寿
岡田, 眞里子
|
著者名(英) |
Hiroaki, Yamagiwa
Ryoma, Hashimoto
Kiwamu, Arakane
Ken, Murakami
Momose, Oyama
Hidetoshi, Shimodaira
Mariko, Okada
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
自然言語処理は様々な応用分野で利用されており,skip-gram などのモデルを用いてテキスト中の単語を埋め込みと呼ばれる特徴ベクトルに変換することが一般的である.近年,生物学の分野でも自然言語処理の有用性が注目されており,概念の正規化を施した約 3000 万件の PubMed abstracts から学習した BioConceptVec が提案されている.一般に skip-gram では単語の埋め込みを加減算することによりアナロジータスクが解けるとされており,例えば king − man + woman から queen を予測できる.本研究では生物学的パスウェイの種類を関係性とみなし,薬剤と遺伝子の組についてアナロジータスクの実験を行った.その結果,同じパスウェイに属する薬剤と遺伝子の組についてパスウェイの関係性を表すベクトルを定義することで,アナロジータスクの高い精度が確認された. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Natural language processing (NLP), often employing models like skip-gram, is widely utilized across numerous application domains to convert words in text into feature vectors known as word embeddings. The utility of this approach has recently been noted in the field of biology, with the introduction of BioConceptVec, a model trained on about 30 million PubMed abstracts using normalized concepts. In general, skip-gram can solve analogy tasks by manipulating word embeddings, such as predicting queen from king − man + woman. In this study, we applied this principle to biological pathways, conducting analogy tasks for pairs of drugs and genes, treating pathway types as relationships. Our results demonstrated high accuracy in these tasks when defining a vector to represent the pathway relationship for pairs of drugs and genes that belong to the same pathway. |
書誌情報 |
研究報告バイオ情報学(BIO)
巻 2023-BIO-74,
号 63,
p. 1-8,
発行日 2023-06-22
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8590 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |