Item type |
SIG Technical Reports(1) |
公開日 |
2025-01-16 |
タイトル |
|
|
タイトル |
文章埋め込み表現を用いた助成金研究者マッチングシステム |
タイトル |
|
|
言語 |
en |
|
タイトル |
Grant-Researcher Matching System Using Sentence Embeddings |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
システム設計およびデータ解析 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
長崎大学大学院工学研究科 |
著者所属 |
|
|
|
長崎大学大学院工学研究科 |
著者所属 |
|
|
|
長崎大学大学院総合生産科学研究科 |
著者所属 |
|
|
|
長崎大学情報データ科学部 |
著者所属 |
|
|
|
長崎大学情報データ科学部 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Engineering, Nagasaki University |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Engineering, Nagasaki University |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Integrated Science and Technology |
著者所属(英) |
|
|
|
en |
|
|
School of Information and Data Sciences, Nagasaki University |
著者所属(英) |
|
|
|
en |
|
|
School of Information and Data Sciences, Nagasaki University |
著者名 |
浜崎, 利之
山崎, 聖士朗
鄒, 子昂
深江, 一輝
小林, 透
|
著者名(英) |
Toshiyuki, Hamasaki
Seishiro, Yamasaki
Ziang, Zou
Kazuki, Fukae
Toru, Kobayashi
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
助成金は研究者にとって,研究活動を支える重要な資金源である.ところが,多数の助成金公募から応募可能なものを特定することは労力を要する作業であり,十分な調査が出来ずに有用な助成金公募を見逃すことも少なくない.これまで,研究キーワードを使った助成金と研究者のマッチングが試みられているが,使用する研究キーワードに依存するため,マッチング精度に限界がある.そこで我々は,言語モデルから生成した埋め込み表現を用いた助成金研究者マッチングシステムを提案する.本システムについて,実際の助成金公募情報とそれに採択された研究の研究情報を用いて評価実験を行い,手法の有効性について明らかにした.また,使用する言語モデルとして学術研究ドメインに適したものを特定するために,USE(Universal Sentence Encoder),Sentence-BERT,および OpenAI embedding model にて精度の比較を行った.事前学習済みモデルを使用した場合は,OpenAI embedding model が最も精度が高かったが,ファインチューニングを行った結果,USE が最も精度が高くなることが分かった. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Grants are an essential source for researchers to proceed their research. However, identifying the applicable grants from numerous public applications is time-consuming for researcher, and it causes insufficient investigation resulting overlooking. There is an attempt for matching grants and researchers by classifying them using research keywords, however the accuracy of the matching is limited because it depends on the research keywords used. Therefore, we propose a grant-researcher matching system which uses sentence embeddings generated by a language model. We conducted evaluation experiments using the actual grant information and the research information that were awarded those acutual grants, and reveals the effectiveness of our method. Accuracy comparisons were also conducted with USE (Universal Sentence Encoder), Sentence-BERT, and the OpenAI embedding model for identifying which language model is appropriate for the academic research domain. Using pre-trained models, the OpenAI embedding model was the most accurate. However after fine tuning, the USE model was found to be the most accurate. |
書誌レコードID |
|
|
|
識別子タイプ |
NCID |
|
|
関連識別子 |
AB00006906 |
書誌情報 |
研究報告コラボレーションとネットワークサービス(CN)
巻 2025-CN-124,
号 21,
p. 1-7,
発行日 2025-01-16
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2758-8262 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |