Item type |
SIG Technical Reports(1) |
公開日 |
2024-12-19 |
タイトル |
|
|
タイトル |
擬似ラベル生成とFew-Shot 学習を用いた短文のソフトクラスタリング |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
生成AI |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
兵庫県立大学大学院情報科学研究科 |
著者所属 |
|
|
|
兵庫県立大学大学院情報科学研究科 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science, University of Hyogo |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science, University of Hyogo |
著者名 |
藤原, 祐也
湯本, 高行
|
著者名(英) |
Yuya, Fujiwara
Takayuki, Yumoto
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
1 つの文書に複数のラベルが同時に属する可能性を考慮する手法として,Fuzzy C-means を代表とするソフトクラスタリング手法が存在する.しかし,既存のソフトクラスタリング手法では,クラスタ中心などとの距離に基づいて各クラスタに属する度合いを決めており,距離だけでは表現できないマルチラベルの実データに対して,精度が悪化することが考えられる.そこで本研究では,擬似的にマルチラベルの訓練データを生成し,それを用いてマルチラベル分類を行うことで,結果としてソフトクラスタリングを実現する手法を提案する.なお,擬似ラベルを生成するにあたって,ハードクラスタリングによって得られた各クラスタから,クラスタを代表する文書を選出し,様々な組み合わせで合成を行うことでマルチラベルを表現する.生成した擬似ラベルの数が少量となるため,Few-Shot 学習を用いて効果的に学習を行う. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10112482 |
書誌情報 |
研究報告データベースシステム(DBS)
巻 2024-DBS-180,
号 2,
p. 1-6,
発行日 2024-12-19
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-871X |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |