WEKO3
アイテム
多様な類似観点を反映するテキスト検索ランキングのための学習データ補正方法
https://ipsj.ixsq.nii.ac.jp/records/209717
https://ipsj.ixsq.nii.ac.jp/records/209717dda88e79-4dd2-45ed-9aab-fd36f86a12e8
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2021 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2021-02-22 | |||||||||||
| タイトル | ||||||||||||
| タイトル | 多様な類似観点を反映するテキスト検索ランキングのための学習データ補正方法 | |||||||||||
| 言語 | ||||||||||||
| 言語 | jpn | |||||||||||
| 資源タイプ | ||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
| 資源タイプ | technical report | |||||||||||
| 著者所属 | ||||||||||||
| 株式会社NTTデータ技術開発本部AI技術センタ | ||||||||||||
| 著者所属 | ||||||||||||
| 株式会社NTTデータ技術開発本部AI技術センタ | ||||||||||||
| 著者所属 | ||||||||||||
| 株式会社NTTデータ技術開発本部AI技術センタ | ||||||||||||
| 著者名 |
藤城, 真祥
× 藤城, 真祥
× 小池, 大地
× 末永, 高志
|
|||||||||||
| 論文抄録 | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | テキスト間の類似性をもとにした検索タスクにおいては,表層の一致度合いや概念の類似といった様々な観点が存在する.これらの観点はそれぞれに有用性があり,複数の観点を加味した検索結果の提示が期待される.このような複数の観点を加味するためには,それぞれの観点で計測された類似度のスコアを加重平均したものが考えられるが,同義語のように表層は異なるが概念的には類似する事例を上位に挙げることが難しい.これに対して,特定の観点で類似性が高い事例も優先するようなスコアリングのロジックを,非線形な機械学習手法を適用することで作成することが考えられる.しかしながら,テキスト検索といったタスクでは,明確に負例を定義することが困難で,正例以外の事例が膨大に存在する.また,これらのデータの分布は正例のデータを包含するような関係性になるため,正例以外のデータを負例として見なして学習することには課題がある.本研究では,テキスト検索のタスクを対象に,特定の観点でも類似性の高い事例を優先することを目的とした,学習データの補正方法を提案する. | |||||||||||
| 書誌レコードID | ||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||
| 収録物識別子 | AN10505667 | |||||||||||
| 書誌情報 |
研究報告数理モデル化と問題解決(MPS) 巻 2021-MPS-132, 号 17, p. 1-2, 発行日 2021-02-22 |
|||||||||||
| ISSN | ||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||
| 収録物識別子 | 2188-8833 | |||||||||||
| Notice | ||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
| 出版者 | ||||||||||||
| 言語 | ja | |||||||||||
| 出版者 | 情報処理学会 | |||||||||||