Item type |
SIG Technical Reports(1) |
公開日 |
2018-06-21 |
タイトル |
|
|
タイトル |
Sanny:大規模ECサイトのための精度と速度を両立した分散可能な近似近傍探索エンジン |
タイトル |
|
|
言語 |
en |
|
タイトル |
Sanny: Scalable Approximate Nearest Neighbors Search System Using Partial Nearest Neighbors Sets |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
情報システム運用 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
GMOペパボ株式会社ペパボ研究所 |
著者所属 |
|
|
|
GMOペパボ株式会社ペパボ研究所 |
著者所属(英) |
|
|
|
en |
|
|
Pepabo R&D Institute, GMO Pepabo, Inc. |
著者所属(英) |
|
|
|
en |
|
|
Pepabo R&D Institute, GMO Pepabo, Inc. |
著者名 |
三宅, 悠介
松本, 亮介
|
著者名(英) |
Yusuke, Miyake
Ryosuke, Matsumoto
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
EC サイトの商品種類増大に伴う情報過多問題を解決するため,利用者の要求を満たす商品を自動的に提案する機能が EC サイトにとっての関心事となる.大規模 EC サイトで商品を提案するために扱う特徴量は大規模かつ高次元ベクトルの集合となるため,類似度の比較は精度と計算量を抑えた近似解を用いなければならない.商品を自動的に提案する機能には,可用性を担保しつつ,提案内容の的確さと充分な応答速度が求められる.本報告では,大規模 EC サイトで商品を提案することを想定して,精度と速度を両立した分散可能な近似近傍探索エンジン Sanny を提案する.Sanny は,検索質問データ (クエリ) に対する高次元ベクトル集合の近傍探索結果の上位集合が,クエリと高次元ベクトル集合を任意の次元数で等分した部分ベクトル単位で近傍探索した結果と類似しやすいことに着目して,提案すべき商品の近傍探索を部分ベクトル単位での探索に分解することで分散処理可能にし,その探索結果の和集合である近傍候補から再度近傍探索を行うことにより,全体として高速に近似近傍探索を行える.実験では,従来の近似近傍探索に対する速度並びに精度面での性能比較について評価を行う. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Building a recommendation system has become a big concern to solve the information overload problem of the electronic commerce sites. Implementing a feature selection system based on machine learning requires approximation of the nearest neighbor search for maintaining the availability and speed while allowing to reducing the accuracy and complexity since the feature sets consist of large and high dimensional vectors. In this report, we propose Sanny, a search engine by approximation of nearest neighbors and using the partial neighbor set. Sanny aggregates the neighbors of the low dimensional vectors using the property that the neighbors of high dimensional vectors obtained from the neural network overlap with the neighbors of partial vectors. Sanny searches the candidates generated by the aggregation, which results in reducing the total time of searching. We evaluate performance and accuracy comparison of Sanny with the existing methods. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12326962 |
書誌情報 |
研究報告インターネットと運用技術(IOT)
巻 2018-IOT-42,
号 2,
p. 1-7,
発行日 2018-06-21
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8787 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |