@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00223083, author = {市野, 雅暉 and 藤井, 達也 and 渡名喜, 瑞稀 and 神, 章洋 and 升田, 尚幸 and 小玉, 直樹 and 齋藤, 孝道 and Masaki, Ichino and Tatsuya, Fujii and Mizuki, Tonaki and Akihiro, Jin and Naoyuki, Masuda and Naoki, Kodama and Takamichi, Saito}, book = {コンピュータセキュリティシンポジウム2022論文集}, month = {Oct}, note = {ブラウザフィンガープリンティングにおいて,学習済みの端末の識別はアクセス数が増加すると,推定対象の組み合わせが指数関数的に増加し困難となる.そこで,本論文の提案手法は,クラスタリングアルゴリズムを用いて推定対象のアクセスログの組を削減したのち,2 つのアクセスログの組が同一端末から取得されたか否かを推定し,その結果と Union-Find アルゴリズムを用いて,端末ごとにまとめる.提案手法を検証するために 2 つの実験を行った.1 つ目は,実運用されている Web サイトのアクセスログに対して提案手法を適用した.2 つ目は,推定対象を削減したことによる処理時間と精度への影響を調べるため,前者の実験と同じデータに対して推定対象を削減する処理を省略し実験を行った.結果,10 万件のアクセスログおいて,推定対象を削減したほうが省略したほうに比べて,処理時間が 100 倍以上短縮され,調整ランド指数が約 0.30 改善された.未学習の端末を含むデータに対しても,短時間で端末をまとめることができる可能性を示した., In browser fingerprints, the identification of learned devices becomes difficult as the number of accesses increases, since the number of combinations to be estimated increases exponentially. The proposed method uses a clustering algorithm to reduce the number of estimation pairs, then estimates whether two access logs were obtained from the same device or not and combines the results with the Union-Find algorithm for each device. The proposed method was applied to the access logs of an actual website, and experiments were also conducted to investigate the impact of the reduction. The results showed that for 100,000 access logs, the processing time was reduced by more than 100 times with the reduced estimation pair compared to the omitted estimation target and the accuracy of the Adjusted Rand index was about 0.30 higher. This result shows that it is possible to quickly summarize devices even when the data contains unlearned devices.}, pages = {192--199}, publisher = {情報処理学会}, title = {クラスタリングを用いたパッシブフィンガープリンティングによる端末分類の試み}, year = {2022} }