@techreport{oai:ipsj.ixsq.nii.ac.jp:00195162, author = {一角, 健人 and 五木田, 駿 and 久保田, 真 and 福山, 訓行 and Kento, Ikkaku and Shun, Gokita and Makoto, Kubota and Noriyuki, Fukuyama}, issue = {26}, month = {Mar}, note = {近年,車のドライブレコーダーに記録された映像データなど地理的に分散蓄積されたエッジデータを,クラウド上で実行される各種サービスからオンデマンドに活用可能にしたいとのニーズが高まりつつある.しかし,要求に合致するすべてのデータをクラウドに収集するというアプローチは,ネットワーク帯域が狭いためデータ転送に時間がかかること,エッジノードの通信帯域にばらつきがあるためデータが揃うまでに時間がかかることがあるために対応できない.本研究では,複数のエッジノードにサービスにとって同一の意味を持つデータである類似データが重複して保存されている可能性があることを利用し,サービスにとって必要なデータの収集完了時間が最小になるようにエッジノード間で類似データを除去する手法を提案する., Recently, needs for making it possible to utilize geo-distributed and accumulated data, such as video data recorded in a car drive recorder, from various services on demand are increasing. The approach of collecting all the data that meets an user request in the cloud greatly impairs responsiveness because the network bandwidth is low and it can not deal with dynamically changing the communication bandwidth and computer load in each edge node. In this paper, we use the fact that each edge node stores similar data having the same meaning as viewed from the service in duplicate, and propose a method to efficiently remove similar data adjusting to current bandwidth between edge nodes, which minimize the data collection completion time.}, title = {広域データ分析システムにおけるサービス品質を考慮した類似データ除去手法}, year = {2019} }