Item type |
Trans(1) |
公開日 |
2007-03-15 |
タイトル |
|
|
タイトル |
大量データストリームの類似探索手法 |
タイトル |
|
|
言語 |
en |
|
タイトル |
A Similarity Search Method for Multiple Data Streams |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
研究論文(論文賞受賞) |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
日本電信電話株式会社NTTサイバースペース研究所 |
著者所属 |
|
|
|
日本電信電話株式会社NTTサイバースペース研究所 |
著者所属 |
|
|
|
日本電信電話株式会社NTTサイバースペース研究所 |
著者所属(英) |
|
|
|
en |
|
|
NTT Cyber Space Laboratories, NTT Corporation |
著者所属(英) |
|
|
|
en |
|
|
NTT Cyber Space Laboratories, NTT Corporation |
著者所属(英) |
|
|
|
en |
|
|
NTT Cyber Space Laboratories, NTT Corporation |
著者名 |
藤原, 靖宏
櫻井, 保志
山室, 雅司
|
著者名(英) |
Yasuhiro, Fujiwara
Yasushi, Sakurai
Masashi, Yamamuro
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
現在データストリームを利用したアプリケーションに対する注目が様々な分野で集まっている.データストリームを処理するには今までにない新しいアプローチが必要である.本論文は複数のデータストリームの中から任意の長さで正確に類似したシーケンスの組合せを探索する問題を対象とする.我々は,(1)シーケンスの特徴量をメモリ内で保持し,(2)圧縮されたシーケンスをディスク内に保持する手法DAPSS(DAta stream Processing for Store and Search)を提案する.DAPSSを検証した結果ナイーブな手法と比較して高速に処理が行えることを確認した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
There is much interest in the processing of data streams for applications in the several fields. The key characteristic of stream data demands a new approach. This paper focuses on the problem to detect exactly similar pairs among multiple data streams with similarity queries of arbitrary length. We propose DAPSS (DAta stream Processing for Store and Search), an efficient method to detect similar streams, which keeps (1) the feature data of each sequence in memory space and (2) the compressed data of the original sequences in disk space. Experiments show DAPSS is significantly faster than the naive method. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11464847 |
書誌情報 |
情報処理学会論文誌データベース(TOD)
巻 48,
号 SIG7(TOD33),
p. 1-14,
発行日 2007-03-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7799 |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |