| Item type |
Journal(1) |
| 公開日 |
2021-01-15 |
| タイトル |
|
|
タイトル |
シーケンスデータに対する行パターンマッチングの効率化 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Efficient Row Pattern Matching over Sequence Data |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[一般論文] シーケンスデータ,行パターンマッチング,SQL/RPR,MATCH_RECOGNIZE |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
| ID登録 |
|
|
ID登録 |
10.20729/00208898 |
|
ID登録タイプ |
JaLC |
| 著者所属 |
|
|
|
公益財団法人鉄道総合技術研究所信号・情報技術研究部 |
| 著者所属 |
|
|
|
筑波大学計算科学研究センター |
| 著者所属(英) |
|
|
|
en |
|
|
Signalling & Transport Information Technology Division, Railway Technical Research Institute |
| 著者所属(英) |
|
|
|
en |
|
|
Center for Computational Sciences, University of Tsukuba |
| 著者名 |
中挾, 晃介
北川, 博之
|
| 著者名(英) |
Kosuke, Nakabasami
Hiroyuki, Kitagawa
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,情報通信技術,センサ技術の発展にともない,シーケンスデータが日々大量に生成・処理されている.このシーケンスデータに対して,行パターンマッチングを行う操作の標準として,SQL/RPRがある.SQL/RPRは,行パターンマッチングを実現するためのSQLの拡張である.一方で,行パターンマッチングの処理コストは,SelectionやJoinといった処理と比べると大きく,効率的に処理する方法を考える必要がある.本研究では,RDB等に格納された膨大な量のシーケンスデータに対する行パターンマッチングの処理コストを削減するために,SelectionやJoinといった相対的に処理コストの小さい処理を組み合わせ,行パターンマッチング対象となる行を減らす前処理を事前に適用することにより,処理コストを削減する2つの効率化手法(Sequence FilteringとRow Filtering)を提案する.また,本研究では,PostgreSQLおよびSparkにSQL/RPRを実装し,これらの効率化手法が行パターンマッチングの処理時間を削減することを確認する.さらに,各効率化手法を適用した場合の処理時間を見積もるコストモデルを構築,検証し,適切な効率化手法を選択可能であることを示す. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Due to the advance of information, communications, and sensor technology, a large quantity of sequence data is generated and processed every day. Row pattern matching for the sequence data was standardized as SQL/RPR in 2016. SQL/RPR is an extension of SQL for realizing row pattern matching. However, computational cost of the row pattern matching process is large and it is needed to make this process efficient. In this paper, we propose two methods for this purpose: Sequence Filtering and Row Filtering which realize the reduction of processing time for row pattern matching by filtering input data in advance. We implement SQL/RPR for PostgreSQL and Spark and verify that our methods can reduce the processing time of queries including row pattern matching. Also, we construct a cost model for estimating processing time of queries when the proposed methods are applied and show that users can select a proper processing method. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
| 書誌情報 |
情報処理学会論文誌
巻 62,
号 1,
p. 302-320,
発行日 2021-01-15
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |