@article{oai:ipsj.ixsq.nii.ac.jp:00209000, author = {中挾, 晃介 and 北川, 博之 and Kosuke, Nakabasami and Hiroyuki, Kitagawa}, issue = {1}, journal = {情報処理学会論文誌}, month = {Jan}, note = {近年,情報通信技術,センサ技術の発展にともない,シーケンスデータが日々大量に生成・処理されている.このシーケンスデータに対して,行パターンマッチングを行う操作の標準として,SQL/RPRがある.SQL/RPRは,行パターンマッチングを実現するためのSQLの拡張である.一方で,行パターンマッチングの処理コストは,SelectionやJoinといった処理と比べると大きく,効率的に処理する方法を考える必要がある.本研究では,RDB等に格納された膨大な量のシーケンスデータに対する行パターンマッチングの処理コストを削減するために,SelectionやJoinといった相対的に処理コストの小さい処理を組み合わせ,行パターンマッチング対象となる行を減らす前処理を事前に適用することにより,処理コストを削減する2つの効率化手法(Sequence FilteringとRow Filtering)を提案する.また,本研究では,PostgreSQLおよびSparkにSQL/RPRを実装し,これらの効率化手法が行パターンマッチングの処理時間を削減することを確認する.さらに,各効率化手法を適用した場合の処理時間を見積もるコストモデルを構築,検証し,適切な効率化手法を選択可能であることを示す., Due to the advance of information, communications, and sensor technology, a large quantity of sequence data is generated and processed every day. Row pattern matching for the sequence data was standardized as SQL/RPR in 2016. SQL/RPR is an extension of SQL for realizing row pattern matching. However, computational cost of the row pattern matching process is large and it is needed to make this process efficient. In this paper, we propose two methods for this purpose: Sequence Filtering and Row Filtering which realize the reduction of processing time for row pattern matching by filtering input data in advance. We implement SQL/RPR for PostgreSQL and Spark and verify that our methods can reduce the processing time of queries including row pattern matching. Also, we construct a cost model for estimating processing time of queries when the proposed methods are applied and show that users can select a proper processing method.}, pages = {302--320}, title = {シーケンスデータに対する行パターンマッチングの効率化}, volume = {62}, year = {2021} }