2024-03-28T19:19:51Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001444822020-10-27T05:02:56Z00934:00989:07880:08268
特徴的部分系列に基づく時系列および形状系列の判別分析Discriminative Analysis on Time Series and Sequential Shape Patterns Based on Characteristic Subsequencesjpn[オリジナル論文] 系列パターン,距離ベース特徴量,Shapelet,輪郭画像分類,時系列分類http://id.nii.ac.jp/1001/00144449/Articlehttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=144482&item_no=1&attribute_id=1&file_no=1Copyright (c) 2015 by the Information Processing Society of Japanサンデンホールディングス株式会社群馬大学電子情報部門東京理科大学経営学部須賀, 佑太朗関, 庸一安藤, 晋系列データの分類は時系列・センサストリームや画像輪郭線の分類等幅広い応用を含む機械学習の重要な問題の1つである.しかし,系列データは特殊な順序構造を持ち,一般的な分類器の直接の入力として適さない.このため一般的な分類器で系列データから学習するのに適した特徴量を生成することが課題となる.有望なアプローチとして,Shapelet等の系列内の特徴的パターンから予測変数を生成する方法が提案されている.これらの方法では系列パターンとクラスの特徴を視覚的分析できるメリットがある.ただし,従来手法では多数の系列パターンを利用するとクラスとパターンとの対応が不明瞭になるという問題があった.本研究では系列パターンからの距離に基づく特徴量と特徴選択の手法を組み合わせることで,クラスに固有なパターンを抽出する方法を提案する.提案手法は,マージン最大化学習と同時にマージンを最大限維持する特徴選択手法を用いる.選択された特徴に対応する系列パターンを視覚的に分析した結果,クラス固有の部分形状が検出できることが示された.数値実験では,時系列データと輪郭データを用いて提案手法の性能を評価し,既存手法との比較を示す.Classification of sequential data is one of the important problems in machine learning, with a wide range of applications such as time series, sensor stream and image classification. However, due to its ordered structure, sequential data are not appropriate as the direct input of the general classifiers. Generate features for learning from time series and sequential data with a general classifier is therefore a critical task. One of the promising approaches is to find and exploit the characteristic subsequence patterns in the sequential data, such as Shapelets. The subsequences provide the discriminative features for learning classifiers as well as the primitives for graphical analysis. However, the conventional method has problematic issues when utilizing large number of sequence patterns. In this study, we propose a framework for feature selection and classification for sequential data that combines the clustering method for extracting subsequence patterns unique to the class and the distance-based feature based on the concept of multiple-instance learning. The feature selection method embedded in max-margin learning algorithm is employed to select important patterns and learn a linear classifier simultaneously. In our empirical study, we evaluated the performance of the proposed method using the time series data and the silhouette data and compared them with existing methods. The result showed that the proposed method can maintain high classification accuracies while extracting visually identifiable class-specific patterns in sequential shapes and time series.AA11464803情報処理学会論文誌数理モデル化と応用(TOM)8266762015-07-241882-77802015-07-22