@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00228052,
 author = {佐藤, 弘毅 and 峰野, 博史},
 book = {マルチメディア,分散,協調とモバイルシンポジウム2023論文集},
 month = {Jun},
 note = {機械学習を用いて学習する上で,説明変数に本来ならば使用できない目的変数の有用な情報が漏れることにより,不正に高精度な推定・予測が可能となることをリーケージという.特に時系列データにおいては,未来のデータを用いて学習することで大幅に高精度な推定・予測が可能となってしまい,過去の情報のみを用いて学習するようにデータの分割方法を工夫する必要がある.そこで本研究では,時系列データのリーケージを定量的に評価する手法を提案し,高精度な学習を可能とするデータの分割方法を検討する.ここで,リーケージに関して,未知のデータへの適応性の高いリーケージを Innocent Leakage ,低いリーケージを Guilty Leakage と定義する.通常の分割方法とリーケージする分割方法で機械学習を行い,そのモデルに対して XAI の一手法である SHAP を用いてリーケージを評価する.通常の分割方法とリーケージする分割方法におけるテストデータの推定根拠となる説明変数の寄与を SHAP 値として算出し,それを用いて寄与度分布を作成,独立性の検定によって比較することで,リーケージが Innocent Leakage であるか Guilty Leakage であるかを評価する.リーケージの評価を踏まえて,未知のデータに対しても高精度な推定・予測が可能となるデータの分割方法を検討する.},
 pages = {143--151},
 publisher = {情報処理学会},
 title = {機械学習における時系列データのリーケージに関する一考察},
 volume = {2023},
 year = {2023}
}