2024-03-28T21:22:20Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001857382023-04-27T10:00:04Z01164:05251:09396:09397
ビッグデータの統計学的意義Statistical Significance of Big Datajpnhttp://id.nii.ac.jp/1001/00185650/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=185738&item_no=1&attribute_id=1&file_no=1Copyright (c) 2018 by the Information Processing Society of Japan名古屋市立大学大学院医学研究科名古屋市立大学大学院医学研究科名古屋市立大学大学院医学研究科早野, 順一郎湯田, 恵美吉田, 豊ビッグデータ解析への批判として,統計学は少数例のサンプリングによる母集団特性の推定を追求して発展したものであるから,少数例で得られた統計的知見以上のことがビッグデータから見つかることは希である,と言われる.そこで,心拍ビッグデータを用いてそのような事が実際に見られるかどうかを検証した.24 時間心電図ビッグデータ Allostatic State Mapping by Ambulatory ECG Repository (ALLSTAR) の洞調律例を対象に,仮説 1: 心拍数は気圧の上昇時と下降時で差があるか,仮説 2 :心拍数には季節変動があるか,仮説 3 :心拍数は人口密度の影響を受けるか,という 3 つの仮説を,男女それぞれからランダム抽出した 10 万,5 万,2 万,1 万,5 千,2 千,千,5 百,2 百,百例で統計解析した.仮説についても,統計学的に有意に達した例数以上に例数を増やしても結果には実質的な違いはなかった.また,有意な結果を得るための必要サンプル数は statistical power 解析 (α < 0.05,β > 0.8) の結果と一致した.本研究の結果,統計学的有意性は,母集団の特性に対するサンプルの代表性の指標となり,それ以上のサンプルを集めても結果は大きく変わらないことが示された.AA11238429研究報告電子化知的財産・社会基盤(EIP)2018-EIP-7913122018-02-092188-86472018-02-07