| Item type |
SIG Technical Reports(1) |
| 公開日 |
2019-06-10 |
| タイトル |
|
|
タイトル |
変化点検出に基づく可変ビン幅ヒストグラムの構築 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Construction of Histogram with Variable Bin-width based on Change Point Detection |
| 言語 |
|
|
言語 |
jpn |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
東京工科大学コンピュータサイエンス学部 |
| 著者所属 |
|
|
|
静岡県工業技術研究所機械電子科 |
| 著者所属 |
|
|
|
静岡県立大学経営情報学部 |
| 著者所属 |
|
|
|
神奈川大学理学部/理化学研究所革新知能統合研究センター/静岡県立大学経営情報学部 |
| 著者所属(英) |
|
|
|
en |
|
|
School of Computer Science, Tokyo University of Technology |
| 著者所属(英) |
|
|
|
en |
|
|
Industorial Research Institute of Shizuoka Prefecture |
| 著者所属(英) |
|
|
|
en |
|
|
School of Management and Information, University of Shizuoka |
| 著者所属(英) |
|
|
|
en |
|
|
Faculty of Science, Kanagawa University / Center for Advanced Intelligence Project, RIKEN / School of Management and Information, University of Shizuoka |
| 著者名 |
伏見, 卓恭
岩﨑, 清斗
大久保, 誠也
斉藤, 和巳
|
| 著者名(英) |
Takayasu, Fushimi
Kiyoto, Iwasaki
Seiya, Okubo
Kazumi, Saito
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本研究の目的は,与えられた数値データの頻度情報について,データ濃度が密な部分をより詳細に分析・可視化する手法の構築である.そこで,与えられた数値データより,K個の可変ビン幅で描かれるヒストグラムを構築する手法を提案する.提案手法は,データの分布に粗密の偏りがあるとき,分布が疎な部分では広く,密でな部分では狭くするように,ビン幅を適切に自動調整する.具体的には,要素を昇順にソートしたデータ集合を時系列データと見なし,L2誤差またはL1誤差に基づく変化点検出法を適用して変化点集合を検出し,得られた変化点集合より可変ビン幅のヒストグラムを構築する.検証実験では,静岡県内の4つのバラ農家から収集した飽差データに対し提案手法を適用することにより,標準的に採用される平方根選択法やスタージュの公式でビン数を決める等幅ビンのヒストグラムと比較して,データの要素値分布の粗密に応じて適切なビン幅となるヒストグラムの構築が可能なことを示す.また,エントロピーに基づく定量評価では,L2誤差と比較して,L1誤差で構築するヒストグラムが望ましい性質を持つことも示す. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In this paper, we address a problem of constructing a histogram drawn by K bins with variable widths from a set of numerical values, so as to have relatively large numbers of narrow bins for some ranges where values distribute densely and change substantially, while small numbers of wide bins for the other ranges. For this purpose, we propose a new method, i.e., after arranging a given set of values in ascending order, regarding them as a time-series dataset, and applying a change point detection method to this dataset based on an L1 or L2 error criterion, we produce a step function consisting of K steps, and then by using these change point information, we construct a histogram drawn by K bins with variable widths. In our experiments using four datasets of humidity deficit (HD) collected from vinyl greenhouses owned by four rose farmers by setting our original IoT devices, we show that our proposed method can construct more natural histograms with appropriate variable bin widths than those with an equal bin width constructed by the standard method based on square-root choice or Sturges' formula. In addition, by performing quantitative evaluation based on an entropy function, we also show the histograms constructed with the L1 error criterion has more desirable property than those with the L2 error criterion, |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12055912 |
| 書誌情報 |
研究報告バイオ情報学(BIO)
巻 2019-BIO-58,
号 40,
p. 1-6,
発行日 2019-06-10
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8590 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |