Item type |
Symposium_02(1) |
公開日 |
2016-01-08 |
タイトル |
|
|
タイトル |
日本の東西分割を通じた機械学習手法の評価 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Evaluation of Machine Learning Techniques through Borderline Determination between Eastern and Western Japan |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
機械学習,判別分析,線形判別分析,SVM,Random Forest |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
著者所属 |
|
|
|
東京大学大学院情報理工学系研究科 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, The University of Tokyo |
著者名 |
宮野, 祐輔
崔, 誠云
疋田, 敏朗
小林, 良輔
鈴木, 宏哉
山口, 利恵
|
著者名(英) |
Yusuke, Miyano
Seongun, Choi
Toshiro, Hikita
Ryosuke, Kobayashi
Hiroya, Susuki
Rie, Shigetomi Yamaguchi
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,大量のデータから機械学習によってパターンや傾向を算出するアプローチが盛んになっている.しかし機械学習手法は様々な種類が存在するため,各手法の特徴を理解しなければデータや目的に応じた適切な手法を選択することができない.そのため本研究では実際の統計データを用いた機械学習による分析を通じて,各機械学習手法の特徴を明らかにした.実験では日本人であれば事前知識があり,出力結果が妥当かどうか判断しやすい都道府県の統計データを使用した.この統計データを用いて,東日本と西日本の境界線を機械学習による判別分析によって決定した.その過程で,決定木は複雑な条件による判別は向かない,線形判別分析で得られる判別得点には有益な用途があるなど,各手法の特徴を具体的に示すことができた.このことから,都道府県の統計データのように身近で分かりやすいデータセットを用いることは機械学習手法の特徴を評価するために有用であることが分かった. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Recently, the approach for analyzing the patterns and trends of data by machine learning has become popular. However, it is impossible to select an appropriate method without understanding characteristics of various machine learning techniques. To reveal their characteristics, we analyzed the real statistical data with well-known machine learning techniques in this paper. Familiar datasets make it easier to evaluate the validity of results, so we used the data about Japanese prefectures in this experiment. We determined the border that divides Japan into two regions (Eastern and Western Japan) using the statistical data. Through the experiment, we showed the characteristics of machine learning techniques; for example, a decision tree is not suitable for analysis with various conditions, and the discriminant score obtained by linear discriminant analysis has beneficial use. Therefore, we conclude that it is useful to evaluate machine learning techniques with familiar datasets such as prefectural data. |
書誌情報 |
第57回プログラミング・シンポジウム予稿集
巻 2016,
p. 143-154,
発行日 2016-01-08
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |