| Item type |
Symposium(1) |
| 公開日 |
2021-08-30 |
| タイトル |
|
|
タイトル |
データ分析プログラムにおけるライブラリ関数利用方法の探索的分析 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
OSS・マイニング |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
| 著者所属 |
|
|
|
奈良先端科学技術大学院大学 |
| 著者所属 |
|
|
|
奈良先端科学技術大学院大学 |
| 著者所属 |
|
|
|
奈良先端科学技術大学院大学 |
| 著者所属 |
|
|
|
株式会社NTTデータ |
| 著者所属 |
|
|
|
奈良先端科学技術大学院大学 |
| 著者所属(英) |
|
|
|
en |
|
|
Nara Institute Science and Technology |
| 著者所属(英) |
|
|
|
en |
|
|
Nara Institute Science and Technology |
| 著者所属(英) |
|
|
|
en |
|
|
Nara Institute Science and Technology |
| 著者所属(英) |
|
|
|
en |
|
|
Nara Institute Science and Technology |
| 著者名 |
池上, 綾乃
Ani, Hovhannisyan
石尾, 隆
竹之内, 啓太
松本, 健一
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
ビジネスにおけるデータ分析のためのプログラミング言語として,初心者が学習しやすく,データ分析に適したライブラリが豊富である Python が注目されている.データ分析における Python プログラムは,アプリケーション開発で作られるプログラムよりも比較的短く,単純な構造で実装されていることが報告されており,その特徴を利用したプログラム作成の支援が可能であると考えられる.一方で,データ分析において実際にどのようなライブラリを用いて,どのような典型的な処理が実装されているのかは明らかとなっていない.そのため,たとえばデータ加工に用いられるライブラリである Pandas を用いた関数呼び出しの列を自動合成する手法が既存研究で提案されているが,それが実プログラムにおいてどの程度有用であるかは不明である.本研究では,Python プログラムの実装支援技術を開発することを目的として,Kaggle で公開されているデータ分析プログラムがどのようなライブラリ関数を使用しているのかを調査する.その結果,利用頻度の高い 50 個の関数で約 240,000 件のプログラムのうち,52,007 件 (約 20 %) のプログラムを網羅できる一方で,全体では 90, 665 個の関数が使用されており,関数呼び出しの検索や推薦が重要となることを確認した. |
| 書誌情報 |
ソフトウェアエンジニアリングシンポジウム2021論文集
巻 2021,
p. 235-241,
発行日 2021-08-30
|
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |