ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 論文誌(トランザクション)
  2. プログラミング(PRO)
  3. Vol.14
  4. No.2

AlphaSQL:SQLファイル集合の型・スキーマ解析と自動並列化

https://ipsj.ixsq.nii.ac.jp/records/211066
https://ipsj.ixsq.nii.ac.jp/records/211066
80114883-f07d-4460-87da-3253ad3ec836
名前 / ファイル ライセンス アクション
IPSJ-TPRO1402007.pdf IPSJ-TPRO1402007.pdf (114.3 kB)
Copyright (c) 2021 by the Information Processing Society of Japan
オープンアクセス
Item type Trans(1)
公開日 2021-05-12
タイトル
タイトル AlphaSQL:SQLファイル集合の型・スキーマ解析と自動並列化
タイトル
言語 en
タイトル AlphaSQL: Integrated Type/Schema Check and Parallelization for SQL File Set
言語
言語 jpn
キーワード
主題Scheme Other
主題 [発表概要, Unrefereed Presentatin Abstract]
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_6501
資源タイプ journal article
著者所属
東京大学大学院学際情報学府
著者所属
東京大学大学院学際情報学府
著者所属
東京大学大学院情報学環
著者所属(英)
en
Graduate School of Interdisciplinary Information Studies, The University of Tokyo
著者所属(英)
en
Graduate School of Interdisciplinary Information Studies, The University of Tokyo
著者所属(英)
en
Interfaculty Initiative in Information Studies, The University of Tokyo
著者名 松井, 誠泰

× 松井, 誠泰

松井, 誠泰

Search repository
杉崎, 琢人

× 杉崎, 琢人

杉崎, 琢人

Search repository
越塚, 登

× 越塚, 登

越塚, 登

Search repository
著者名(英) Masahiro, Matsui

× Masahiro, Matsui

en Masahiro, Matsui

Search repository
Takuto, Sugisaki

× Takuto, Sugisaki

en Takuto, Sugisaki

Search repository
Noboru, Koshizuka

× Noboru, Koshizuka

en Noboru, Koshizuka

Search repository
論文抄録
内容記述タイプ Other
内容記述 機械学習やデータ解析などの技術は強力で柔軟なシステムを実現するが,データと処理の依存関係やデータ・処理それぞれの変更への追随など管理の難しさがある.そこで本発表では,型・スキーマの安全性を保ちながらデータ基盤の構築を行うためのAlphaSQLというフレームワークを提案する.AlphaSQLは,SQLファイル間の依存関係を解決することにより,SQLファイル集合全体の型・スキーマ解析と並列化を行う.テーブルを作成するSQL文に対する,作成されたテーブルを参照するクエリの依存関係が,SQLファイルの静的解析によって自動的に抽出される.結果は有向非循環グラフとして出力され,ユーザは依存関係を視覚的に確認することができる.既存のワークフローツールとは異なり,ユーザはSQLファイル間の複雑な依存関係に注意したり,並列化のための追加の作業を行う必要はない.また,解析の過程で構文の誤り・型の不整合を含む一般的なエラーが排除されることを,実際のCIでの分析結果から確認することができた.一部のSQLは機械学習モデルのトレーニングとデプロイをサポートしはじめており,AlphaSQLは機械学習にも有効だと考えられる.AlphaSQLはGithubで公開されており,主にBigQueryで現在使用されているが,AlphaSQLが依存する分析フレームワークZetaSQLはStandard SQL2011とほぼ互換性があり,多くのSQLに対応しやすいと考えられる.https://github.com/Matts966/alphasql
論文抄録(英)
内容記述タイプ Other
内容記述 Emerging technologies such as machine learning and data mining realize powerful and flexible systems, however, they cause some problems. For example, management of dependency relationships between data and processing and their changes are typical pains. We present a framework named AlphaSQL to build type/schema safe and efficient data lake, data warehouse, and data mart. AlphaSQL provides integrated type/schema check and parallelization for SQL file set by resolving dependencies between SQL files. The dependencies of table references on the statement creating the tables are automatically resolved by static analysis of SQL files. The framework outputs the result as a directed acyclic graph and users can check the visualization of the dependencies. Unlike other existing workflow tools, users do not have to care about and code the complex dependencies between SQL files. Based on the resolution results, the SQL files are checked to eliminate typical errors including syntax errors, schema errors such as unknown columns and incompatible types, and executed parallelly. In addition, it was confirmed from the actual CI analysis results that typical errors including syntactical errors and type/schema inconsistencies were eliminated in the analysis process. These features are also useful in actual machine learning environment because some SQLs support training and deployement of machine learning models. AlphaSQL is open on Github and currently used mainly for BigQuery, however, we can extend the framework easily because the analysis framework ZetaSQL that AlphaSQL depends on is almost compatible with the standard SQL 2011. https://github.com/Matts966/alphasql
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11464814
書誌情報 情報処理学会論文誌プログラミング(PRO)

巻 14, 号 2, p. 27-27, 発行日 2021-05-12
ISSN
収録物識別子タイプ ISSN
収録物識別子 1882-7802
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 17:55:21.551231
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3