面向数据科学家的大规模数据处理

数据科学家通常会在训练模型前花时间在探索和转化数据上,如今企业数据一般都存放在数据仓库中。这次分享中,我们会讲解如何利用交互式Spark和Jupyter Hub来分析处理数据仓库中的大规模数据。