pyspark学习笔记

主要看的书是 《PySpark实战指南》 机械工业出版社的。

第一章 了解Spark

弹性分布式数据集 RDD