题名:
Python大数据处理库PySpark实战   python da shu ju chu li ku pyspark shi zhan / 汪明著 ,
ISBN:
978-7-302-57508-5 价格: CNY79.00
语种:
chi
载体形态:
310页 图 21cm
出版发行:
出版地: 北京 出版社: 清华大学出版社 出版日期: 2022
内容提要:
本书分为7章, 第1章介绍大数据的基本概念、常用的大数据分析工具; 第2章介绍Spark作为大数据处理的特点和算法; 第3章介绍Spark实战环境的搭建, 涉及Windows和Linux操作系统; 第4章介绍如何灵活应用PySpark对数据进行操作; 第5章介绍PySpark ETL处理, 涉及PySpark读取数据、对数据进行统计分析等数据处理相关内容; 第6章介绍PySpark如何利用MLib库进行分布式机器学习 (Titanic 幸存者预测); 第7章介绍一个PySpark和Kafka结合的实时项目。 
主题词:
数据处理  
中图分类法:
TP274 版次: 5
主要责任者:
汪明 Wang Ming 著
索书号:
TP274/3167