Python大数据处理库PySpark实战pdf+epub

内容查看
查看价格20 元(100 台币TWD)
Python大数据处理库PySpark实战pdf+epub

我国提出新基建概念,要加快大数据中心、人工智能等新型基础设施的建设度,这无疑需要更多的大数据人才。PySpark可以对大数据行分布式处理,降低大数据学习门槛,本书正是一本PySpark门教材,适合有一定Python基础的读者学习使用。 本书分为7章,第1章介绍大数据的基本概念、常用的大数据分析工具;第2章介绍Spark作为大数据处理的特和算法;第3章介绍Spark实战环境的搭建,涉及Windows和Linux操作系统;第4章介绍如何灵活应用PySpark对数据行操作;第5章介绍PySpark ETL处理,涉及PySpark读取数据、对数据行统计分析等数据处理相关内容;第6章介绍PySpark如何利用MLlib库行分布式机器学习(Titanic幸存者预测);第7章介绍一个PySpark和Kafka结合的实时项目。 本书内容全面、示例丰富,可作为广大PySpark门读者的参考书,同时能作为大中专院校师生的教学参考书,也可作为高等院校计算机及相关专业的大数据技术教材使用。<br/>【推荐语】<br/>PySpark可以对大数据行分布式处理,降低了大数据的学习门槛。本书是一本PySpark门教材,重讲述PySpark安装、PySpark用法、ETL数据处理、PySpark机器学习及其实战,*后给出一个综合实战案例。本书逻辑线索清晰,内容体系合理,适合有一定Python基础的大数据分析和处理人员学习使用。<br/>【作者】<br/>汪明,硕士,毕业于中国矿业大学,徐州软件协会副理事长,某创业公司合伙人。从事软件行业十余年,发表论文数十篇。著有图书《TypeScript实战》《Go并发编程实战》。<br/>

点点赞赏,手留余香 给TA打赏
0

評論0

支持多种货币
支持多种货币付款,满足您的付款需求
7天无忧退换
安心无忧购物,售后有保障
专业客服服务
百名资深客服7*24h在线服务
发货超时赔付
交易成功极速发货,专业水准保证时效性
顯示驗證碼

社交帳號快速登錄