关于我们
书单推荐
新书推荐

Python和PySpark数据分析

Python和PySpark数据分析

定  价:118 元

丛书名:数据科学与大数据技术

        

  • 作者:[加]乔纳森·里乌(JonathanRioux)著殷海英译
  • 出版时间:2023/10/1
  • ISBN:9787302645368
  • 出 版 社:清华大学出版社
  • 中图法分类:TP274 
  • 页码:
  • 纸张:胶版纸
  • 版次:
  • 开本:16开
9
7
6
8
4
7
5
3
3
0
6
2
8

Spark数据处理引擎是一个惊人的分析工厂:输入原始数据,输出洞察。PySpark用基于Python的API封装了Spark的核心引擎。它有助于简化Spark陡峭的学习曲线,并使这个强大的工具可供任何在Python数据生态系统中工作的人使用。 《Python和PySpark数据分析》帮助你使用PySpark解决数据科学的日常挑战。你将学习如何跨多台机器扩展处理能力,同时从任何来源(无论是Hadoop集群、云数据存储还是本地数据文件)获取数据。一旦掌握了基础知识,就可以通过构建机器学习管道,并配合Python、pandas和PySpark代码,探索PySpark的全面多功能特性。 主要内容 ● 组织PySpark代码 ● 管理任何规模的数据 ● 充满信心地扩展你的数据项目 ● 解决常见的数据管道问题 ● 创建可靠的长时间运行的任务

 你还可能感兴趣
 我要评论
您的姓名   验证码: 图片看不清?点击重新得到验证码
留言内容