主要内容包括:数据分析基础、NumPy模块实现数值计算、Pandas模块实现统计分析、Matplotlib模块实现数据可视化、【案例】客户价值分析、【案例】销售收入预测、【案例】二手房数据分析预测系统、【案例】智能停车场运营分析系统、【案例】影视作品分析和【案例】看店宝。
1. 明日科技写作经验丰富,案例众多。
2. 配套资源丰富,慕课视频制作精良。
3. 案例式写法适合应用型本科院校。
本书作为Python数据分析的案例教程,不仅介绍了使用Python进行数据分析所涉及的常用知识,而且介绍了6个流行的数据分析方面的项目。
明日科技,程序设计类畅销图书作者,绝大多数品种在“全国计算机图书排行榜”同品种排行中名列前茅,累计销售百万册。作者编写的《Python从入门到项目实战》《零基础学Python》《Python从入门到精通》等长期占据各网店排行榜的榜首位置。
第1章 数据分析基础 1
1.1 什么是数据分析 2
1.2 数据分析的应用 2
1.3 数据分析方法 2
1.3.1 对比分析法 3
1.3.2 同比分析法 3
1.3.3 环比分析法 4
1.3.4 80/20法则 4
1.3.5 回归分析法 4
1.3.6 聚类分析法 5
1.3.7 时间序列分析法 5
1.4 数据分析工具 6
1.5 数据分析流程 7
1.5.1 明确目的 7
1.5.2 获取数据 8
1.5.3 数据处理 9
1.5.4 数据分析 10
1.5.5 验证结果 10
1.5.6 数据展现 10
1.5.7 数据应用 10
1.6 Python数据分析常用模块 10
1.6.1 数值计算模块 10
1.6.2 数据处理模块 10
1.6.3 数据可视化模块 11
1.6.4 机器学习模块 11
小结 11
习题 11
第2章 NumPy模块实现
数值计算 12
2.1 初识NumPy模块 13
2.1.1 NumPy的诞生 13
2.1.2 NumPy的安装 13
2.1.3 NumPy的数据类型 14
2.1.4 数组对象ndarray 15
2.1.5 数据类型对象dtype 16
2.2 NumPy模块中数组的基本操作 16
2.2.1 内置的数组创建方法 16
2.2.2 生成随机数 19
2.2.3 切片和索引 20
2.2.4 修改数组形状 21
2.2.5 组合数组 22
2.2.6 数组分割 24
2.3 NumPy模块中函数的应用 25
2.3.1 数学函数 26
2.3.2 算术函数 27
2.3.3 统计函数 27
2.3.4 矩阵函数 30
2.4 广播机制 31
小结 32
习题 32
第3章 pandas模块实现统计
分析 33
3.1 安装pandas模块 34
3.2 pandas数据结构 35
3.2.1 Series对象 35
3.2.2 DataFrame对象 37
3.3 读、写数据 38
3.3.1 读、写文本文件 38
3.3.2 读、写Excel文件 40
3.3.3 读、写数据库数据 41
3.4 数据操作 44
3.4.1 数据的增、删、改、查 44
3.4.2 NaN数据处理 47
3.4.3 时间数据的处理 50
3.5 数据的分组与聚合 52
3.5.1 分组数据 52
3.5.2 聚合数据 54
3.6 数据的预处理 56
3.6.1 合并数据 56
3.6.2 去除重复数据 60
小结 62
习题 62
第4章 Matplotlib模块实现
数据可视化 63
4.1 基本用法 64
4.1.1 安装 Matplotlib 64
4.1.2 pyplot子模块的绘图流程 65
4.1.3 pyplot子模块的常用语法 65
4.2 绘制常用图表 66
4.2.1 绘制条形图 66
4.2.2 绘制折线图 69
4.2.3 绘制散点图 70
4.2.4 绘制饼图 71
4.2.5 绘制箱形图 73
4.2.6 多面板图表 75
4.3 3D绘图 78
4.3.1 3D线图 78
4.3.2 3D曲面图 79
4.3.3 3D条形图 81
小结 82
习题 82
第5章 客户价值分析 83
5.1 背景 84
5.2 系统设计 84
5.2.1 系统功能结构 84
5.2.2 系统业务流程 84
5.2.3 系统预览 84
5.3 系统开发必备 86
5.3.1 开发环境及工具 86
5.3.2 项目文件结构 86
5.4 分析方法 87
5.4.1 RFM模型 87
5.4.2 聚类分析 87
5.4.3 k-means聚类算法 88
5.5 技术准备 88
5.5.1 sklearn模块 89
5.5.2 k-means聚类 89
5.5.3 pandas模块 90
5.6 用Python实现客户价值分析 90
5.6.1 数据抽取 90
5.6.2 数据探索分析 90
5.6.3 数据处理 91
5.6.4 客户聚类 92
5.6.5 客户价值分析 94
小结 94
习题 94
第6章 销售收入分析与预测 95
6.1 背景 96
6.2 系统设计 96
6.2.1 系统功能结构 96
6.2.2 系统业务流程 96
6.2.3 系统预览 97
6.3 系统开发必备 97
6.3.1 开发环境及工具 97
6.3.2 项目文件结构 97
6.4 分析方法 97
6.4.1 线性回归 97
6.4.2 最小二乘法 98
6.5 线性回归模型 100
6.6 Excel日期数据处理 101
6.6.1 按日期筛选数据 101
6.6.2 按日期显示数据 101
6.6.3 按日期统计数据 102
6.7 分析与预测 102
6.7.1 数据处理 103
6.7.2 日期数据统计并显示 103
6.7.3 根据历史销售数据
绘制拟合图 103
6.7.4 预测销售收入 104
小结 105
习题 105
第7章 二手房数据分析
预测系统 106
7.1 需求分析 107
7.2 系统设计 107
7.2.1 系统功能结构 107
7.2.2 系统业务流程 107
7.2.3 系统预览 107
7.3 系统开发必备 111
7.3.1 开发环境及工具 111
7.3.2 文件夹组织结构 111
7.4 技术准备 111
7.4.1 sklearn库概述 111
7.4.2 加载datasets子模块中的
数据集 111
7.4.3 支持向量回归函数 114
7.5 图表工具模块 115
7.5.1 绘制饼图 115
7.5.2 绘制折线图 116
7.5.3 绘制条形图 117
7.6 二手房数据分析 118
7.6.1 清洗数据 118
7.6.2 各区二手房均价分析 119
7.6.3 各区房子数量比例 120
7.6.4 全市二手房装修程度分析 121
7.6.5 热门户型均价分析 122
7.6.6 二手房售价预测 123
小结 126
习题 126
第8章 智能停车场运营
分析系统 127
8.1 需求分析 128
8.2 系统设计 128
8.2.1 系统功能结构 128
8.2.2 系统业务流程 128
8.2.3 系统预览 128
8.3 系统开发必备 132
8.3.1 开发环境及工具 132
8.3.2 文件夹组织结构 132
8.4 技术准备 133
8.4.1 初识Pygame 133
8.4.2 Pygame的基本应用 133
8.4.3 时间模块 136
8.4.4 日期时间模块 138
8.5 智能停车场数据分析 141
8.5.1 停车时间数据分布图 141
8.5.2 停车高峰时间所占比例 143
8.5.3 每周繁忙统计 145
8.5.4 月收入分析 147
8.5.5 每日接待车辆统计 149
8.5.6 车位使用率 150
小结 152
习题 152
第9章 影视作品分析 153
9.1 需求分析 154
9.2 系统设计 154
9.2.1 系统功能结构 154
9.2.2 系统业务流程 154
9.2.3 系统预览 155
9.3 系统开发必备 156
9.3.1 开发环境及工具 156
9.3.2 文件夹组织结构 156
9.4 技术准备 157
9.4.1 使用jieba模块进行分词 157
9.4.2 使用wordcloud库实现
词云图 159
9.5 主窗体设计 162
9.5.1 实现主窗体 162
9.5.2 查看部分的隐藏与显示 163
9.5.3 下拉列表处理 164
9.6 数据分析与处理 166
9.6.1 获取数据 166
9.6.2 生成全国热力图文件 167
9.6.3 生成主要城市评论数及平均
分文件 168
9.6.4 生成词云图 168
9.7 单击查看显示内容 169
9.7.1 创建显示HTML页面的窗体 169
9.7.2 创建显示图片的窗体 170
9.7.3 绑定查询按钮单击事件 171
小结 172
习题 172
第10章 看店宝 173
10.1 需求分析 174
10.2 系统设计 175
10.2.1 系统功能结构 175
10.2.2 系统业务流程 175
10.2.3 系统预览 175
10.3 系统开发必备 179
10.3.1 开发环境及工具 179
10.3.2 文件夹组织结构 179
10.4 技术准备 180
10.4.1 使用Python操作数据库 180
10.4.2 JSON模块的应用 181
10.5 主窗体的UI设计 182
10.5.1 对主窗体进行可视化设计 182
10.5.2 将可视化窗体转换为.py
文件 184
10.5.3 设置窗体及控件背景 184
10.5.4 创建窗体控制文件 185
10.5.5 主窗体预览效果 185
10.6 设计数据库表结构 186
10.7 初始数据的爬取 187
10.7.1 爬取排行信息 187
10.7.2 爬取价格信息 190
10.7.3 爬取评价信息 191
10.7.4 定义数据库操作文件 194
10.8 图表分析数据 197
10.8.1 饼图展示评价信息 197
10.8.2 分析出版社所占比例的
条形图 198
10.8.3 折线图分析价格走势 199
10.8.4 Top10数据展示 200
10.9 商品排行展示 203
10.9.1 热销商品排行榜 203
10.9.2 热门商品展示 205
10.10 关注商品 207
10.10.1 分析关注商品的预警信息 207
10.10.2 重点商品的关注与取消 208
10.11 商品营销预警 214
10.11.1 商品中、差评预警 214
10.11.2 商品价格变化预警 216
10.12 关注商品图表分析 218
10.12.1 关注商品评价分析饼图 218
10.12.2 关注商品出版社占有比例 220
10.13 其他功能 222
小结 224
习题 224