本书重点介绍Python语言在处理数据、分析数据及数据可视化方面的应用技巧,内容涉及数据分析软件介绍、数据的收集与整理、Python数据分析编程基础、数据的探索性分析及可视化、数据的直观分析及可视化、数据的统计分析及可视化、数据的模型分析及可视化、数据的预测分析及可视化、数据的决策分析及可视化、数据的在线分析及可视化。本书内容丰富,图文并茂,可操作性强且便于查阅,主要面向希望应用Python进行数据分析的读者,能有效地帮助读者提高数据处理与分析的水平,提升工作效率。本书适合各个层次的数据分析用户,既可作为初学者的入门指南,又可作为中、不错用户的参考手册,同时也可作为各大中专院校和培训班的数据分析教材。
●章 数据分析软件简介 1
1.1 数据分析软件简介 2
1.2 Python语言介绍 3
1.2.1 Python简介 3
1.2.2 Python的功能 4
1.2.3 Python编程环境 6
1.3 Python数据分析平台 8
1.3.1 Jupyter数据分析平台 9
1.3.2 Python在线分析平台 15
1.4 Python编程入门 20
1.4.1 Python的工作目录 20
1.4.2 Python的分析用包 20
1.4.3 Python的数据类型 22
习题1 26
第2章 数据的收集与整理 28
2.1 数据的类型 28
2.1.1 按度量尺度分 28
2.1.2 按时间状况分 29
2.2 数据的收集 29
2.2.1 横向数据的收集 30
2.2.2 纵向数据的收集 32
2.3 数据的管理 33
2.3.1 表格管理数据 34
2.3.2 数据库管理数据 34
2.3.3 Python数据管理 34
习题2 35
第3章 Python数据分析编程基础 37
3.1 Python编程运算 38
3.1.1 基本运算 38
3.1.2 控制语句 38
3.1.3 函数定义 39
3.1.4 面向对象 41
3.2 数值分析库numpy 42
3.2.1 一维数组 43
3.2.2 二维数组 43
3.2.3 数组的操作 43
3.3 数据分析库pandas 44
3.3.1 序列Series 44
3.3.2 数据框DataFrame 46
3.3.3 数据框的读写 48
3.3.4 数据框的操作 50
习题3 54
第4章 数据的探索性分析及可视化 57
4.1 数据的描述分析 58
4.1.1 计数数据汇总分析 58
4.1.2 计量数据汇总分析 59
4.1.3 描述性汇总统计量 61
4.2 数据的统计绘图 62
4.2.1 基于matplotlib的绘图 62
4.2.2 基于pandas的绘图 69
4.3 数据的分组分析 73
4.3.1 一维频数表与图 73
4.3.2 二维集聚表与图 76
4.3.3 多维透视表与图 79
习题4 86
第5章 数据的直观分析及可视化 88
5.1 特殊统计图的绘制 89
5.1.1 函数图 89
5.1.2 气泡图 91
5.1.3 三维散点图 91
5.1.4 三维曲面图 92
5.2 seaborn统计绘图 92
5.2.1 seaborn绘图特点 93
5.2.2 seaborn中的统计图 93
5.3 ggplot绘图系统 98
5.3.1 ggplot与plotnine包 98
5.3.2 基于图层的绘图法 98
5.3.3 plotnine中的统计图 100
5.4 pyecharts动态绘图 104
5.4.1 pyecharts简介 104
5.4.2 pyecharts基本绘图 104
5.4.3 基于数据框的绘图 110
习题5 113
第6章 数据的统计分析及可视化 115
6.1 随机变量及其分布图 116
6.1.1 均匀分布及随机数图 116
6.1.2 正态分布及随机数图 117
6.2 统计量及其抽样分布图 125
6.2.1 统计量及抽样的概念 125
6.2.2 统计量的分布及模拟图 126
6.3 基本统计推断方法 129
6.3.1 参数的估计方法 129
6.3.2 参数的假设检验 132
6.3.3 统计推断的可视化 133
习题6 135
第7章 数据的模型分析及可视化 137
7.1 线性相关分析模型 138
7.1.1 线性相关的概念和模拟 138
7.1.2 样本相关系数的计算 140
7.1.3 样本相关系数的检验 143
7.2 线性回归分析模型 144
7.2.1 线性回归模型的建立 144
7.2.2 线性回归模型的检验 147
7.2.3 线性回归模型的预测 149
7.3 分组可视化模型分析 149
7.3.1 可视化分组线性相关分析 150
7.3.2 可视化分组线性回归模型 150
习题7 153
第8章 数据的预测分析及可视化 155
8.1 动态数列的基本分析 156
8.1.1 动态数列介绍 156
8.1.2 动态数列的变动分析 158
8.2 动态数列的预测分析 161
8.2.1 趋势预测构建 161
8.2.2 平滑预测方法 165
8.3 时间序列数据的可视化分析 168
8.3.1 股票数据可视化分析 169
8.3.2 股票的收益率分析 176
习题8 180
第9章 数据的决策分析及可视化 182
9.1 确定性决策分析 183
9.1.1 单目标求解及图示 183
9.1.2 多目标求解及图示 185
9.2 不确定性决策分析 186
9.2.1 分析方法的思想 186
9.2.2 不确定性分析原则 187
9.3 概率型风险分析 190
9.3.1 期望值法及直观分析 191
9.3.2 后悔期望值法及直观分析 192
习题9 193
0章 数据的在线分析及可视化 195
10.1 Tushare数据的可视化分析 196
10.1.1 股市基本数据的获取与分析 196
10.1.2 证券交易数据的获取与分析 203
10.1.3 Tushare数据的保存及扩展 207
10.2 新浪财经数据的可视化分析 208
10.2.1 宏观经济数据的抓取与分析 209
10.2.2 股票行情数据的抓取与分析 212
10.3 中商情报数据的可视化分析 213
10.3.1 宏观经济数据的爬取与分析 214
10.3.2 A股股票信息的爬取与分析 216
习题10 218
附录A 本书学习博客 220
附录B 书中相关资料 222
附录C 书中自定义函数 223
参考文献 224