本书以R语言为实现工具,以数据可视化分析为导向,结合实际案例介绍数据可视化方法。全书共8章,第1章介绍数据可视化概述以及R语言数据处理的基本技能;第2章介绍R语言绘图基础,重点介绍R语言传统绘图包graphics中的绘图函数及基本使用方法;第3章介绍类别数据的可视化方法;第4章介绍数据分布特征的可视化方法;第5章介绍变量间关系的可视化方法;第6章介绍样本相似性的可视化方法;第7章介绍时间序列的可视化方法;第8章介绍几种特殊的可视化图形以及出版物中图表的使用技巧。附录列出了本书使用的R包和R函数。
本书可作为高等院校各专业“数据可视化”相关课程的教材,也可作为数据分析工作者、R语言和可视化分析的爱好者的参考书。
首先,本书的写作角度立足于数据可视化本身,而不是R实现。从数据类型出发,介绍可能的可视化图形,并使用实际数据进行展示。
其次,本书尽可能体现R可视化的多样性和灵活性,同一种图形尽量使用不同的R函数实现,有利于读者对R的理解和应用。
最后,本书每章图形都附有R的实现代码,书后列有详细的函数清单,方便读者查阅。
贾俊平 中国人民大学统计学院副教授。研究方向:统计方法在经济各领域的应用、统计教学方式和方法。主要著作有:《统计学》、《描述统计》、《工商管理统计》、《市场调查与分析》等。主持研究的“非统计学专业本科公共基础课——统计学教学改革”项目获2001年国家级教学成果二等奖、2001年北京市教学成果一等奖。2001年荣获北京市经济技术创新标兵称号,2003年荣获宝钢优秀教师奖等。
第 1章 数据可视化与R语言
1.1 数据可视化概述 001
1.1.1 数据可视化及其分类 001
1.1.2 数据可视化的数据类型 002
1.1.3 数据可视化的实现工具 003
1.1.4 数据可视化注意事项 003
1.2 R软件的初步使用 003
1.2.1 R软件的下载与安装 004
1.2.2 对象赋值与运行 004
1.2.3 编写代码脚本 005
1.2.4 查看帮助文件 005
1.2.5 包的安装与加载 006
1.3 创建R格式数据 006
1.3.1 向量、矩阵和数组 007
1.3.2 数据框 009
1.3.3 因子和列表 013
1.4 R语言数据处理 014
1.4.1 数据读取和保存 014
1.4.2 随机数和数据抽样 015
1.4.3 生成频数分布表 015
1.4.4 数据类型的转换 022
习题 026
第 2章 R语言绘图基础
2.1 R语言的基本绘图函数 027
2.1.1 高级绘图函数 027
2.1.2 低级绘图函数 030
2.2 图形参数与图形控制 032
2.2.1 绘图参数 032
2.2.2 图形控制 034
2.2.3 图形颜色 037
2.3 页面布局与图形组合 041
2.3.1 用par函数布局页面 041
2.3.2 用layout函数布局页面 042
2.3.3 同时打开多个绘图窗口 044
习题 045
第3章 类别数据可视化
3.1 条形图及其变种 046
3.1.1 简单条形图和帕累托图 046
3.1.2 并列条形图和堆叠条形图 049
3.1.3 不等宽条形图和脊形图 053
3.2 树状图 056
3.2.1 条形树状图 056
3.2.2 矩形树状图 058
3.3 马赛克图及其变种 059
3.3.1 马赛克图 059
3.3.2 马赛克图的变种 061
3.4 关联图和独立性检验的P值图 064
3.4.1 关联图 064
3.4.2 独立性检验的P值图 066
3.5 气球图和热图 067
3.5.1 气球图 067
3.5.2 热图 070
3.6 南丁格尔玫瑰图 072
3.7 金字塔图 075
3.8 饼图及其变种 077
3.8.1 饼图和扇形图 077
3.8.2 环形图 079
习题 081
第4章 分布特征可视化
4.1 直方图与核密度图 082
4.1.1 直方图 082
4.1.2 核密度图 089
4.2 箱线图和小提琴图 096
4.2.1 箱线图 097
4.2.2 小提琴图 102
4.3 点图、带状图和太阳花图 105
4.3.1 点图 105
4.3.2 带状图和太阳花图 107
4.4 海盗图 109
4.5 分布概要图 111
4.6 正态概率图 112
习题 115
第5章 变量间关系可视化
5.1 散点图与散点图矩阵 116
5.1.1 散点图 116
5.1.2 散点图矩阵 121
5.1.3 相关系数矩阵 123
5.1.4 相关系数网状图 128
5.2 条件散点图 129
5.3 大数据集的散点图 134
5.4 3D散点图和气泡图 136
5.4.1 3D散点图 136
5.4.2 气泡图 138
5.5 广义配对图 140
习题 142
第6章 样本相似性可视化
6.1 轮廓图和雷达图 144
6.1.1 轮廓图 144
6.1.2 雷达图 148
6.2 星图和脸谱图 151
6.2.1 星图 151
6.2.2 脸谱图 154
6.3 聚类图和热图 156
6.3.1 聚类图 156
6.3.2 热图 160
习题 167
第7章 时间序列可视化
7.1 变化模式可视化 168
7.1.1 折线图与面积图 168
7.1.2 蒸汽图与风筝图 174
7.1.3 表格图 177
7.1.4 日历图 179
7.2 变动特征可视化 181
7.2.1 时间序列的瀑布图 181
7.2.2 两个时点间的斜率图 183
7.2.3 序列的改变点 185
7.2.4 时间序列的动态交互图 187
7.3 序列成分可视化 188
7.3.1 成分分解 189
7.3.2 随机成分平滑 193
习题 194
第8章 其他可视化图形
8.1 瀑布图 196
8.2 和弦图 198
8.3 桑基图 200
8.4 平行集图 202
8.5 3D透视图 203
8.6 词云图 205
8.7 出版物中的图表 209
8.7.1 绘制表格 209
8.7.2 绘制带有表格和注释文本的图形 211
8.7.3 绘制带有检验信息的图形 214
8.8 为图形添加背景图片 215
习题 216
附录 本书使用的R包和R函数 217
参考文献 224