应用统计分析是一门关于如何获取、整理数据和分析客观现象数量规律的方法论的学科。本书共10章,主要介绍应用统计分析的基本理论和方法,内容包括随机变量、随机向量及其统计特性,抽样调查与抽样分布,参数估计,假设检验,方差分析,回归分析,判别分析,聚类分析,主成分分析,因子分析等。本书各章均配有习题,方便学生巩固所学知识。
本书可作为高等院校经济管理类专业的研究生教材,也可供从事应用统计分析的实际工作者参考。
书中列举了大量的例题和实际案例的分析,并配有习题和数据方便学生练习和巩固相应的知识。 本书可作为高等院校统计、经管专业的本科生和研究生教材,也可供从事统计分析的实际工作者参考。
随着计算机和信息技术的迅猛发展,人类社会进入了信息爆炸的大数据时代,过去无法想象的海量数据正以数字形式聚集。早期获取数据艰难,只能通过少量数据来推断事物规律,如今要从海量繁杂的数据信息中挖掘出有用信息并进行合理估计同样困难,甚至更为复杂。因此,海量数据密集型科学可能会成为未来科学发展新的趋势,进而带动未来科研方式的革命性变革。随着计算机和统计软件的广泛应用,统计学中的一个分支——多元统计分析迅速发展起来,它能够从多维度分析实际问题,使得解决问题的途径更加丰富,其应用范围也向更加广泛的社会科学和自然科学领域扩展。应用统计分析已成为大数据时代发现问题、分析问题和解决问题不可或缺的理论方法及重要工具。
2003年我们出版了《应用统计学教程》(西安电子科技大学出版社出版,2004年被教育部推荐为研究生教材)。该教材作为研究生教学用书使用了近20年。其间我们对书中内容进行了多次完善。本书是在此教材的基础上综合了多方意见编写而成的。本书不仅强调应用,而且尽可能从数学理论上加以推导证明。作为应用统计分析课程的研究生教材,本书力求帮助学生从实际应用中理解数理统计中的理论依据,培养他们发现问题、分析问题和解决问题的能力。
全书共10章。第1~6章介绍数理统计的基础理论及应用,内容包括随机变量、随机向量及其统计特性,抽样调查与抽样分布,参数估计,假设检验,方差分析,回归分析等。第7~10章介绍多元统计分析的理论与方法,内容包括判别分析、聚类分析、主成分分析以及因子分析等。多元统计分析部分配有案例分析,较为复杂的案例分析采用SAS和SPSS统计软件来实现。全书各章均配有习题,方便学生巩固所学知识。
本书第3、5、7、9、10章由温小霓编写,第2、4、6章由刘云编写,第1、8章由徐扬编写。本书的编写得到了西安电子科技大学研究生院领导以及赵玮教授的大力支持,西安电子科技大学出版社的戚文艳、王瑛、阎彬编辑对本书的出版付出了辛勤的劳动,在此一并表
示衷心的感谢。
虽然我们付出了很多艰辛的努力,且花费了很长的时间编写本书,但书中难免有疏漏之处,敬请各位读者批评指正,以便今后进一步修改、完善。
温小霓
2021年9月于西安
第1章 随机变量、随机向量及其统计特性 1
1.1 随机变量的分布与数字特征参数 1
1.1.1 分布函数与密度函数 1
1.1.2 随机变量的常用分布 2
1.1.3 随机变量的数字特征 16
1.2 概率母函数、特征函数与矩母函数 27
1.2.1 概率母函数 27
1.2.2 特征函数 31
1.2.3 矩母函数 33
1.3 随机向量及其变换 35
1.3.1 分布函数、密度函数与独立性 36
1.3.2 随机向量的数字特征参数 43
1.3.3 随机变量与随机向量的变换 45
1.3.4 n元正态向量及其线性变换 50
1.3.5 大数定律与中心极限定理 52
1.4 条件数学期望与条件方差 53
1.4.1 条件数学期望 54
1.4.2 条件方差 56
1.5 常用分布表 57
习题 62
第2章 抽样调查与抽样分布 63
2.1 总体、样本、统计量及其统计特性 64
2.1.1 总体、样本、统计量与抽样概型 64
2.1.2 样本总值、样本均值与样本k阶原点矩的统计特性 66
2.1.3 总体总值、总体均值与总体比例的估计及误差 70
2.1.4 顺序统计量 73
2.2 抽样调查设计 79
2.2.1 抽样目标、指标体系与误差设计 79
2.2.2 抽样组织方式 80
2.2.3 抽样算法 84
2.2.4 样本容量的确定 86
2.2.5 统计调查表与问卷设计 92
2.3 统计数据的加工、描述与信息提炼 97
2.3.1 统计数据的加工 98
2.3.2 统计数据的描述 100
2.3.3 统计信息的提炼 105
习题 113
第3章 参数估计 115
3.1 估计量及其比较准则 115
3.2 总体参数的估计 118
3.2.1 矩估计 118
3.2.2 极大似然估计 120
3.2.3 区间估计 122
3.2.4 广义极大似然估计与贝叶斯(Bayes)估计 128
3.3 总体均值、总体总值与总体比例的估计 132
3.3.1 分层抽样下三指标的估计 132
3.3.2 整群抽样下三指标的估计 138
3.3.3 系统抽样下三指标的估计 142
习题 142
第4章 假设检验 144
4.1 假设检验的基本思路与方法 144
4.1.1 小概率事件的实际推断原理 144
4.1.2 假设检验的实施步骤 145
4.1.3 假设检验的分类与方法 147
4.2 参数假设检验 147
4.2.1 单个正态总体参数的假设检验 148
4.2.2 两个正态总体参数的一致性检验 151
4.2.3 非正态总体参数的假设检验 156
4.3 非参数假设检验 157
4.3.1 χ2检验法 157
4.3.2 符号检验法 166
4.3.3 秩和检验法 171
习题 181
第5章 方差分析 184
5.1 单因素方差分析 184
5.2 双因素方差分析 195
5.2.1 有重复试验的双因素方差分析 195
5.2.2 无重复试验的双因素方差分析 202
习题 204
第6章 回归分析 207
6.1 相关分析 207
6.1.1 变量之间的关系 207
6.1.2 相关关系的测定 208
6.1.3 样本相关系数r的统计分布 210
6.1.4 总体相关系数ρ的统计检验 211
6.1.5 相关分析中应注意的问题 213
6.2 一元线性回归分析 213
6.2.1 一元线性回归模型 214
6.2.2 一元线性回归模型参数a和b的估计 214
6.2.3 一元线性回归方程及有关估计量的性质 215
6.2.4 一元线性回归模型的检验 219
6.2.5 一元线性回归预测与控制 223
6.2.6 曲线回归的线性化处理 227
6.3 多元线性回归分析 228
6.3.1 多元线性回归模型 228
6.3.2 复相关系数与偏相关系数 233
6.3.3 多元线性回归模型的检验 236
6.3.4 多元线性回归预测 239
6.3.5 多元线性回归分析中的多重共线性 239
6.3.6 多元线性回归分析中的序列相关 242
6.3.7 多元线性回归分析中的异方差性 247
习题 252
第7章 判别分析 256
7.1 变量测度与数据的变换处理 257
7.1.1 变量测度 257
7.1.2 数据的变换处理 258
7.2 距离判别 259
7.3 贝叶斯(Bayes)判别 267
7.4 费歇判别 273
习题 278
第8章 聚类分析 282
8.1 概述 282
8.2 相似性度量 283
8.3 系统聚类法 285
8.4 变量聚类法 289
8.5 动态聚类法 290
习题 291
第9章 主成分分析 293
9.1 概述 293
9.2 总体的主成分及其特性 295
9.3 用相关矩阵确定主成分 300
9.4 样本主成分 303
9.5 主成分回归 306
习题 310
第10章 因子分析 312
10.1 因子分析的基本概念 312
10.2 因子分析模型 313
10.2.1 因子分析模型的性质 314
10.2.2 因子载荷矩阵中的几个统计特性 315
10.2.3 因子载荷矩阵的估计 316
10.3 因子旋转(正交变换) 320
10.3.1 旋转变换后的性质 320
10.3.2 因子旋转方法 321
10.4 因子得分 325
10.4.1 因子得分函数 325
10.4.2 因子得分的应用案例 326
习题 332
附表 335
附表1 标准正态分布N(0, 1)表 335
附表2 χ2分布表 336
附表3 t分布表 337
附表4 F分布表 338
附表5 符号检验表 341
附表6 Wilcoxon符号秩和检验的T临界值 342
附表7 秩和检验表 343
附表8 曼〖CD*2]惠特尼U检验(MWU的临界值) 344
附表9 方差齐性的Hartley检验表和Cochran检验表 345
附表10 累积泊松分布cd=0λdd!e-λ数值表 347
附表11 检验相关系数ρ=0的临界值(rα)表 349
附表12 DW统计量临界值表 350
参考文献 351