《概率论与数理统计》强调概率论与数理统计的应用性,主要包括概率与统计简介、描述统计学、概率论的基础、随机变量的概率分布与数字特征、几种常见的分布、统计量的分布、参数估计、假设检验和线性回归等内容。书中主要统计计算使用Excel软件完成。学习《概率论与数理统计》的主要理论仅需要读者具有一元微积分的数学基础。
《概率论与数理统计》可作为高等学校非数学类专业“概率论与数理统计”课程的教材,也适合科技工作者自学与参考。
自从20世纪末我国高等教育大规模扩招以来,学生的学习能力和发展方向的差异性增大。对于一部分有志考研的学生,大学数学教学必须遵从考研大纲的要求,着重数学理论的系统性和严谨性培养,而对于大部分其他学生,学习数学的主要目的是为后续专业课程的学习打下基础,从而对教学内容选择的灵活性就更大一些。本教材是我们近几年来在东华大学实施“分流培养、分层教学、分类成才”的教学改革实践中编写而成的,主要面向不考研的学生,强调概率论与数理统计课程的应用性和统计软件的使用。
与目前国内概率论与数理统计的主流教材相比,本教材具有如下特色:
(1)内容包含了描述统计学和线性回归这两个应用统计学的重要内容。这两部分内容在多数教材中往往不出现或者是在教学实践中来不及安排的。
(2)删除了部分数学理论推导较复杂的内容。例如,对于多维随机变量,主要介绍二维离散型随机变量的联合分布律,在此基础上引入独立性和协方差等概念;而对于多维连续型随机变量,仅介绍密度函数和独立性的基本概念,但没有布置这方面的习题。在区间估计和假设检验中仅介绍单个总体均值的估计和检验,略去了比较复杂的两个正态总体的估计和检验,我们相信这些简化不会影响学生对于概率论和数理统计基本思想的理解。这样处理也使得本教材只要求学生预先学过一元微积分,不需要多元微积分和线性代数的知识,因而可在大学一年级的第二学期安排课程教学。
(3)尽管本教材不强调数学上的严密性,但对所有理论的由来都给出了推导过程,而不是直接给出定理的结果。例如,本书对正态分布的独立可加性给出了一个简单却又完整的证明。我们还利用蒙特卡罗方法,画出独立均匀分布和的直方图,从而较自然地呈现出中心极限定理的正态分布曲线。又如,关于样本方差的分布以及回归模型残差平方和的分布,我们是从与卡方分布定义作类比的方法得到的。这个方法很自然,学生容易理解,尽管它不是数学上的严格证明(该证明需要利用正交矩阵)。
(4)将Excel软件与教学内容有机地结合起来。Excel是大部分学生都熟悉的办公自动化软件,易于上手。首先,我们介绍了它的一些描述统计函数,如均值和标准差等,这使学生更容易处理较大规模数据样本的统计计算及其可视化表达。其次,我们利用它的概率分布计算函数,可避免查询很多统计分位数表。同时,在假设检验中,我们主要采用p值检验法而不是临界值检验法,前者是绝大多数统计软件采用的方法。另外,我们还利用Excel随机数生成函数来介绍蒙特卡罗模拟,并由此引出中心极限定理。与此同时,我们并不追求对Excel软件统计功能的完整介绍,没有介绍怎样利用Excel软件直接得出一些假设检验和回归分析的计算结果,因为这毕竟不是本课程的主要目的。教材中采用的是Excel2007版,其中的函数在更高的版本中是被兼容的。在附录中,我们还给出了2007版与2010版函数的对照表。
第1章 概率与统计简介
习题
第2章 描述统计学
2.1 数据的描述
2.1.1 频数表和频数图
2.1.2 相对频数表和相对频数图
2.1.3 分组数据、直方图和累积频数曲线
2.2 数据的汇总
2.2.1 样本均值、样本中位数和样本众数
2.2.2 样本方差和样本标准差
2.2.3 样本分位数和盒形图
2.2.4 成对数据集和样本相关系数
习题
第3章 概率论的基础
3.1 概率的基本概念
3.1.1 样本空间和随机事件
3.1.2 概率的定义与性质
3.2 等可能概型
3.2.1 古典概型
3.2.2 几何概型
3.3 条件概率
3.3.1 条件概率与乘法公式
3.3.2 全概率公式与贝叶斯公式
3.4 事件的独立性
习题
第4章 随机变量的概率分布与数字特征
4.1 随机变量及其概率分布
4.1.1 离散型随机变量及其分布律
4.1.2 分布函数
4.1.3 连续型随机变量及其密度函数
4.1.4 随机变量函数的分布
4.2 随机变量的联合概率分布及独立性
4.2.1 离散型随机变量的联合分布律
4.2.2 连续型随机变量的联合密度函数
4.2.3 随机变量的独立性
4.3 数学期望
4.3.1 数学期望的定义
4.3.2 随机变量函数的数学期望
4.3.3 数学期望的性质
4.4 方差和协方差
4.4.1 方差和标准差
4.4.2 协方差和相关系数
习题
第5章 几种常见的分布
5.1 伯努利分布和二项分布
5.1.1 伯努利试验与伯努利分布
5.1.2 二项分布的定义与计算
5.1.3 二项分布的性质及应用
5.2 泊松分布
5.2.1 泊松分布的定义与计算
5.2.2 泊松分布的性质与应用
5.3 均匀分布
5.4 指数分布
5.5 正态分布
5.5.1 标准正态分布
5.5.2 正态分布及其性质
5.6 正态分布生成的分布
5.6.1 x2分布
5.6.2 t分布
5.6.3 F分布
习题
第6章 统计量的分布
6.1 随机样本
6.2 正态总体统计量的分布
6.3 大数定律与随机模拟
6.3.1 辛钦大数定律和伯努利大数定律
6.3.2 蒙特卡罗模拟
6.4 中心极限定理
6.4.1 独立随机变量和的蒙特卡罗模拟
6.4.2 两个中心极限定理
6.5 大样本均值的近似分布
习题
第7章 参数估计
7.1 点估计
7.1.1 点估计及其评价
7.1.2 最大似然估计
7.2 总体均值的区间估计
7.2.1 方差已知时正态总体均值的区间估计
7.2.2 方差未知时正态总体均值的区间估计
7.2.3 大样本情形总体均值的区间估计
习题
第8章 假设检验
8.1 假设检验的基本概念
8.2 总体均值的假设检验
8.2.1 方差已知时正态总体均值的假设检验
8.2.2 方差未知时正态总体均值的假设检验
8.2.3 大样本情形总体均值的假设检验
习题
第9章 线性回归
9.1 回归模型的参数估计
9.1.1 一元线性回归模型
9.1.2 回归系数的估计
9.2 回归模型的假设检验
9.2.1 方差分析
9.2.2 估计量的分布
9.3 ★回归预测
9.3.1 回归系数的区间估计
9.3.2 因变量的预测区间
习题
附表