《普通高等教育“十二五”规划教材:概率论与数理统计》是一本供非数学专业学生使用的概率论与数理统 计教材。全书共10章,内容包括随机事件和概率、离散型随机变量及其分布、连续型随机变量及其分布、随机变量的数字特征、大数定律和中心极限定理、数理统 计的基本概念、参数估计、假设检验、方差分析与回归分析、统计软件SPSS简介。每一章后面有相当数量的习题,并在书末配有参考答案。为了使学生对这门课 程在现实生产、生活中的应用有一个感性的认识,在每一章的最后都提供了一篇课外拓展阅读,以提高学生的学习兴趣和应用意识。
更多科学出版社服务,请扫码获取。
《普通高等教育“十二五”规划教材:概率论与数理统计》是一本供非数学专业学生使用的概率论与数理统计教材。本书融入了编者多年的教学经验,吸取了国内同类教材的长处,紧扣硕士研究生入学考试大纲,可供高等学校中的工科、农医、经济、管理等专业使用。
目录CONTENTS
前言
第1章 随机事件和概率
1.1 随机事件 2
一、随机试验 2
二、样本空间 2
三、随机事件 3
四、事件间的关系与运算 3
1.2 概率的定义 5
一、概率的统计定义 6
二、概率的公理化定义 7
三、古典概型 9
四、几何概型 10
1.3 条件概率、全概率公式和贝叶斯公式 11
一、条件概率 11
二、乘法公式 13
三、全概率公式与贝叶斯公式 13
1.4 事件的独立性 16
1.5 伯努利概型 18
课外拓展阅读 产生十几位数学家和物理学家的家族 19
习题1 21
第2章 离散型随机变量及其分布
2.1 随机变量 24
2.2 离散型随机变量及其分布律 25
一、两点分布 25
二项分布 26
三、泊松(Poisson)分布 27
四、几何分布 29
五、超几何分布 29
2.3 二维随机变量及其分布 30
一、联合分布律 30
二、边缘分布律 31
2.4 随机变量的独立性与条件分布 33
2.5 随机变量函数的分布 34
一、一维随机变量函数的分布 35
二维随机变量函数的分布 35
课外拓展阅读 帕斯卡与早期概率论的发展 37
习题2 38
第3章 连续型随机变量及其分布
3.1 分布函数与概率密度函数 42
3.2 常用的一维连续型随机变量 45
一、均匀分布 45
二、指数分布 46
三、正态分布 47
3.3 二维随机变量及其分布 50
一、二维分布函数的性质 50
.二维联合密度函数 51
三、边缘密度函数 54
3.4 随机变量的独立性与条件密度函数 56
一、随机变量的独立性 56
二、条件密度函数 57
3.5 随机变量函数的分布 59
一、一维随机变量函数的分布 59
二、两个随机变量之和的分布 60
三、两个随机变量之商的分布 63
四、随机变量最大值、最小值的分布 64
课外拓展阅读 统计学家与战争 65
习题3 66
笫4章 随机变量的数字特征
4.1 数学期望 70
一、离散型随机变量的数学期望 70
二、连续型随机变量的数学期望 72
三、随机变量函数的数学期望 73
四、数学期望的性质 75
4.2 方差 77
一、方差的定义 77
二、几种常见随机变量的方差 78
三、方差的性质 79
4.3 协方差和相关系数 81
4.4 矩和协方差矩阵 84
一、矩 84
二、协方差矩阵 84
课外拓展阅读 蒲丰的投针试验 86
习题4 87
第5章 大数定律和中心极限定理
5.1 大数定律 90
5.2 中心极限定理 92
课外拓展阅读破解彩票的中奖秘诀 96
习题5 96
第6章 数理统计的基本概念
6.1 总体和样本 99
6.2 经验分布函数 100
6.3 统计量 101
6.4 三个常用分布 103
一、x2分布 103
二、t分布 105
三、F分布 106
6.5 抽样分布 107
课外拓展阅读 数理统计大师——费希尔 109
习题6 110
第7章 参数估计
7.1 点估计 113
一、矩估计 113
二、极大似然估计 115
7.2 估计量的评选标准 117
一、无偏性 117
二、有效性 118
三、一致性 119
7.3 置信区间 120
7.4 单个正态总体未知参数的置信区间 122
一、正态总体均值μ的置信区间 122
二、正态总体方差σ2的置信区间 124
7.5 两个正态总体下未知参数的置信区间 125
一、两个总体均值差μ1-μ2的置信区间 125
二、两个总体方差比σ1/σ2的置信区间 127
7.6 非正态总体均值的区间估计 127
一、非正态总体均值的大样本区间估计 128
二、总体成数(比例)的大样本区间估计 128
课外拓展阅读生活与商业中的统计学 129
习题7 131
第8章 假设检验
8.1 假设检验问题 135
8.2 单个正态总体的假设检验 137
一、单个正态总体N(μ,σ2)均值μ的检验 137
二、单个总体方差σ2的检验 138
8.3 两个正态总体的假设检验 140
一、两个正态总体均值差的检验 140
二、两个总体方差比σ1/σ2的假设检验 141
8.4 总体比率的假设检验 143
8.5 分布拟合检验 145
课外拓展阅读 证券内慕交易举证制度中的假设检验原理 148
习题8 150
第9章 方差分析与回归分析
9.1 单因素试验的方差分析 153
一、方差分析的基本思想 153
二、单因素试验的方差分析方法 154
9.2 双因素试验的方差分析 158
一、双因素无重复试验 158
二、偏差平方和分解 159
三、检验方法 160
9.3 元线性回归 162
一、一元线性回归 162
二、可转化为一元线性回归的问题 167
9.4 多元线性回归 169
一、多元线性回归模型 169
二、参数的最小二乘估计 170
三、多元线性回归方程的方差分析 170
四、多项式回归模型 171
课外拓展阅读 回归分析的创始人——高尔顿 171
习题9 172
第10章 统计软件SPSS简介
10.1 SPSS软件的启动、主窗口与退出 177
一、启动 177
二、退出 178
10.2 SPSS系统主菜单项介绍 179
10.3 建立数据文件 180
一、直接录入 180
二、间接录入 182
10.4 SPSS统计分析简介 183
一、SPSS软件在假设检验中的应用 184
二、SPSS软件在方差分析中的应用 191
三、SPSS软件在回归分析中的应用 199
10.5 SPSS在统计制图中的应用 205
课外拓展阅读 SPSS统计软件公司的发展历程 206
习题参考答案 208
参考文献 215
附录 216
第1章 随机事件和概率
在自然界、生产实践、科学实验和日常生活中发生的现象,按其结果能否准确预测来划分,可以分为两大类:一类是必然现象;另一类是随机现象. 在一定条件下必然发生的现象称为必然现象.例如,在标准大气压下,纯水加热到100℃必然沸腾;向上抛一石头必然会落下.所有这些现象的特点就是,在一定条件下必定出现某一结果,并且是可以事先预测的,即在准确地重复某些条件的情况下,它的结果总是可以肯定的. 另一类现象是在一定条件下,可能会出现多种不同的结果,但在观测之前无法预知其确切结果的现象,这一类现象称为随机现象.例如,抛一枚硬币,最终落在地上是一种必然现象,而落地后正面朝上还是反面朝上却是一种随机现象;某种电器使用寿命的长短是一种随机现象.这类现象的共同特点是:在相同条件下可重复进行试验,但每次试验不止出现一个结果,即试验结果呈现出不确定性. 事实上,在个别试验中,随机现象的结果虽然呈现出不确定性,但是经多次重复试验,却可发现它仍然呈现出某种规律性,这种规律性称为随机事件的统计规律性.
一、随机试验
满足下列三个条件的试验称为随机试验:
(1)试验在相同条件下可重复进行;
(2)每次试验的可能结果不止一个,但能事先明确试验的所有可能结果;
(3)每次试验前不能确定哪一个结果发生.随机试验是一种含义较广的术语,它包括对随机现象进行观察、测量、记录或做 科学实验等,以后简称试验,常用字母E1,E2,.表示.
例1.1.1 下面的四个实验都是随机试验.
E1:抛一枚硬币,观察正面H、反面T出现的情况.显然,结果是集合{H,T}的一 个元素;E2:将一枚硬币连续抛两次,观察试验的结果.这时,所有可能的结果为{HH,HT,TH,TT};E3:对某目标进行射击,观察直到目标击中为止的总射击次数;E4:测量一个工人生产的电灯泡的寿命,试验的结果是t小时.如果假定灯泡的寿命不超过5000小时,则t是区间[0,5000]中的某个数值.这四个实验均满足随机试验的三个条件,而实验“记录100年后地球上的人口数量”却不是随机试验,因为实验无法在相同的条件下重复进行.
二、样本空间
对于任一个随机试验,每次实验的所有可能结果都是事先知道的,而且结果不止一个.把随机试验的一切可能结果的集合称为样本空间.在概率论中常用大写的希腊字母Ω来表示.试验的每个结果称之为样本点或基本事件,通常用小写的希腊字母ω或ω1,ω2,.来表示.例1.1.1中4个随机试验的样本空间分别为 Ω1={H,T},其中H表示正面,T表示反面;Ω2={HH,HT,TH,TT};Ω3={0,1,2,.};Ω4={t|0≤t≤5000}.由上述可知,样本空间可以是有限点集,可以是可列点集(即它可以与自然数集 是一一对应的集合),也可以是某区间或平面上的一个区域.其中,随机试验E1的样本空间是一维的,E2的样本空间是二维的,它们的样本点为有限个.
1.1 随机事件
三、随机事件
在实际问题中,我们往往关心某种满足一定条件样本点的集合,这种满足一定条件样本的集合称为随机事件,简称事件.所以随机事件就是某些样本点的集合,也就是样本空间Ω的某些子集合.在试验时,如果出现了事件A中的样本点,我们就说事件A发生了或者说A出现了.例如,
(1)在E1中事件A表示“出现正面”,即A={H};
(2)在E4中事件B表示“电灯泡的寿命在3000至4000小时之间”,即B=[3000,4000].
Ω作为自身的子集合,在每次试验中总是发生的,称为必然事件;空集•不包含任何样本点,在每次试验中总是不发生,称为不可能事件.事件通常用大写的英文字母A,B,C,.来表示,其具体内容可写为A={.},其中大括号中或者是A所包含样本点的列举,如上面的A,或者是对A中样本点所具有的性质的描述,比如在例1.1.1的E3中,设C为射击次数不超过5次的事件,那么可写C={ω∈Ω:ω≤5}.事件B也属于这种情况,不过我们用一个闭区间[3000,4000]表示“3000≤ω≤4000”.
四、事件间的关系与运算
事件既然是Ω的子集合,它们之间的关系与运算就是集合间的关系与运算.下面设A,B,A1,A2,.均为事件.
(1)若A炒B,则称B包含事件A或A含于B.这表示事件A发生必导致B发生,若A炒B,且B炒A,即A=B,则称事件A与B相等.
(2)事件A∪B={ω∈Ω:ω∈A或ω∈B},称为事件A与B的并事件.也就是把两事件的样本点放在一起所组成的新事件.因此,A∪B发生当且仅当A,B中至少
n 有一个发生,类似地,称i ∪= 1 Ai={ω∈Ω:ω至少属于A1,A2,.,An中一个事件}为n个∞ 事件的并事件,称i∪= 1 Ai={ω∈Ω:ω至少属于A1,A2,.中一个事件}为可列个事件的并事件.
(3)事件A∩B={ω∈Ω:ω∈A并且ω∈B}称为事件A与B的交事件,简记为AB,也就是两事件中公共的样本点所组成的事件,因此AB发生当且仅当A与B同时发生.n类似地,称i ∩= 1 Ai={ω∈Ω:ω属于一切Ai,i=1,2,.,n}为n个事件的交事件,称i ∩=∞1 Ai={ω∈Ω:ω属于一切A1,A2,.}为可列个事件的交事件.
(4)事件A-B={ω∈Ω:ω∈A但ω臭B}称为事件A与B的差事件,事件A-B发生当且仅当A发生,而B不发生.
(5)若A∩B=•,则称事件A与B互不相容或互斥,即两事件不能同时发生.
(6)若A∪B=Ω,且A∩B=•,则称两事件互为逆事件,并记B=A•或A = B•.事件的关系与运算可用图1.1来表示.
图1.1 事件的运算满足下列定律:
(1)交换律:A∪B=B∪A, A∩B=B∩A;
(2)结合律:A∪(B∪C)=(A∪B)∪C,A∩(B∩C)=(A∩B)∩C;
(3)分配律:A∩(B∪C)=(A∩B)∪(A∩C),A∪(B∩C)=(A∪B)∩(A∪C);
(4)对偶律:A ∪ B = A•∩ B•, A ∩ B = A•∪ B•.
这些定律均可用严格的数学方法证明,即证明等式两边的事件相互包含.但是用图示的方法验证这些定理会显得更加直观.例如,图1.2中的A∪B即为方框中阴影部分,而如果你把A的外面涂上红色,把B的外面涂上蓝色,那么既有红色又有蓝色的部分恰是方框中的阴影部分.
根据事件的关系与运算规则可用一些简单的事件来表示较复杂的事件.
1.2 概率的定义
例1.1.2 某灯泡厂取样检查灯泡的寿命,设A表示“灯泡寿命大于1500h”,B表示“灯泡寿命为1000~2000h”,请用集合的形式写出下列事件:Ω,A,B,A∪B,AB,A-B,B-A.
解 Ω={x|x≥0}=[0,+∞), A={x|x>1500}=(1500,+∞),B={x|1000≤x≤2000}=[1000,2000], A∪B=[1000,+∞),AB=(1500,2000], A-B=(2000,+∞), B-A=[1000,1500].
例1.1.3 一个货箱中装有12只同类型的产品,其中3只是一等品,9只是二等品,从中随机地抽取两次,每次任取1只,Ai(i=1,2)表示第i次抽取的是一等品,试用字母及事件间的关系表示下列事件:
(1)两只都是一等品;
(2)两只都是二等品;
(3)一只是一等品,另一只是二等品;
(4)第二次抽取的是一等品.解由题意,用A•i表示第i次抽取的是二等品(i=1,2),
则
(1)两只都是一等品:A1∩A2;
(2)两只都是二等品:A•1 ∩ A•2;
(3)一只是一等品,另一只是二等品:A1A2∪A1A2;
(4)第二次抽取的是一等品:A•1A2∪A1A2=A2.例1.1.4 甲、乙、丙三人各向目标射击一发子弹,以A,B,C分别表示甲、乙、丙 命中目标,试用A,B,C的运算关系表示下列事件.
A0:“甲命中,乙和丙都没有命中” AB•C•;
A1:“至少有一人命中” A∪B∪C;
AB •A •
A2:“恰有一个命中目标” AB•C•∪•C ∪•BC ;
A BC ∪ A •
A3:“恰有两个命中目标” ABC•∪•BC ;
A4:“最多有一个命中目标” B•C•∪ A•C•∪ A•B•;
A5:“三人都命中目标” ABC;
A6:“三人均未命中目标” A•B•C•.
注 事件的表示不是唯一的,例如,利用对偶律或事件的差,例1.1.4中事件A0 也可表示为如下几种形式:A0=A(B ∪ C) , A0=A-B-C.
1.2 概率的定义
1.1节介绍了随机现象,通过大量试验可以观察到会有哪些结果出现.实际上,我们更希望能对这些结果出现的可能性作出定量的描述.事件发生可能性的定量描述的实质就是事件发生的概率.有些事件发生的概率直觉就可以确定,但是,对于一 般事件而言,单凭直觉来确定其发生的概率显然是行不通的.
一、概率的统计定义
人们经过长期的实践发现,虽然一个随机事件在某次试验或观察中可能发生也可能不发生,但在大量重复试验中,它发生的可能性的大小却能呈现出某种规律性. 我们感兴趣的正是对这种规律性的探讨.
1.频率的稳定性
若事件A在n次试验中发生了nA次,则称nA为事件A在这n次试验中发生的 频数,而比值fn(A)=nnA称为事件A在这n次试验中发生的频率.很早人们就注意到,在多次抛掷一枚质地均匀的硬币时,出现正面这一随机事件发生的频率会接近1/2.请看下面“抛掷硬币”试验的实例,见表1.1.表1.1
实验人 抛掷次数 出现正面次数 频率(出现正面次数/抛掷次数)
德摩根(DeMorgan)蒲丰(Buffon) 20484040 10612048 0.51810.5069
皮尔逊(Pearson) 24000 12012 0 .5005
表1.1说明:当试验的次数n增加时,正面向上的频率,即正面出现的次数k与 总的试验次数n之比kn 将随n的增大而逐渐逼近12 .
频率偏离这个常数很大的可能性虽然存在,但是试验的次数n越大,则频率偏离这个常数的可能性越小,也就是说,随机事件的每一次观察结果都是偶然的,但是多次观察某个随机现象可以知道,在大量的偶然事件中存在着必然的规律.
通过大量的试验可知,在重复试验的次数n充分大时,事件的频率总是在一个固定数值p附近摆动,我们将这种特性称为频率的稳定性.频率的稳定性是一个客观存在,它不断地为人们所证实.例如,多年医学研究表明,出生婴儿性别的数量比约为男∶女=1.06∶1;英语字母E,T,A出现的频率要明显高于其他字母.因此人们常用统计频率作为概率的近似值.
2.频率的性质
频率具有下列性质:
性质1.2.1 对于任一个事件A,有0≤fn(A)≤1.
证 设nA表示n次试验中A发生的次数,则有0≤nA≤n,从而0≤nnA ≤1, 即
0≤ fn (A )≤1 .