多元统计分析是统计学中内容十分丰富、应用范围极为广泛的一个分支。在自然科学和社会科学的许多学科中,研究者都有可能需要分析处理有多个变量的数据的问题。能否从表面上看起来杂乱无章的数据中发现和提炼出规律性的结论,不仅需要对所研究的专业领域有很好的训练,而且要掌握必要的统计分析工具。对研究者来说,本书是学习掌握多元统计分析的各种模型和方法的一本有价值的参考书:首先,它做到了“浅入深出”,既可供初学者入门,又能使有较深基础的人受益;其次,它既侧重于应用,又兼顾必要的推理论证,使学习者既能学到“如何”做,又能在一定程度上了解“为什么”这样做;最后,它内涵丰富、全面,不仅基本包括各种在实际中常用的多元统计分析方法,而且对现代统计学的最新思想和进展有所介绍。值得一提的是,本书中有大量来自实际问题的数据实例,通过对这些实例的分析,读者可以学到如何将一个实际问题转化为恰当的统计问题,进而选择恰当的方法来进行分析。
简明目录
第1章 多元分析概述1/第2章 矩阵代数与随机向量49/补充2A 向量与矩阵:基本概念82/第3章 样本几何与随机抽样111/第4章 多元正态分布149/第5章 关于均值向量的推断210/补充5A 作为p维椭球投影的联合置信区间与置信椭圆258/第6章 多个多元均值向量的比较273/第7章 多元线性回归模型360/补充7A 多元多重回归模型的似然比的分布418/第8章 主成分430/补充8A 样本主成分近似的几何意义466/第9章 因子分析与对协方差矩阵结构的推断481/补充9A 最大似然估计的某些计算细节527/第10章 典型相关分析539/第11章 判别与分类575/第12章 聚类、距离方法与多维标度变换671/附录757/数据索引764/主题索引767
作者:[美]Johnson,R.A.(约翰逊),[美]Wichern,D.W.(威克恩)著
世纪之交,中国与世界的发展呈现最显著的两大趋势——以网络为代表的信息技术的突飞猛进,以及经济全球化的激烈挑战。无论是无远弗界的因特网,还是日益密切的政治、经济、文化等方面的国际合作,都标示着21世纪的中国是一个更加开放的中国,也面临着一个更加开放的世界。
教育,特别是管理教育总是扮演着学习与合作的先行者的角色。改革开放以来,尤其是20世纪90年代之后,为了探寻中国国情与国际上一切优秀的管理教育思想、方法和手段的完美结合,为了更好地培养高层次的“面向国际市场竞争、具备国际经营头脑”的管理者,我国的教育机构与美国、欧洲、澳洲以及亚洲一些国家和地区的大量的著名管理学院和顶尖跨国企业建立了长期密切的合作关系。以清华大学经济管理学院为例,2000年,学院顾问委员会成立,并于10月举行了第一次会议,2001年4月又举行了第二次会议。这个顾问委员会包括了世界上最大的一些跨国公司和中国几家顶尖企业的最高领导人,其阵容之大、层次之高,超过了世界上任何一所商学院。在这样高层次、多样化、重实效的管理教育国际合作中,教师和学生与国外的交流机会大幅度增加,越来越深刻地融入到全球性的教育、文化和思想观念的时代变革中,我们的管理教育工作者和经济管理学习者,更加真切地体验到这个世界正发生着深刻的变化,也更主动地探寻和把握着世界经济发展和跨国企业运作的脉搏。
我国管理教育的发展,闭关锁国、闭门造车是绝对不行的,必须同国际接轨,按照国际一流的水准来要求自己。正如朱 基同志在清华大学经济管理学院成立十周年时所发的贺信中指出的那样:“建设有中国特色的社会主义,需要一大批掌握市场经济的一般规律,熟悉其运行规则,而又了解中国企业实情的经济管理人才。清华大学经济管理学院就要敢于借鉴、引进世界上一切优秀的经济管理学院的教学内容、方法和手段,结合中国的国情,办成世界第一流的经管学院。”作为达到世界一流的一个重要基础,朱 基同志多次建议清华的MBA教育要加强英语教学。我体会,这不仅因为英语是当今世界交往中重要的语言工具,是连接中国与世界的重要桥梁和媒介,而且更是中国经济管理人才参与国际竞争,加强国际合作,实现中国企业的国际战略的基石。推动和实行英文教学并不是目的,真正的目的在于培养学生——这些未来的企业家——能够具备同国际竞争对手、合作伙伴沟通和对抗的能力。按照这一要求,清华大学经济管理学院正在不断推动英语教学的步伐,使得英语不仅是一门需要学习的核心课程,而且渗透到各门专业课程的学习当中。
课堂讲授之外,课前课后的大量英文原版著作、案例的阅读对于提高学生的英文水平也是非常关键的。这不仅是积累相当的专业词汇的重要手段,而且是对学习者思维方式的有效训练。
我们知道,就阅读而言,学习和借鉴国外先进的管理经验和掌握经济理论动态,或是阅读翻译作品,或是阅读原著。前者属于间接阅读,后者属于直接阅读。直接阅读取决于读者的外文阅读能力,有较高外语水平的读者当然喜欢直接阅读原著,这样不仅可以避免因译者的疏忽或水平所限而造成的纰漏,同时也可以尽享原作者思想的真实表达。而对于那些有一定外语基础,但又不能完全独立阅读国外原著的读者来说,外文的阅读能力是需要加强培养和训练的,尤其是专业外语的阅读能力更是如此。如果一个人永远不接触专业外版图书,他在获得国外学术信息方面就永远会比别人差半年甚至一年的时间,他就会在无形中减弱自己的竞争能力。因此,我们认为,有一定外语基础的读者,都应该尝试一下阅读外文原版,只要努力并坚持,就一定能过了这道关,到那时就能体验到直接阅读的妙处了。
在掌握大量术语的同时,我们更看重读者在阅读英文原版著作时对于西方管理者或研究者的思维方式的学习和体会。我认为,原汁原味的世界级大师富有特色的表达方式背后,反映了思维习惯,反映了思想精髓,反映了文化特征,也反映了战略偏好。知己知彼,对于跨文化的管理思想、方法的学习,一定要熟悉这些思想、方法所孕育、成长的文化土壤,这样,有朝一日才能真正“具备国际战略头脑”。
以往,普通读者购买和阅读英文原版还有一个书价的障碍。一本外版书少则几十美元,多则上百美元,一般读者只能望书兴叹。随着全球经济合作步伐的加快,目前在出版行业有了一种新的合作出版的方式,即外文影印版,其价格几乎与国内同类图书持平。这样一来,读者可以不必再为书价发愁。清华大学出版社这些年在这方面一直以独特的优势领先于同行。早在1997年,清华大学出版社敢为人先,在国内最早推出一批优秀商学英文版教材,规模宏大,在企业界和管理教育界引起不小的轰动,更使国内莘莘学子受益良多。
为了配合清华大学经济管理学院推动英文授课的急需,也为了向全国更多的MBA试点院校和更多的经济管理学院的教师和学生提供学习上的支持,清华大学出版社再次隆重推出与世界著名出版集团合作的英文原版影印商学教科书,也使广大工商界人士、经济管理类学生享用到最新最好质优价廉的国际教材。
祝愿我国的管理教育事业在社会各界的大力支持和关心下不断发展、日进日新;祝愿我国的经济建设在不断涌现的大批高层次的面向国际市场竞争、具备国际经营头脑的管理者的勉力经营下早日中兴。
赵纯均教授
清华大学经济管理学院
第1章 多元分析概述1
1.1引言1
1.2多元方法的应用3
1.3数据的组织5
1.4数据的展示及图表示19
1.5距离30
1.6 最后的评述37
第2章 矩阵代数与随机向量49
2.1引言49
2.2矩阵和向量代数基础49
2.3正定矩阵60
2.4平方根矩阵65
2.5随机向量和矩阵66
2.6均值向量和协方差矩阵68
2.7矩阵不等式和极大化78
补充2A 向量与矩阵:基本概念82
第3章 样本几何与随机抽样111
3.1引言111
3.2样本几何111
3.3随机样本以及样本均值和协方差矩阵的期望值119
3.4广义方差123
3.5作为矩阵运算的样本均值、协方差与相关系数137
3.6变量的线性组合的样本值140
第4章 多元正态分布149
4.1引言149
4.2多元正态密度及其性质149
4.3从多元正态分布抽样与极大似然估计168
4.4X和S的抽样分布173
4.5 X和S的大样本特性175
4.6评估正态性假设177
4.7搜寻离群值与“清洁”数据187
4.8变换到接近正态性192
第5章 关于均值向量的推断210
5.1引言210
5.2 μ0作为正态总体均值的似真性210
5.3霍特林T2与似然比检验216
5.4置信域和均值分量的联合比较220
5.5总体均值向量的大样本推断234
5.6多元质量控制图239
5.7观测值缺损时均值向量的推断251
5.8多元观测中由时间相依性造成的困难256
补充5A 作为p维椭球投影的联合置信区间与置信椭圆258
第6章 多个多元均值向量的比较273
6.1引言273
6.2成对比较与重复测量设计273
6.3两总体均值向量的比较284
6.4多个多元总体均值向量的比较(单因子MANOVA)296
6.5处理效应的联合置信区间308
6.6协方差矩阵相等性的检验310
6.7双因子多元方差分析312
6.8轮廓分析323
6.9重复测量设计和生长曲线328
6.10 对分析多元模型的透视和建议332
第7章 多元线性回归模型360
7.1引言360
7.2经典线性回归模型360
7.3最小二乘估计364
7.4回归模型的推断370
7.5由估计的回归函数作推断378
7.6模型检查及回归中的其他问题381
7.7多元多重回归387
7.8线性回归的概念401
7.9比较回归模型的两种表述方式410
7.10 有时间相关误差的多重回归模型413
补充7A 多元多重回归模型的似然比的分布418
第8章 主成分430
8.1引言430
8.2总体主成分430
8.3综合主成分的样本变差441
8.4主成分的图形表示454
8.5大样本推断456
8.6用主成分监控质量459
补充8A 样本主成分近似的几何意义466
第9章 因子分析与对协方差矩阵结构的推断481
9.1引言481
9.2正交因子模型482
9.3估计方法488
9.4因子旋转504
9.5因子得分513
9.6因子分析展望和建议519
补充9A 最大似然估计的某些计算细节527
第10章 典型相关分析539
10.1 引言539
10.2 典型变量和典型相关系数539
10.3 总体典型变量的解释545
10.4 样本典型变量和样本典型相关系数550
10.5 其他样本描述性度量558
10.6 大样本推断563
第11章 判别与分类575
11.1 引言575
11.2 两个总体的分离与分类576
11.3 两个多元正态总体的分类584
11.4 评估分类函数596
11.5 多个总体的分类606
11.6 对多个总体进行判别的费希尔方法621
11.7 Logistic回归与分类634
11.8 最后的评述644
第12章 聚类、距离方法与多维标度变换671
12.1 引言671
12.2 相似性量度673
12.3 分层聚类方法680
12.4 非分层聚类方法696
12.5 基于统计模型的聚类703
12.6 多维标度变换706
12.7 对应分析716
12.8 用于观察抽样单元和变量的双重信息图726
12.9 普罗克鲁斯特斯分析:一种比较点结构的方法732
附录757
数据索引764
主题索引767