本书对高维统计学进行了详尽介绍,重点介绍核心方法论和理论——包括尾部界、集中不等式、一致律和经验过程以及随机矩阵。此外还深入探索了特定的模型类,包括稀疏线性模型、用秩约束矩阵模型、图模型和各种类型的非参数模型。
本书赞誉
“非渐近、高维统计理论对现代统计和机器学习至关重要.本书很独特,用非常清晰、完善且统一的方式介绍了这一领域.作者将概率论及其在统计中的应用组合到了一起,涵盖从测度集中度到图模型的内容.对研究生和科研工作者来说这是非常完美的.本书在接下来很多年里一定会成为这个领域的标准参考书.”
——Larry Wasserman,卡耐基梅隆大学
“Martin将他大量强大的分析方法用在了当前的问题——对大数据模型的分析中.这个新领域的海量知识结合他强大的分析技巧,使得本书成为令人印象深刻并为之倾倒的杰作,这势必会成为所有敢于尝试这一领域的科研工作者的重要参考书.”
——Trevor Hastie,斯坦福大学
“本书很好地介绍了高维理论统计中一个可能发展最快的领域——研究基于样本大小和数据维度给出估计概率界的非渐近理论.本书给出了这个领域至今最全面、清晰、专业的介绍,势必将成为该领域最权威的参考文献和教材.”
——Genevera Allen,莱斯大学
“伴随着对高维数据分析的大量研究,过去二十年里统计理论和应用经历了一场复兴.没有人比Martin对高维统计有更加深刻的理解.本书将他的研究成果以书的形式展现出来.随着高维统计这个领域持续产生突破性的研究成果,本书对于刚入门的学生和经验丰富的学者都将是非常棒的参考资料.”
——John Lafferty,耶鲁大学
“这本有关高维统计的杰出图书由这个领域富有创造力的知名学者所著,全面介绍了统计机器学习中的很多重要内容,而且从基础内容到很多前沿领域的最新成果都是自封闭的.对于想要学习和研究现代统计机器学习理论、方法和算法的人来说,这是一本必须要读的书.”
——范剑青,普林斯顿大学
“本书对高维统计中的数学技巧和方法给出了深入、直观的理解.书中非常详细地介绍了概率论中的主要技术工具,并且用清晰明了的方式展示了高维统计问题中统计方法和算法的构造及分析.这是一本杰出的、发人深省的大师级著作!”
——Peter Bühlmann,苏黎世联邦理工学院
“Martin的这本新书包含了高维统计推断中的前沿内容,主要关注稀疏和非参数估计相关的精确非渐近结果.无论是从它所包含的最前沿结果的广度还是从它所展现的结果的深度来说,这都是所有数理统计和理论机器学习的研究生的必读图书.书中的阐述极其清晰,从关于必要的概率工具的简介性章节开始,涵盖了高维统计中最前沿的进展,并且非常巧妙地做到了重要性和数学深度之间的完美结合.”
——Francis Bach,法国国家信息与自动化研究所
“Wainwright的这本书主要介绍了概率理论和数理统计中对于理解高维统计所遇新现象至关重要的部分,讲述得非常清晰、深刻.每章都用直观的例子或者模拟来开篇,并将它们系统地延伸成强大的数学工具或者推断中基本问题的完整答案.不管是用来系统阅读还是作为一本参考书,这本书都不容易,但却相当精致,值得一读.”
——Peter Bickel,加州大学伯克利分校
本书赞誉
译者序
致谢
第1章 简介1
1.1 经典理论和高维理论1
1.2 高维会产生什么问题2
1.2.1 线性判别分析2
1.2.2 协方差估计4
1.2.3 非参数回归6
1.3 高维中什么能帮助我们8
1.3.1 向量的稀疏性8
1.3.2 协方差矩阵中的结构10
1.3.3 回归形式的结构11
1.4 什么是非渐近的观点12
1.5 全书概述13
1.5.1 各章内容13
1.5.2 阅读背景要求14
1.5.3 教学建议和流程图15
1.6 参考文献和背景16
第2章 基本尾部概率界和集中不等式18
2.1 经典的界18
2.1.1 从马尔可夫不等式到Chernoff界18
2.1.2 次高斯随机变量和Hoeffding界19
2.1.3 次指数随机变量和Bernstein界22
2.1.4 一些单边结果26
2.2 基于鞅的方法28
2.2.1 背景28
2.2.2 鞅差序列的集中度界30
2.3 高斯随机变量的Lipschitz函数35
2.4 附录A:次高斯随机变量的等价性39
2.5 附录B:次指数随机变量的等价性42
2.6 参考文献和背景43
2.7 习题44
第3章 测度集中度51
3.1 基于熵技巧的集中度51
3.1.1 熵及其相关性质51
3.1.2 Herbst方法及其延伸52
3.1.3 可分凸函数和熵方法54
3.1.4 张量化和可分凸函数56
3.2 集中度的几何观点58
3.2.1 集中度函数59
3.2.2 与Lipschitz函数的联系60
3.2.3 从几何到集中度63
3.3 Wasserstein距离和信息不等式66
3.3.1 Wasserstein距离66
3.3.2 传输成本和集中不等式67
3.3.3 传输成本的张量化70
3.3.4 马尔可夫链的传输成本不等式71
3.3.5 非对称耦合成本72
3.4 经验过程的尾部概率界75
3.4.1 一个泛函Hoeffding不等式75
3.4.2 一个泛函Bernstein不等式77
3.5 参考文献和背景79
3.6 习题80
第4章 一致大数定律85
4.1 动机85
4.1.1 累积分布函数的一致收敛85
4.1.2 更一般函数类的一致定律87
4.2 基于Rademacher复杂度的一致定律90
4.3 Rademacher复杂度的上界94
4.3.1 多项式识别的函数类94
4.3.2 Vapnik-Chervonenkis维数96
4.3.3 VC维数的控制99
4.4 参考文献和背景100
4.5 习题101
第5章 度量熵及其用途104
5.1 覆盖和填装104
5.2 高斯复杂度和Rademacher复杂度113
5.3 度量熵和次高斯过程115
5.3.1 一步离散化的上确界116
5.3.2 离散化界的例子117
5.3.3 链方法和Dudley熵积分119
5.4 一些高斯比较不等式123
5.4.1 一般的比较不等式结果123
5.4.2 Slepian和Sudakov-Fernique不等式125
5.4.3 高斯收缩不等式126
5.5 Sudakov下界127
5.6 链方法和Orlicz过程128
5.7 参考文献和背景131
5.8 习题132
第6章 随机矩阵和协方差估计136
6.1 预备知识136
6.1.1 符号和基本结果136
6.1.2 协方差矩阵估计问题137
6.2 Wishart矩阵及其性质138
6.3 次高斯总体的协方差矩阵141
6.4 一般矩阵的界144
6.4.1 矩阵分析背景知识144
6.4.2 矩阵的尾部条件145
6.4.3 矩阵Chernoff方法和独立分解147
6.4.4 随机矩阵的上尾部概率界149
6.4.5 协方差矩阵的结果153
6.5 带结构的协方差矩阵的界154
6.5.1 未知稀疏与截断155
6.5.2 渐近稀疏157
6.6 附录:定理6.1的证明159
6.7 参考文献和背景161
6.8 习题162
第7章 高维情形下的稀疏线性模型167
7.1 问题及应用167
7.1.1 不同的稀疏模型167
7.1.2 稀疏线性模型的应用168
7.2 无噪情形下的还原171
7.2.1 1松弛172
7.2.2 精确还原和限制零空间172
7.2.3 限制零空间的充分条件174
7.3 有噪情形下的估计178
7.3.1 受限特征值条件178
7.3.2 严格稀疏模型下的2误差界180
7.3.3 随机设计矩阵的受限零空间和特征值183
7.4 预测误差的界186
7.5 变量或子集选择188
7.5.1 Lasso的变量选择相合性188
7.5.2 定理7.21的证明191
7.6 附录:定理7.16的证明193
7.7 参考文献和背景195
7.8 习题197
第8章 高维下的主成分分析204
8.1 主成分和降维204
8.1.1 PCA的解释和应用205
8.1.2 特征值和特征空间的扰动208
8.2 一般特征向量的界209
8.2.1 一个一