本书向企业高管和学生介绍了在机器学习中如何使用工具,不需要使用微积分、矩阵或向量代数就可以清楚、简洁地解释目前*流行的算法。本书的重点是业务应用程序,并提供了许多案例,比如评估一个国家进行国际投资的风险、预测房地产的价值,以及可以细致到将零售贷款分为可接受或不可接受模式。书中示例的数据、工作表和Python代码都在作者的网站上,本书同时还提供了一套完整的幻灯片,供教师使用,教师可自行下载使用。
作者简介
译者和审校者简介
译者序
前言
第1章 引言 / 1
1.1 关于本书及相关材料 / 4
1.2 机器学习分类 / 5
1.3 验证和测试 / 7
1.4 数据清洗 / 14
1.5 贝叶斯定理 / 17
第2章 无监督学习 / 23
2.1 特征缩放 / 24
2.2 k-均值算法 / 25
2.3 设置k值 / 28
2.4 维度灾难 / 31
2.5 国家风险 / 32
2.6 其他聚类方法 / 39
2.7 主成分分析 / 41
第3章 监督学习:线性回归 / 49
3.1 线性回归:单特征 / 50
3.2 线性回归:多特征 / 52
3.3 分类特征 / 54
3.4 正则化 / 55
3.5 岭回归 / 56
3.6 套索回归 / 61
3.7 弹性网络回归 / 64
3.8 房价数据模型结果 / 65
3.9 逻辑回归 / 71
3.10 逻辑回归的准确性 / 72
3.11 信贷决策中的运用 / 74
3.12 k-近邻算法 / 80
第4章 监督学习:决策树 / 84
4.1 决策树的本质 / 85
4.2 信息增益测度 / 86
4.3 信息决策应用 / 88
4.4 朴素贝叶斯分类器 / 94
4.5 连续目标变量 / 99
4.6 集成学习 / 102
第5章 监督学习:支持向量机 / 108
5.1 线性SVM分类 / 108
5.2 关于软间隔的修改 / 115
5.3 非线性分离 / 117
5.4 关于连续变量的预测 / 119
第6章 监督学习:神经网络 / 125
6.1 单层神经网络 / 125
6.2 多层神经网络 / 129
6.3 梯度下降算法 / 131
6.4 梯度下降算法的变形 / 136
6.5 迭代终止规则 / 138
6.6 应用于衍生产品 / 139
6.7 卷积神经网络 / 140
6.8 递归神经网络 / 142
附录6A 反向传播算法 / 146
第7章 强化学习 / 148
7.1 多臂老虎机问题 / 149
7.2 环境变化 / 156
7.3 Nim游戏博弈 / 158
7.4 时序差分学习 / 162
7.5 深度Q学习 / 164
7.6 应用 / 165
第8章 社会问题 / 170
8.1 数据隐私 / 171
8.2 偏见 / 172
8.3 道德伦理 / 174
8.4 透明度 / 176
8.5 对抗机器学习 / 177
8.6 法律问题 / 178
8.7 人类与机器 / 179
部分习题答案 / 182
术语表 / 198