本书通过正在学习机器学习的程序员绫乃和她朋友美绪的对话,结合回归和分类的具体问题,逐步讲解了机器学习中实用的数学基础知识。其中,重点讲解了容易成为学习绊脚石的数学公式和符号。同时,还通过实际的Python 编程讲解了数学公式的应用,进而加深读者对相关数学知识的理解。
一本书掌握机器学习的基础数学。
1.步步引导,对话形式好理解
结合回归和分类的具体问题,逐步讲解机器学习中实用的基础数学知识
2.层层拆解,复杂公式看得懂
把数学表达式拆开看,一部分一部分地去理解就好懂了
3.用Python实现分类和回归算法
通过实际的Python编程讲解数学公式的应用,加深读者对数学知识的理解。书中的Python代码均可下载。
立石贤吾(作者)
SmartNews公司的机器学习工程师。从日本佐贺大学毕业后曾就职于数家开发公司,并于2014年入职LINE Fukuoka,在该公司于日本福冈市成立的数据分析和机器学习团队中,负责利用机器学习开发推荐系统、文本分类等产品,并担任团队负责人。2019年入职SmartNews公司,担任现职。
郑明智(译者)
智慧医疗工程师。主要研究方向为医疗与前沿ICT技术的结合及其应用,密切关注人工智能、5G、量子计算等领域。译有《松本行弘:编程语言的设计与实现》《深度学习基础与实践》《详解深度学习:基于TensorFlow和Keras学习RNN》。
第 1章 开始二人之旅 1
1.1 对机器学习的兴趣 2
1.2 机器学习的重要性 4
1.3 机器学习的算法 7
1.4 数学与编程 12
第 2章 学习回归——基于广告费预测点击量 15
2.1 设置问题 16
2.2 定义模型 19
2.3 最小二乘法 22
2.4 多项式回归 41
2.5 多重回归 45
2.6 随机梯度下降法 52
第3章 学习分类——基于图像大小进行分类 59
3.1 设置问题 60
3.2 内积 64
3.3 感知机 69
3.3.1 训练数据的准备 71
3.3.2 权重向量的更新表达式 74
3.4 线性可分 80
3.5 逻辑回归 82
3.5.1 sigmoid函数 83
3.5.2 决策边界 86
3.6 似然函数 91
3.7 对数似然函数 96
3.8 线性不可分 104
第4章 评估——评估已建立的模型 109
4.1 模型评估 110
4.2 交叉验证 112
4.2.1 回归问题的验证 112
4.2.2 分类问题的验证 117
4.2.3 精确率和召回率 121
4.2.4 F值 125
4.3 正则化 130
4.3.1 过拟合 130
4.3.2 正则化的方法 131
4.3.3 正则化的效果 132
4.3.4 分类的正则化 139
4.3.5 包含正则化项的表达式的微分 140
4.4 学习曲线 144
4.4.1 欠拟合 144
4.4.2 区分过拟合与欠拟合 146
第5章 实现——使用Python编程 153
5.1 使用Python实现 154
5.2 回归 155
5.2.1 确认训练数据 155
5.2.2 作为一次函数实现 158
5.2.3 验证 164
5.2.4 多项式回归的实现 168
5.2.5 随机梯度下降法的实现 176
5.3 分类——感知机 179
5.3.1 确认训练数据 179
5.3.2 感知机的实现 182
5.3.3 验证 185
5.4 分类——逻辑回归 188
5.4.1 确认训练数据 188
5.4.2 逻辑回归的实现 189
5.4.3 验证 194
5.4.4 线性不可分分类的实现 197
5.4.5 随机梯度下降法的实现 204
5.5 正则化 206
5.5.1 确认训练数据 206
5.5.2 不应用正则化的实现 210
5.5.3 应用了正则化的实现 212
5.6 后话 215
附录
A.1 求和符号、求积符号 218
A.2 微分 220
A.3 偏微分 224
A.4 复合函数 227
A.5 向量和矩阵 229
A.6 几何向量 233
A.7 指数与对数 237
A.8 Python环境搭建 241
A.9 Python基础知识 244
A.10 NumPy基础知识 254