关于我们
![]() ![]() |
深度学习方法解析与实战应用
本书以深入浅出的方式,讲解何为“人工智能”,如何掌握以深度学习为代表的人工智能相关方法,以及如何进行落地应用。本书从理论、工具基础讲解开始,层层递进,分别向读者清晰地展现了卷积神经网络、生成式对抗网络、循环神经网络、深度强化学习的知识脉络与方法原理。同时,按照具体应用场景,结合主流深度学习框架,给出所讲述理论的落地应用案例和编程开发指导,旨在结合理论与实践,平衡知识的深度与广度,明确入门与进阶路径,使读者更加深入全面地理解深度学习的原理及实践方法。
本书主要面向人工智能技术初学者、程序开发者、前沿科技爱好者,尤其是在校大学生和相关领域研究人员。
近年来,由于智能芯片等硬件技术的不断发展,以神经网络为核心的人工智能技术成为学界、产业界甚至商界的关注焦点,人工智能中的深度学习技术在诸如计算机视觉、自然语言处理、语音识别、深度强化学习等多个基础领域全面突破,在机器翻译、智能游戏、医疗辅助诊断、无人驾驶、智慧安防等多个应用领域大量落地实践。同时,面对国家重大战略发展和国际前沿发展需求,一些高校成立了人工智能学院及人工智能专业。因此,以人工智能为代表的新一代信息技术(可以概括为“ABCDEFG”,即人工智能AI(Artificial Intelligence)、区块链BC(Block Chain)、云计算CC(Cloud Computing)、大数据BD(Big Data)、边缘计算EC(Edge Computing)、联邦学习FL(Federated Learning)、5G通信等)已成为理论研究的焦点、应用实践的重点、社会发展的增长点。那么,面对“人工智能”这个既熟悉又陌生的词汇,如何了解其理论、掌握其方法,并以“人工智能”方式为我们的工作生活进行“赋能”呢?本书的写作目的是深入浅出地讲解何为“人工智能”,如何掌握以深度学习为代表的人工智能方法,以及如何利用人工智能更好地服务人类。
本书特色
1. 广度与深度的平衡
人工智能是涉及计算机科学、数学、信息论、控制论、系统工程、脑科学、神经科学、心理学、语言学、逻辑学、认知学、行为学等多领域的综合性交叉学科,在人类社会的方方面面具有广泛应用。因此,本书在理论的广度上,讲解了人工智能的基本概念、基本理论、基础工具;在实践的广度上,分析了人工智能在游戏、智慧社区、智慧安防、智慧医疗等领域的应用及设计构想。同时,本书在理论的深度上,以深度神经网络为主线,讲解了以卷积神经网络、生成式对抗网络、循环神经网络、深度强化学习为代表的重要方法;在实践的深度上,以人体姿态估计、经典控制类游戏、边缘智能、图像翻译等实践案例为核心支撑。可以说,本书实现了知识在广度与深度上的平衡。
2. 理论与实践的结合
人工智能是理论与实践结合的产物。没有早期神经科学对大脑神经认知原理的探索,神经元模型、卷积神经网络、循环神经网络等数学模型就是“无源之水,无本之木”。没有早期以Hinton、LeCun、Bengio等人为代表的人工智能科学家对深度神经网络理论研究的坚守,就不会有2012年ImageNet大赛深度学习的巨大成功,更不会有AlphaGo的一骑绝尘!本书按照人工智能的发展脉络,将深度学习的理论学习与实践应用结合,并赋予相应的应用场景,尤其是将卷积神经网络与人体姿态估计、目标检测、人脸检测结合,循环神经网络与语音识别结合,生成式对抗网络与图像翻译、图像生成结合,强化学习与AI游戏结合,进而让理论指导实践,并让实践赋予理论更有温度、更直接的“生命力”。
3. 入门与进阶的梯次
理论讲解“接地气”、案例实践“有温度”是本书的重要特色,也是针对入门读者重点考虑与设计的。在入门学习方面,本书从基础理论梳理到基础工具讲解,以点带面,尽量避免过多的公式推导、理论罗列,以帮助初学者完成知识体系的构建,同时配合生活等常用场景的案例分析,以期降低读者入门的门槛和心理上的“疏远感”;在进阶提高方面,本书以有研究基础的读者为主要对象,从相关理论的起源、发展脉络、关键技术、改进优化、发展前沿等角度,深入剖析技术的原理,为读者的进阶提高之路厘清思路。
4. 开源与创新的支撑
开源是人工智能领域“百花齐放”的真实写照,也是人工智能生态发展的重要推动力。因此,本书所涉及的程序均已在Github上开源,以期为人工智能技术的开源与知识共享贡献一份力量。此外,创新是科技进步的源泉,也是技术发展的不竭动力。本书的部分理论思考及实践案例是团队多年参加竞赛、学术交流的创新成果和发明专利等的积累,也是本书在内涵上的重要特色。
本书组织结构
本书按照基础入门、方法解析、实战应用的结构,共分三篇13章。
第一篇为基础入门篇,包括第0~3章,以人工智能概述为总领,讲解人工智能的理论基础、工具基础、神经网络基础,以期夯实初学者的学习基础,为其打开人工智能之门。其中,第0章主要讲解人工智能的定义、历史脉络、适用领域、发展前景及存在的问题。第1章涉及深度学习的数学基础、算法基础、机器学习基础、大数据基础,提纲挈领地讲解了线性代数与矩阵论、概率论与统计学、博弈论、最优化理论等数学知识,梳理了数据结构与算法的基本知识点,分析了机器学习中监督学习、无监督学习、强化学习、联邦学习等关键研究领域,而后介绍了数据挖掘、Hadoop开源生态框架体系。第2章重在全面总结深度学习所需工具,包括编程理论、编程语言、开源框架、硬件及操作系统相关知识等。第3章按照神经网络技术演进路线,对神经元模型、感知机模型、多隐层前馈神经网络、深度学习技术的发展脉络进行讲解,并着重对优化方法、优化策略进行分析。
总体来讲,掌握基础理论、基础工具是入门深度神经网络的第一步,因此,第一篇的定位为既是基础入门的“知识图谱”,更是进阶提升的“第一踏板”。有相关理论储备和研究基础的读者可以跳过该部分内容,直接进入后续章节学习。
第二篇为方法解析篇,包括第4~7章,主要对深度神经网络的关键方法进行讲解,从卷积神经网络、生成式对抗网络、循环神经网络、深度强化学习的起源、发展、关键原理、重要改进等角度对相关方法进行剖析,既是对基础入门篇内容的整合与升华,也是对深度学习核心精髓的解析,更是实战应用的理论指导。其中,第4章以卷积神经网络的原理、方法、改进、应用为主线,解析卷积神经网络背后的方法论。第5章主要讲解生成式对抗网络的原理、方法、改进方向等内容。第6章在讲解循环神经网络的原理、方法、改进等重点知识的同时,对自然语言处理的相关技术也进行了讨论。第7章主要讲解深度强化学习所涉及的关键理论、重要方法模型,并着重对深度Q网络进行分析。
本篇中,第4章、第6章分别从空间维度、时间维度对以卷积神经网络、循环神经网络为代表的深度学习方法进行讲解,第5章、第7章涉及博弈、决策的重要理论。因此,通过对深度学习关键方法的解析,读者可以轻松构建起深度学习知识体系的“四梁八柱”,对下衔接坚实的理论基础,对上撑得起前沿应用。
第三篇为实战应用篇,包括第8~12章,针对人体姿态估计、智能游戏、人群数量计算、垃圾分类、图像翻译等场景,将基于卷积神经网络的2D人体姿态估计、基于强化学习的游戏控制、面向边缘智能的人群数量计算、边缘计算场景下的垃圾识别分类、基于生成式对抗网络的图像生成与翻译进行程序实现,与基础入门、方法解析相呼应,构成符合学习规律的全周期闭合回路。其中,第8章以计算机视觉前沿应用中的2D人体姿态估计为例,讲解姿态估计的研究现状、基础理论、应用场景、主要代表算法和具体实现过程。第9章以开源项目OpenAI Gym中的CartPolev0游戏为例,从强化学习在游戏领域的应用现状出发,通过编程开发对深度Q网络智能体、基于策略梯度的神经网络游戏应用进行实践。第10章以边缘智能场景下的城市安防为例,以人群数量计算为应用,对目标检测模型YOLO V3算法、人脸识别CenterFace算法进行实现。第11章以智能垃圾分类为背景,对预训练中文语音识别模型和图像分类模型进行编程实现。第12章将两种生成式对抗网络应用于图像翻译和图像生成,对图像“魔术”进行编程实现。
本篇是从综合案例实践角度对全书知识点的总结与提升,以期让人工智能技术不只是“上层建筑”,更是实实在在有温度、接地气的落地应用。
预期读者
1. 人工智能技术初学者
人工智能技术体系庞大、知识点极多,可选资源又很丰富,所以,初学者经常无从下手。希望通过学习本书,初学者可以厘清知识脉络,找到适合自己的技术学习和发展路线。
2. 人工智能程序开发者
技术的生命在于应用转化,尤其在计算机科学领域,没有落地应用,技术很难有长远持续的发展。因此,希望本书的实战案例讲解可以辅助具有一定开发基础的程序员、工程师获得思路上的启发和实际应用场景的共鸣,为其所写代码赋予“有场景”的生命力,促进其对实际问题场景创造性地程序化描述,进而推动社会信息化、自动化、智能化的发展。
3. 人工智能爱好者
开源是人工智能发展的必经之路,希望本书能为AI爱好者提供共享技术、共享理念的交流平台,对开源社区建设、人工智能知识普及起到一定的推动作用。
学习建议
希望通过本书的学习,读者可以从方法的角度对人工智能的本质进行思考,尤其要重点理解两句话:
(1) 人工智能的终极目标是让机器可以像人一样具有学习的本领,可以像人一样思考,进而促进人类的发展。
(2) 人工智能的本质是学习,而“学习”的关键是联合,即“架构联合、数据联合、模型联合、资源联合”。
第一句话易于理解,在此不做赘述。关于第二句话的理解,可以将这一观点放在新一代信息技术发展的大背景下,从算法、算力、数据等对AI发展的推动作用角度去思考,即可获得其中“真意”。具体讲,架构联合是基于“云-边-端”进行统一的架构设计,即将云计算、边缘计算、智能终端进行通盘考虑,进而为人工智能的发展提供架构体系支撑;数据联合是对多源跨域异构数据进行深度安全融合,进而打破“数据孤岛”,为人工智能发展提供充足的数据支撑;模型联合是面向“云-边-端”一体化架构在分布式、集中式、混合式人工智能实现模式下的具体化呈现,是实现高性能人工智能推理、训练的重要方式;资源联合是整合“云-边-端”所涉及的网络通信、计算、存储等资源的重要途径,是促进人工智能落地应用的重要保障。
此外,本书各章节从知识前沿、领域关注、理论深度等角度分别设计了相应的习题,可以帮助读者巩固相关基础知识、启发研究思路。同时,在参考资源部分,整理了大量开源代码、教学视频等学习资料,以期帮助读者提高动手实践能力。
最后,“纸上得来终觉浅,绝知此事要躬行”,想要深入理解深度学习,还需读者自己动手去尝试一些实验,真正形成学习的“闭合回路”。
综上所述,本书内容的组织结构如下图所示:
致谢
感谢本书的合作者,感谢团队的成员们,感谢我们的家人,希望我们可以一起做更多有意义的事,并且做得更好。
感谢编辑的辛劳,感谢你们在选题、校对、排版等环节的付出与辛勤工作。
感谢为本书提出宝贵建议、促进本书质量提高的所有朋友及同行。
感谢奋战在抗击新冠病毒一线的各类人员,以及为抗击新冠病毒做出贡献的所有人。希望人工智能技术可以推动社会发展,增加社会的“抵抗力”“免疫力”;同时,也希望社会为人工智能技术的发展提供更广阔的舞台,让人工智能技术承担更多的社会责任,并将有温度、有场景的成果反馈于我们的生活。
勘误与交流
由于作者水平有限,编著时间仓促,书中纰漏在所难免,恳请读者多提宝贵意见,批评指正,以促提高。
相关问题可以发团队邮箱:15891741749@139.com。本书代码开源地址为:https: //github.com/book4aidl。
再次感谢您的反馈与交流。
第一篇 基础入门篇
第0章 人工智能概述 3
0.1 人工智能的定义与学派 3
0.1.1 人工智能定义 3
0.1.2 人工智能学派 5
0.2 人工智能简史 6
0.2.1 早期的人工智能 7
0.2.2 人工智能的波浪式前进 8
0.3 人工智能的关键支撑技术 10
0.3.1 算法——深度神经网络 11
0.3.2 数据——多源异构大数据 11
0.3.3 算力——高性能计算芯片 12
0.4 人工智能的应用与面临的挑战 13
0.4.1 人工智能应用领域 13
0.4.2 人工智能前沿 16
0.4.3 发展趋势与面临的挑战 19
0.5 国家战略与政策下的人工智能 21
0.5.1 国内政策及战略规划 21
0.5.2 国外战略与政策 23
0.6 习题 23
参考资源 24
第1章 理论基础 25
1.1 数学基础 25
1.1.1 线性代数与矩阵论 25
1.1.2 概率论与统计学 27
1.1.3 博弈论 28
1.1.4 最优化理论 28
1.2 算法基础 29
1.2.1 算法概论 30
1.2.2 数据结构 30
1.3 机器学习基础 31
1.3.1 机器学习概述 31
1.3.2 监督学习 35
1.3.3 无监督学习 35
1.3.4 强化学习 36
1.3.5 联邦学习 37
1.4 大数据基础 38
1.4.1 数据挖掘 38
1.4.2 Hadoop开源生态框架体系 39
1.5 温故知新 40
1.6 习题 41
参考资源 43
第2章 工具基础 44
2.1 编程基础 44
2.1.1 编程理论 44
2.1.2 Python基础 46
2.2 开源框架基础 53
2.2.1 Pytorch 54
2.2.2 TensorFlow框架 55
2.2.3 PaddlePaddle框架 56
2.2.4 其他框架 57
2.3 硬件基础 59
2.3.1 CPU基础 60
2.3.2 GPU基础 62
2.3.3 树莓派 62
2.4 操作系统基础 63
2.4.1 Linux简介 63
2.4.2 国产Linux操作系统 65
2.5 温故知新 66
2.6 习题 67
参考资源 68
第3章 神经网络基础 69
3.1 神经网络概述 69
3.2 神经元模型与感知机模型 70
3.2.1 MP神经元 70
3.2.2 感知机 72
3.3 多隐层前馈神经网络 73
3.3.1 网络结构 73
3.3.2 激活函数 75
3.3.3 网络训练 77
3.4 神经网络的优化方法 80
3.4.1 梯度下降法 80
3.4.2 随机梯度下降 81
3.4.3 小批量梯度下降 81
3.4.4 动量梯度下降 82
3.4.5 RMSProp 82
3.4.6 ADAM 83
3.5 神经网络的优化策略 83
3.5.1 参数初始化 83
3.5.2 正则化 85
3.5.3 Dropout 86
3.5.4 数据增强 87
3.5.5 预训练 87
3.6 深度神经网络概述 87
3.6.1 深度学习的优势 89
3.6.2 适用领域 90
3.7 温故知新 92
3.8 习题 92
参考资源 94
第二篇 方法解析篇
第4章 卷积神经网络方法解析 97
4.1 卷积神经网络概述 97
4.1.1 生物机理 98
4.1.2 拓扑结构 99
4.1.3 网络特点 100
4.2 关键方法 102
4.2.1 卷积 103
4.2.2 池化 111
4.2.3 全连接 111
4.3 常见的卷积神经网络 112
4.3.1 LeNet 112
4.3.2 AlexNet 112
4.3.3 VGGNet 114
4.3.4 GoogLeNet 114
4.3.5 ResNet 115
4.3.6 DenseNet 116
4.4 改进方向与应用领域 116
4.4.1 改进方向 116
4.4.2 应用领域 117
4.5 温故知新 118
4.6 习题 118
参考资源 119
第5章 生成式对抗网络方法解析 120
5.1 生成模型概述 120
5.2 网络模型 121
5.3 重要方法 122
5.3.1 数学原理 122
5.3.2 训练机制 125
5.3.3 训练技巧 125
5.3.4 评价指标 127
5.4 GAN的改进模型 129
5.4.1 CGAN 130
5.4.2 DCGAN 131
5.4.3 WGAN 132
5.4.4 LSGAN 133
5.4.5 PGGAN 134
5.4.6 ACGAN 136
5.4.7 BigGAN 137
5.5 改进方向与应用领域 139
5.5.1 改进方向 139
5.5.2 应用领域 140
5.5.3 研究进展 143
5.6 温故知新 144
5.7 习题 144
参考资源 145
第6章 循环神经网络方法解析 146
6.1 循环神经网络概述 146
6.2 自然语言处理 148
6.2.1 语言模型 148
6.2.2 词向量 149
6.3 循环神经网络 151
6.3.1 生物机理 151
6.3.2 网络结构 151
6.3.3 网络训练 153
6.4 循环神经网络改进 154
6.4.1 LSTM 154
6.4.2 其他改进模型 156
6.5 研究进展与应用领域 158
6.5.1 研究进展 158
6.5.2 应用领域 159
6.6 温故知新 161
6.7 习题 162
参考资源 163
第7章 深度强化学习方法解析 165
7.1 强化学习概述 165
7.2 强化学习基础 166
7.2.1 定义及相关概念 166
7.2.2 马尔可夫决策过程 169
7.3 经典强化学习 170
7.3.1 强化学习分类 170
7.3.2 Qlearning算法 172
7.3.3 存在挑战 173
7.4 深度强化学习 174
7.4.1 DQN算法 174
7.4.2 深度强化学习的改进算法 177
7.4.3 小结 179
7.5 重要应用 180
7.6 研究进展 181
7.7 温故知新 182
7.8 习题 183
参考资源 184
第三篇 实战应用篇
第8章 基于卷积神经网络的2D人体姿态估计实战 187
8.1 人体姿态估计概述 187
8.2 人体姿态估计技术回顾 188
8.2.1 单人姿态估计 189
8.2.2 多人姿态估计 191
8.3 编程实战 192
8.3.1 实验环境 192
8.3.2 数据准备 194
8.3.3 模型构建 194
8.3.4 运行测试 200
8.4 温故知新 200
参考资源 201
第9章 利用深度强化学习玩游戏实战 202
9.1 实战背景 202
9.1.1 深度强化学习在游戏领域的应用 202
9.1.2 Gym介绍 203
9.2 深度强化学习技术回顾 204
9.3 编程实战 206
9.3.1 基于Pytorch的游戏实战 207
9.3.2 基于策略梯度进行TensorFlow实战 211
9.4 温故知新 215
参考资源 216
第10章 面向边缘智能的人群数量计算实战 217
10.1 实战背景 217
10.1.1 人群数量计算 217
10.1.2 边缘智能 219
10.2 目标检测技术回顾 220
10.2.1 目标检测 220
10.2.2 人脸检测 222
10.2.3 面向边缘智能的人群数量计算系统整体流程设计 223
10.3 编程实战 225
10.3.1 基于YOLO V3的目标检测 225
10.3.2 基于CenterFace的人脸检测 229
10.4 温故知新 232
参考资源 233
第11章 边缘计算场景下智能垃圾分类实战 234
11.1 实战背景 234
11.1.1 垃圾分类 234
11.1.2 边缘计算发展 235
11.2 相关技术梳理 237
11.2.1 智能语音识别 237
11.2.2 垃圾图像分类 238
11.2.3 基于边缘计算的智能垃圾分类系统整体流程 240
11.3 编程实战 242
11.3.1 智能语音识别 242
11.3.2 垃圾图像分类 245
11.4 温故知新 247
参考资源 249
第12章 基于生成式对抗网络的图像“魔术” 250
12.1 实战背景 250
12.1.1 GAN在图像翻译中的应用 250
12.1.2 GAN在图像生成中的应用 251
12.2 生成式对抗网络技术回顾 253
12.3 编程实战 256
12.3.1 基于TensorFlow的CycleGAN 257
12.3.2 基于Pytorch的DCGAN 267
12.4 温故知新 272
参考资源 273
附录1 Linux指令 274
附录2 BP算法推导 278
参考文献 282
你还可能感兴趣
我要评论
|