本书从初学者的视角出发, 使用通俗易懂的语言比较系统地介绍了基于深度学习的计算机视觉解决方案开发技术, 以循序渐进的方式详细讨论了VGG16、AlexNet、R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD、DeepFace和FaceNet等多种典型神经网络模型的基本结构和训练方法, 结合具体应用案例生动形象地介绍了图像样本数据集的获取与处理、深度学习模型的设计与优化、应用系统的开发与部署的基本过程, 逐步消除使用深度学习技术开发计算机视觉应用的认知盲点, 广大读者通过自己的努力就可以不太困难地掌握全书主要内容, 建立强大的应用技术基础。
第1章 计算机视觉和深度学习简介
1.1 使用OpenCV处理图像
1.1.1 使用OpenCV检测颜色
1.1.2 使用OpenCV检测形状
1.1.3 使用OpenCV检测人脸
1.2 深度学习的基础知识
1.2.1 神经网络背后的动力
1.2.2 神经网络中的层
1.2.3 神经元
1.2.4 超参数
1.2.5 ANN的连接与权重
1.2.6 偏置项
1.2.7 激活函数
1.2.8 学习率
1.2.9 反向传播
1.2.10 过度拟合
1.2.11 梯度下降算法
1.2.12 损失函数
1.3 深度学习的工作原理
1.3.1 深度学习过程
1.3.2 流行的深度学习程序库
1.4 小结
习题
拓展阅读
第2章 面向计算机视觉的深度学习
2.1 使用TensorFlow和Keras进行深度学习
2.2 张量
2.3 卷积神经网络
2.3.1 卷积
2.3.2 池化层
2.3.3 全连接层
2.4 开发基于CNN的深度学习解决方案
2.5 小结
习题
拓展阅读
第3章 使用LeNet进行图像分类
3.1 深度学习的网络架构
3.2 LeNet架构
3.2.1 LeNet-1架构
3.2.2 LeNet-4架构
3.2.3 LeNet-5架构
3.2.4 增强LeNet-4架构
3.3 使用LeNet创建图像分类模型
3.3.1 使用LeNet进行MNIST分类
3.3.2 使用LeNet进行德国交通标志分类
3.4 小结
习题
拓展阅读
第4章 VGG和 AlexNet 网络
4.1 AlexNet和VGG神经网络模型
4.1.1 AlexNet模型架构
4.1.2 VGG模型架构
4.2 使用AlexNet和VGG开发应用案例
4.2.1 CIFAR数据集
4.2.2 使用AlexNet模型处理CIFAR-10数据集
4.2.3 使用VGG模型处理CIFAR-10数据集
4.3 AlexNet模型和VGG模型的比较
4.4 使用CIFAR-100数据集
4.5 小结
习题
拓展阅读
第5章 使用深度学习进行目标检测
5.1 目标检测
5.1.1 目标分类、目标定位与目标检测
5.1.2 目标检测的应用案例
5.2 目标检测方法
5.3 目标检测的深度学习框架
5.3.1 目标检测的滑窗法
5.3.2 边界框方法
5.3.3 重叠度指标
5.3.4 非极大性抑制
5.3.5 锚盒
5.4 深度学习网络架构
5.4.1 基于区域的CNN
5.4.2 Fast R-CNN
5.4.3 Faster R-CNN
5.4.4 YOLO算法
5.4.5 单阶段多框检测器
5.5 迁移学习
5.6 实时的目标检测Python实现
5.7 小结
习题
拓展阅读
第6章 人脸识别与手势识别
6.1 人脸识别
6.1.1 人脸识别的应用
6.1.2 人脸识别的过程
6.2 人脸识别的深度学习模式
6.2.1 Facebook的DeepFace解决方案
6.2.2 FaceNet的人脸识别
6.3 FaceNet的Python实现
6.4 手势识别Python解决方案
6.5 小结
习题
拓展阅读
第7章 基于深度学习的视频分析
7.1 视频处理
7.2 视频分析的应用
7.3 梯度消失和梯度爆炸
7.3.1 梯度消失
7.3.2 梯度爆炸
7.4 ResNet架构
7.5 Inception网络
7.5.1 1×1卷积
7.5.2 GoogLeNet架构
7.5.3 Inception v2中的改进
7.5.4 Inception v3模型
7.6 视频分析
7.7 使用Inception v3和ResNet创建Python解决方案
7.8 小结
习题
拓展阅读
第8章 端到端的网络模型开发
8.1 深度学习项目需求
8.2 深度学习项目的开发过程
8.2.1 业务问题的定义
8.2.2 源数据或数据收集阶段
8.2.3 数据存储与管理
8.2.4 数据准备和扩充
8.2.5 图像样本增强
8.3 深度学习的建模过程
8.3.1 迁移学习
8.3.2 常见错误/挑战和模型性能提高
8.3.3 模型的部署与维护
8.4 小结
习题
拓展阅读
附录A
A1 CNN中的主要激活函数与网络层
A2 Google Colab