这是一本系统讲解人脸识别和人体姿态识别技术、算法和应用的实战性著作,是作者团队多年研究成果和实践经验的总结。既有业界成熟的技术和算法,又有行业的新热点和新趋势。
通过本书,读者将能轻松掌握如下知识:
机器视觉的概念以及索引技术,包括向量空间索引和度量空间索引;
人脸识别技术,以及人脸检测算法、人脸对齐算法、人脸特征提取算法;
面向人脸检索的高维空间快速索引技术;
人体姿态识别技术、目标检测算法以及算法的性能评测;
面向嵌入式设备的人脸识别技术与算法,轻量级的人脸识别技术与算法,以及面向ARM设备的人脸精准识别方法VMFace;
人脸识别、人体姿态识别相关技术和算法在门禁、安防和运动训练等场景的应用。
(1)作者经验丰富:作者在机器视觉领域有丰富的实践经验,获得了大量专利,而且创办了专门的机器视觉公司,将理论成果转化为商业产品。
(2)零基础快入门:本书面向没有机器视觉基础的读者,指导他们快速掌握人脸识别、人体动作识别的技术、算法和应用。
(3)结合行业热点:除了成熟的人脸识别和人体动作识别的技术和算法外,本书还讲解了行业里最新的、关注度极高的嵌入式设备、轻量级的人脸识别技术。
Preface
前 言
为什么要写这本书
随着人们在日常生活中对智能化、便捷化、自动化的需求日益提升,越来越多的人利用机器视觉技术对人脸、人体姿态进行自动化识别、判定。人脸识别技术可以用于快速确定用户的身份,省去了很多人工处理的时间。人体姿态识别技术可以用于智能检测人体骨架、姿态甚至动作,目前广泛应用于姿态判断、动作纠正等
场景。
本书以人体自动化、智能化识别为切入点,讲述机器视觉在应用中的若干技术,包括索引技术、人脸识别技术、人体姿态识别技术,并结合实际应用场景介绍这些技术的应用案例。
人脸识别技术发展较早,是初级机器学习时代的产物,随着深度学习技术的不断深入,人脸识别技术迎来了发展机遇期,识别的精准度显著提升。当前小型化、嵌入式人脸识别技术受到越来越多的关注。本书从小型化人脸识别技术出发,由浅入深地阐述人脸识别技术。
人体姿态识别是近年来热门的技术,应用较广泛。纵观技术现状,人体姿态识别的精准度还不够高。本书所述技术为作者团队在实际研发中的经验总结,在应用效果上优于现有的大多数技术。
读者对象
本书适合如下读者阅读。
机器视觉技术入门级读者。
人脸识别技术研究和应用的爱好者和开发者。
高维索引技术研究和应用的爱好者和开发者。
人体姿态识别技术研究和应用的爱好者和开发者。
开设相关课程的大专院校的师生。
本书特色
市面上介绍人脸识别技术的图书较多,但没有面向小型化设备的,并且大多数针对的是人脸识别技术,介绍人体其他部位识别的有限。目前,人体识别技术的应用场景日益增多,本书可以满足一部分想了解人体识别技术的读者的需求。
本书以作者所在技术团队在实际工作中的研发为基础,不仅讲述人体智能识别的原理,还结合团队研发成果进行深度剖析,并且结合不同应用场景进行人体智能识别的深入介绍。
如何阅读本书
本书分为10章。
第1章主要介绍机器视觉的概念及其在人体识别中的相关应用。
第2章主要介绍机器视觉中的索引技术,包括概念与作用、向量空间索引技术和度量空间索引技术。
第3章主要介绍人脸识别技术、人脸检测算法、人脸对齐算法、人脸特征提取算法的概念与分类。
第4章主要介绍人体姿态识别技术,包括自上而下的人体姿态识别技术和自下而上的人体姿态识别技术。
第5章主要介绍度量空间索引、相似性检索、高维空间快速索引方法及高维空间快速索引实验。
第6章主要介绍嵌入式人脸识别装置、轻量级人脸识别算法、嵌入式人脸识别应用以及面向ARM的人脸精准识别方法VMFace。
第7章主要介绍两阶段目标检测算法、一阶段目标检测算法和算法性能测评。
第8章通过门禁场景和安防场景介绍嵌入式人脸设备的应用。
第9章主要介绍人体姿态识别技术的应用,包括运动训练场景、姿态纠正、安防、虚拟现实等。
第10章主要对机器视觉在人体识别领域中的关键问题和挑战进行总结,并展望未来发展。
勘误和支持
由于作者的水平有限,书中难免会出现一些错误或者不准确的地方,恳请读者批评指正。如果你有更多的宝贵意见,也欢迎发送邮件至邮箱vm-info@visionmiracle.cn。期待能够得到你们的真挚反馈。
致谢
著名剧作家萧伯纳曾说:人生最大的快乐是致力于一个自己认为伟大的目标。我热衷于人工智能技术,并将学习和实践作为自己的目标,进而从中获得快乐。从我读大学时首次接触机器视觉技术,到我将自己的认知及实践记录成书,十年间经历良多,姑且把本书看作自己这些年来在机器视觉领域的记录和总结吧!
首先要感谢Geoffrey Hinton,他为我打开了深度学习的一道门。
感谢肖思思和谭志鹏对本书整理和校对工作的支持。
感谢我的爱人胡艳艳及“崽崽”夏予、夏添,你们是我在面对困难时昂首向前的动力。
感谢周波及视觉伟业的同事们,陪我一起推石头上山般一点点地实践人工智能。
感谢我的朋友们,你们总能给我提供建议、观念以及建设性的意见。
谨以此书献给众多热爱人工智能的朋友!
夏 东
夏 东
国防科技大学通信与信息系统博士、控制科学与工程博士后。长期从事人工智能和自动目标识别领域的研究工作,主持完成国家“863计划”项目等多个重大项目的研究,发明专利60余项。在机器智能视觉、大数据等领域有丰富的实战经验与深入的商业化理解。将机器智能视觉理论付诸实践创立了湖南视觉伟业智能科技有限公司。作为湖南省科技创业领军人才,带领团队研发了人脸识别、行为分析等多款款业内领先AI软硬件产品,并在多个省份和城市得到应用。
周 波
长期从事计算机视觉、人工智能研究工作,发明专利40余项,获得“安防工匠人物”称号,创立深圳市海清视讯科技有限公司,获得国家级专精特新“小巨人”企业称号。
CONTENTS
目 录
前言
第1章 机器视觉概述 1
1.1 机器视觉简介 1
1.1.1 什么是机器视觉 2
1.1.2 机器视觉的技术分类 4
1.1.3 机器视觉技术的应用与价值 14
1.2 机器视觉在人体识别中的相关应用 19
1.2.1 人脸识别 19
1.2.2 人体姿态识别与估计 20
1.2.3 计算视觉小型化 22
1.2.4 意义与价值 23
1.3 本章小结 24
第2章 机器视觉中的索引技术 25
2.1 索引技术概述 25
2.1.1 索引的概念 26
2.1.2 索引的作用 27
2.2 向量空间索引技术 29
2.2.1 向量空间索引技术概述 29
2.2.2 分类介绍 30
2.2.3 向量空间索引的应用 42
2.3 度量空间索引技术 43
2.3.1 度量空间索引技术概述 43
2.3.2 分类介绍 44
2.3.3 度量空间索引的应用 49
2.4 本章小结 51
第3章 机器视觉中的人脸识别技术 52
3.1 人脸识别技术 52
3.1.1 概念与定义 52
3.1.2 人脸识别技术的分类 57
3.2 人脸检测算法 57
3.2.1 概念与定义 58
3.2.2 Adaboost 59
3.2.3 Cascade CNN 59
3.2.4 DenseBox 62
3.2.5 Faceness-Net 65
3.2.6 MTCNN 67
3.3 人脸对齐算法 69
3.3.1 概念与定义 69
3.3.2 DCNN 70
3.3.3 TCNN 72
3.3.4 LAB 73
3.4 人脸特征提取算法 74
3.4.1 概念与定义 75
3.4.2 DeepID 77
3.4.3 InsightFace 79
3.4.4 MobileFaceNet 80
3.5 本章小结 81
第4章 机器视觉中的人体姿态识别技术 82
4.1 人体姿态识别技术概述 82
4.1.1 概念与定义 83
4.1.2 人体姿态识别技术的特点 84
4.1.3 人体骨架关键点提取技术 85
4.1.4 人体姿态识别算法 87
4.2 自上而下的人体姿态识别技术 88
4.2.1 Mask R-CNN 88
4.2.2 RMPE 92
4.2.3 DeepCut 95
4.3 自下而上的人体姿态识别技术 97
4.3.1 PAF 97
4.3.2 Associative Embedding 99
4.4 本章小结 102
第5章 面向人脸检索的高维空间快速索引技术 103
5.1 度量空间索引和相似性检索 103
5.1.1 度量空间索引 104
5.1.2 相似性检索 106
5.2 高维空间快速索引方法 109
5.2.1 度量空间索引快速查询方法 109
5.2.2 度量空间索引KNN查询方法 113
5.3 高维空间快速索引实验 117
5.3.1 实验环境 117
5.3.2 实验结果 117
5.3.3 分析比较 118
5.4 本章小结 119
第6章 嵌入式设备中的人脸精准识别技术 120
6.1 嵌入式设备概述 120
6.1.1 嵌入式设备的由来 121
6.1.2 嵌入式设备的分类 122
6.2 轻量级人脸识别算法与嵌入式人脸识别应用 125
6.2.1 轻量级人脸识别算法 125
6.2.2 嵌入式人脸识别应用 133
6.3 面向ARM的人脸精准识别方法VMFace 135
6.3.1 VMFace神经网络结构 135
6.3.2 VMFace在ARM环境的应用与性能分析 136
6.4 本章小结 139
第7章 面向姿态识别的目标检测算法与性能测评 140
7.1 两阶段目标检测算法 140
7.1.1 R-CNN模型 141
7.1.2 SPP-Net模型 148
7.1.3 Fast R-CNN模型 153
7.1.4 Faster R-CNN模型 157
7.2 一阶段目标检测算法 160
7.2.1 YOLO模型 160
7.2.2 YOLO 2模型 162
7.2.3 SSD模型 165
7.3 算法性能测评 167
7.3.1 实验环境与参数设置 167
7.3.2 性能测试结果对比 169
7.4 本章小结 172
第8章 嵌入式人脸设备的应用 173
8.1 门禁场景应用 174
8.1.1 门禁场景应用简介 175
8.1.2 人脸识别门禁场景体系设计 177
8.1.3 算法分析 178
8.1.4 案例介绍 179
8.2 安防场景应用 182
8.2.1 人脸识别安防场景应用简介 183
8.2.2 安防场景应用结构 184
8.2.3 案例介绍 187
8.3 本章小结 188
第9章 人体姿态识别技术的应用 189
9.1 运动训练场景应用 189
9.1.1 算法分析 190
9.1.2 案例介绍 191
9.2 姿态纠正应用 193
9.2.1 坐姿纠正应用 193
9.2.2 演讲姿态纠正应用 194
9.3 安防应用 196
9.3.1 安防应用背景 197
9.3.2 算法分析 197
9.4 虚拟现实应用 198
9.4.1 虚拟现实应用背景 198
9.4.2 算法分析 199
9.5 其他应用场景 201
9.6 本章小结 202
第10章 问题、挑战与发展 203
10.1 问题和挑战 203
10.1.1 基础性问题和挑战 203
10.1.2 技术挑战 204
10.1.3 用户隐私挑战 205
10.2 未来发展 207
10.2.1 人脸识别技术的未来 208
10.2.2 人体姿态识别技术的未来 209
10.3 本章小结 210