本书全面、系统地阐述以人脸识别为代表的信息安全技术, 可以降低用户数据信息安全风险。本书主要内容包括人工智能和信息安全概述, 挖掘人脸可辨识信息的关键技术, 非约束人脸识别、小样本人脸识别、代价敏感人脸、快速正则化联合分类等问题的解决方案, 深层局部字典和联合加权核稀疏分类器的构建方案, 提升用户信息网络安全性的各种方案, 用户信息网络安全的未来等。
人工智能是计算机科学的一个分支,它的发展并不是一帆风顺的,近年来随着大数据、云计算、机器学习和5G通信等技术的发展,人工智能技术得到快速发展。人工智能技术致力于创造出一种以接近人类思维和行为方式做出响应的智能机器系统,该领域的研究包括机器人控制、语音识别、图像识别、自然语言处理和专家系统等。这些前沿的理论和技术日益成熟,应用领域不断扩展,惠及了信息网络时代的各行各业。可以设想,未来的科技产品将以人工智能为核心,凝聚无穷无尽的人类智慧。
机器学习是人工智能的子领域和技术核心。一个人工智能系统需要具备从原始数据中学习知识的能力,包含很多有影响力的算法和程序,指挥计算机按照既定的模式提取有效特征、学习数据或完成各类任务,因此解决了很多人工智能领域的问题。这种自动学习和应用数据特征的技术提升了人工智能处理大规模数据的能力,也降低了对人工的依赖和成本,顺应大数据时代数据分析的迫切需求,成为各行业和各交叉学科的重要技术支撑。人脸识别技术就是依靠机器学习的各类针对性模式识别算法,完成人工智能在人脸图像理解、分类和预测领域的应用。
人脸识别属于图像识别的范畴,因其具有可以随身携带,不易丢失和被盗取,可以随时随地进行非接触式采集等优点,迅速成为代表性生物信息识别技术,主要进行用户身份和信息的识别。虽然人脸识别技术在众多领域中表现出较强的识别性能和安全性能,但实际应用时仍然有许多困难需要克服,主要包括光照变化,人为遮挡,姿态、表情和年龄的变化,样本数量不足等非约束性情况下的问题。人脸识别技术可用于安防、金融、智慧园区、交通出行、互联网服务等多个场景,在这些应用场景中,需要保障用户的资金交易安全性、账号卡号认证安全性、乘客财产和人身安全性、互动营销安全性,并提升用户的服务体验和服务的便捷性。虽然这些应用在设计之初就采取了较为可靠的安全措施,但信息网络数据保障体系的不完善和安全漏洞难以避免,都可能导致人脸数据的泄露、滥用甚至伪造等情况。因此,提高以人脸识别为代表的人工智能技术水平,可以降低用户信息网络安全风险,有利于促进人工智能生态环境的良性发展。
本书的内容安排大致如下:第1章对人工智能和用户信息网络安全进行了概述;第2章讨论几种挖掘人脸可辨识信息的关键技术;第3章对于非约束人脸识别问题中典型的遮挡问题提出可变人脸遮挡位置探测和迭代恢复的算法,弥补遮挡和光照场景下人脸可辨识信息不足的问题;第4章针对小样本人脸识别问题,提出样本组错位原子字典,扩展字典信息量,增强字典编码能力;第5章针对代价敏感人脸安全认证问题,提出基于限定表情动作人脸安全认证模型,构建浅层二重字典进行粗略辨识和精细确认;第6章提出流形正则化联合核协同表示算法,融合人脸低维空间的流形结构和高维空间的核结构,有效提高了非约束情况下人脸识别性能;第7章构建迁移学习模式下的深层局部字典,提取样本深层局部特征,建立分层建模大数据人脸认证模型;第8章总结提升用户信息网络安全性的各种方案;第9章分析和展望了用户信息网络安全技术的未来。
本书条理清晰、逻辑性强、内容充实、涵盖范围广,具有较强的学术性和实用性。本书内容主要基于以人脸识别为主体的用户信息网络安全性研究,参考了大量的有关文献,感谢本书中所参考和引用资料的有关机构与作者。如果有资料因疏忽而未列出其出处,请原机构或作者及时告知,以便再版时增补。本书引用的部分资料和图表主要用于知识内容的阐述与传授,无侵权意图,特此声明。
本书由王蒙、刘庆庆编著。特别感谢清华大学出版社王军编辑为本书出版所做的大量耐心、细致的工作,特别感谢陈君、闫钰炜、王倩、胡正平、孙哲、赵淑欢对本书编写工作的支持。本书获得泰山学院国家一流专业专项经费资助。
由于编者水平有限,加之用户信息网络安全和人工智能技术发展日新月异,书中如有不足之处,敬请各界同仁批评指正。
编 者
2022年7月
第1章 人工智能和信息安全概述 1
1.1 以人脸识别为主体的用户信息网络安全技术 1
1.1.1 人脸识别技术的引入 2
1.1.2 人脸识别技术的发展史 5
1.1.3 用户信息网络安全性 12
1.2 机器学习与人工智能、数据挖掘和网络安全的融合 16
1.2.1 机器学习与人工智能 16
1.2.2 机器学习与数据挖掘 17
1.2.3 机器学习与网络安全 18
1.3 机器学习和信息安全发展趋势 20
1.4 本章小结 22
第2章 挖掘用户可辨识信息的方法 23
2.1 稀疏表示 23
2.2 协同表示 26
2.3 核稀疏表示和核协同表示 27
2.4 稀疏字典学习 29
2.5 深度学习 31
2.5.1 深度学习的模型 31
2.5.2 多层感知机 33
2.5.3 激活函数和损失函数 35
2.5.4 优化算法 38
2.5.5 卷积神经网络 40
2.6 本章小结 42
第3章 非约束性用户的识别方法 43
3.1 非约束性人脸识别问题 43
3.2 相关工作的回顾 46
3.2.1 鲁棒稀疏表示 46
3.2.2 鲁棒稀疏编码算法 47
3.3 可变遮挡探测和迭代恢复稀疏表示模型 47
3.3.1 VOD过程 49
3.3.2 IR过程 50
3.3.3 VOD&IR算法描述 50
3.4 实验结果及分析 52
3.4.1 参数设置 52
3.4.2 模拟块遮挡 53
3.4.3 AR人脸数据库的真实遮挡 58
3.4.4 可变遮挡地图精确性评估 62
3.5 本章小结 63
第4章 小样本用户的识别方法 65
4.1 小样本用户识别问题 65
4.2 样本组错位原子字典联合核协同表示分类模型 67
4.2.1 仿射变换原理 68
4.2.2 样本组错位原子字典 69
4.2.3 联合核协同表示模型 70
4.3 实验结果及分析 71
4.3.1 Georgia Tech人脸数据库 72
4.3.2 Labeled Faces in the Wild人脸数据库 74
4.3.3 Caltech人脸数据库 75
4.3.4 相似方法的比较 77
4.3.5 样本组错位原子方案的评估 78
4.4 本章小结 80
第5章 代价敏感人脸认证安全体系 81
5.1 代价敏感人脸识别问题 81
5.2 基于高斯相似性关系的加权二重字典 83
5.2.1 高斯加权稀疏表示算法 83
5.2.2 浅层全局加权二重字典的建立 84
5.3 基于限定的表情动作模式的代价敏感人脸认证模型 85
5.3.1 CSFV_LEP模型的原理 85
5.3.2 CSFV_LEP算法描述 87
5.3.3 CSFV_LEP算法复杂度分析 89
5.4 实验结果及分析 89
5.4.1 参数设置 89
5.4.2 模型的安全和实用性能分析 91
5.5 本章小结 99
第6章 快速人脸识别的流形正则化方法 101
6.1 快速人脸识别问题 101
6.2 核协同流形正则化模型 103
6.3 实验仿真及结果分析 105
6.3.1 参数设置 105
6.3.2 Extended Yale B人脸数据库上的人脸识别实验 105
6.3.3 AR人脸数据库上的人脸识别实验 110
6.3.4 FERET人脸数据库上的人脸识别实验 112
6.3.5 Lab2人脸数据库上的人脸识别实验 114
6.3.6 参数的影响 116
6.4 本章小结 119
第7章 分层建模大规模人脸认证方法 121
7.1 大规模人脸识别问题 121
7.2 深度学习框架 123
7.2.1 卷积神经网络 123
7.2.2 经典的卷积神经网络结构 124
7.2.3 迁移学习 126
7.3 深层局部字典的建立 128
7.4 联合加权核协同表示 130
7.5 部分实验结果 131
7.5.1 CMU-PIE人脸数据库上的人脸识别实验 131
7.5.2 CMU-PIE人脸数据库上的加噪遮挡人脸识别实验 132
7.5.3 LFW人脸数据库上的无遮挡人脸识别实验 133
7.5.4 LFW人脸数据库上的同源遮挡人脸识别实验 134
7.6 本章小结 135
第8章 提升用户信息网络安全性的方法 137
8.1 以人脸识别为主体的信息安全系统 137
8.2 用户信息网络安全的保护方法 141
8.3 大数据环境下提升用户信息安全性的建议 144
8.4 本章小结 148
第9章 用户信息网络安全的未来 149
9.1 用户信息资源的多元化趋势 149
9.1.1 用户信息资源的多样性 150
9.1.2 用户信息需求的差异性 155
9.2 网络信息资源及其共享与保密 157
9.2.1 网络信息资源 157
9.2.2 网络信息资源的共享与保密 159
9.3 用户信息网络安全技术的发展前景 161
9.4 本章小结 164
参考文献 167
附录A 缩略语 175