基于上下文特征与单类支持向量机的人脸活体检测

摘要: 非法入侵者通过伪装人脸欺骗识别系统, 给人脸识别应用带来严重威胁。现有人脸活体检测方法多为在同一数据集内进行训练和测试,当应用在跨数据集场景中时效果并不理想。针对这一问题,提出了利用HOG等算法对上下文环境中的线索信息进行提取,提取出来的特征送入单类支持向量机进行训练、分类。将分类结果与上下文环境中异常线索的探测结果相结合。算法在公开的数据集NUAA和CASIA-FASD上进行了验证,实验结果表明在跨数据集检测时该算法的泛化能力及检测准确率较已存在算法有所提高。

0 引言

随着生物特征识别技术的日臻完善,人脸识别(Facial Recognition)、指纹识别(Fingerprint Recognition)等生物特征识别将在身份验证中扮演着重要角色,作为主流技术的人脸识别,有着认证自然、可视化等优点。人脸识别已经在最近几年取得了飞速的发展,并且已经逐渐应用到各行各业中。但也伴随产生了一些问题:一些不法分子利用一些技术仿冒人脸去欺骗识别系统,给合法用户带来了经济财产损失,造成社会纷扰。为了更安全地进行身份认证和检测身份来源的真实性,活体检测技术必不可少。对认证系统进行欺骗的对象一般都是刚性的、僵硬的物体(例如:打印的照片、手机或平板电脑屏幕显示的照片等),因此通过人脸活体检测技术(Face Anti-Spoofing)来预防欺骗是常常采取的措施。人脸识别系统主要容易受到以下手段的欺骗:(1)用照片或高清打印图像假冒真人;(2)用在公开场合录制的视频或网上公开的视频片段来冒充真人;(3)用蜡或塑料等材质构造的3D模型来假冒真人。其中,照片欺骗是最常见的欺骗方法。

从2004年开始,国内外的学者对人脸活体检测技术进行了大量的研究。这些研究主要分为4类方法。(1)添加辅助设备的方法:使用红外摄像头、热成像摄像头等辅助设备检测活体特征[1]。(2)基于运动信息的方法:PAN G等人[2]使用条件随机场人眼模型对眨眼动作建模,获取了较高的眨眼检测率,并通过检测是否有眨眼动作来进行活体检测。(3)基于手工提取特征的方法:LI J[3]等人利用二维傅里叶频谱分析方法进行活体检测,但其对扭曲照片的检测准确率不太理想;M?魧?魧TT?魧 J[4]、TIAGO D F P[5]等人分别提出了使用局部二值模式(Local Binary Patterns,LBP)特征以及结合了时间和空间信息的LBP-TOP(Local Binary Pattern histograms from Three Orthogonal Planes)特征进行活体检测;2015年KIM W等人[6]首次提出基于LSP(Local Speed Patterns)特征的检测方法,并取得了较好的检测结果。(4)基于深度学习的方法:Yang Jianwei[7]等人首次使用了卷积神经网络(Convolutional Neural Networks,CNN)的方法;李冰等人[8]提出将人脸的灰度图和局部定向模式分别作为两个不同结构的网络的输入,然后采用主成分分析对每个网络的全连接层的输出分别降维后级联,最后将级联的特征向量送入极限学习机(Extreme Learning Machine,ELM)进行活体检测;文献[9]通过将真实人脸和照片进行数据去中心化、ZCA白化去噪声、随机旋转等处理,并使用卷积神经网络对照片的面部特征进行提取,提取出来的特征送入神经网络训练、分类,从而得到检测结果。

虽然上述研究方法已取得了一些成果,但仍然存在一些问题。例如,在某些现实应用场景中不具备采集动态影像进行活体检测的条件,而添加辅助设备也增加了应用的成本。另外,手工提取特征的方法具有主观性、不全面等缺陷,导致预测结果不理想,而基于深度学习的方法所获得的训练模型在跨数据集(即模型训练数据集与测试数据集不同)检测时表现不佳。

本文提出基于上下文特征单类支持向量机(One Class Support Vector Machine,OCSVM)的人脸活体检测方法。首先通过方向梯度直方图(Histogram of Oriented Gradients,HOG)对欺骗行为中普遍存在的上下文特征(例如,非法入侵者为了通过手机呈现待识别对象的人脸照片而引入的规则矩形边框)进行提取,然后使用OCSVM对特征向量进行训练分类,接下来利用TensorFlow目标检测API(应用程序接口)对图片中的特定欺骗特征(例如,握住手机等欺骗媒介的人手)进行检测,最后根据OCSVM的分类结果以及TensorFlow的目标检测结果进行真假判定。

(0)

相关推荐