重磅!GroupFace 人脸识别,刷新 9 个数据集SOTA

来自韩国Kakao公司的研究人员,在论文 GroupFace: Learning Latent Groups and Constructing Group-based Representations for Face Recognition 提出一种新的概念:人脸的组感知表示,通过在网络中学习人脸的隐藏组表示,并与实例级人脸表示结合,实现了更高精度的人脸识别。

在人脸识别常用的 9 大数据集(LFW, YTF, CALFW, CPLFW,CFP, AgeDB-30, MegaFace, IJB-B, IJB-C)上,该算法表现出了一致性的精度提高,虽然代码没开源,结果非常吸引人。

什么是组(Group)?组表示?

作者文中所指的组,可以认为就是一类含有特定可见或非可见特征的人脸,也可认为就是聚类的类别,比如有胡须的人组成的组,有眼镜的人组成的组。

组表示,意指一张特定图片在经过各个组的网络后都有对应的特征向量,根据此图片归属于某一组的概率,将所有特征向量加权生成的特征向量。

作者认为如果在训练的时候能够给出每张图片所属组(或者说类别)的标签,训练得到的特征天然的具有缩小人脸搜索范围的性质,使人脸识别更精准。

但现实情况是并不会有足够的人脸分组标签,所以作者希望在训练中自发式聚类,以实现自动化的提取组表示。

下图为 GroupFace 示例:

直接从Robert Downey人脸提取的特征,作者称之为实例级特征。而相应的网络自动将其分到“棕胡子”人脸组,实例级和组表示特征共同构建最终的特征。

网络架构

如果使用组表示能够改进人脸识别这样的假设有道理,那问题的难点就是如何实现样本自动分组?

请看 GroupFace 的网络结构(点击查看大图):

人脸图像经过骨干网生成4096维特征向量,其继续经过多个全连接层形成实例级表示(Instance-based Representation)和多个组感知的表示(Group-aware Representations)。

从实例级表示后引出组决策网络(Group Decision Network),其内部通过多层感知机+全连接层+Softmax生成样本属于某个组的概率(Group Probability ),不同组的表示和相应的概率加权即形成了加权组表示(这一步也可以使用最大概率的组感知表示来直接替代,但作者发现组表示加权更好),其再与实例级表示结合生成最终的人脸表示。

流程如此,但关键是训练时组决策网络(Group Decision Network)如何自发的对样本生成不同组的概率。这个过程其实是网络在聚类(把样本归到某一类),作者基于一种简单的假设,即认为当有大量样本时,样本应该总体呈均匀分布,所以每个类的样本个数应该尽量平衡。

所以作者使用期望归一化(Expectation-Normalized Probability)技术对softmax后得到的大量样本的组概率进一步处理,使得各个类别尽量样本平衡。

期望归一化示例如下:

事实上,作者使用了 8 卡同步训练,每卡mini-batch大小为128,而概率期望归一化时不仅考虑当前的8x128个样本,还考虑前32到128个batch的样本,所以每次归一化最小样本数8x128x32 = 32768个样本,这的确够大了。

其实透过上面的分析可知,使用作者的方法很难学到作者假设的那种语义分组,但在实验中发现,网络自动分组对人脸识别来说仍然有好处的。

实验结果

除了使用GroupFace网络结构,作者还使用arcface loss损失函数,在 9 个常用的1:1人脸验证和1:N人脸识别数据集中的实验,均得到了显著的精度提升。

可见,组感知特征表示的确是有效的。

比较有意思的是,作者把网络自动分组的部分结果可视化了,请看下图:

可见,很难总结出每一组对应的人脸属于一个特定的语义,Group 1 看起来大部分是右侧脸,Group 29 则看起来是笑的人脸。Group 5 可能代表男性组,因为作者随机选择其100个样本中95个是男性,Group 20 可能代表秃头男性,因为作者随机选择100个样本中94个是秃头男性。(没想到秃头男性在机器眼中也如此显眼

结论

作者提出使用组感知表示的概念是不错的方向,实验证明了其设计的算法也的确有效,但其中最重要的问题是如何自发给样本分组,还有没有更好的给样本分组的方法?这就是非常值得进一步研究的了。

虽然作者称GroupFace是一种人脸识别专用算法,但其实这种思想在所有表示学习、度量学习领域都值得尝试,比如ReID。

论文地址:

https://arxiv.org/pdf/2005.10497.pdf

(目前还未发现有开源代码)

END

在看,让更多人看到

(0)

相关推荐

  • 多组学在线分析工具

    随着高通量测序技术种类的越来越多,我们经常会拿到相关样本的不同组学的数据.那拿 TCGA 的数据库而言,对于同一个患者,就检测了RNA-seq, miRNA-seq, 甲基化芯片等等多组学的数据.对于 ...

  • 仅3个单细胞测序样本纯分析也发6分!

    Single-cell RNA sequencing of human kidney 人肾脏的单细胞测序 一. 研究背景 肾脏是在结构和功能高度复杂的器官,而其结构和功能的复杂性与其众多的细胞类型相关 ...

  • 【63.人脸识别】南方职场词典

    您真是个特别的人 谨以此作献给普天之下千千万万的打工者! 谨以此作献给这个物欲横流的大时代! 致读者: 1.此文乃作者辛勤付出的原创作品,版权所有,未经作者授版,禁止转载.摘编.复制或建立镜像.若有违 ...

  • 2020年这样的免疫套路发8分+SCI!

    大家好,今天小编要和大家分享的是今年5月份发表在Theranostics(IF:8.579)上的一篇文章,"Macrophage correlates with immunophenotyp ...

  • 【学术论文】基于深浅特征融合的人脸识别

       摘 要 : 针对传统的浅层特征所提取特征的判别性有限.深度特征需要大量带标记样本且训练过程耗时长的问题,提出一种深度及浅层特征融合算法用于人脸识别.首先提取人脸的HOG特征并进行判别性降维:同时 ...

  • 【学习笔记】基于人脸识别的课堂点名系统

    摘要:传统的课堂点名方法效率低下,浪费大量时间.提出基于人脸识别的课堂点名系统,大大提高了课堂点名的效率.本系统提供图像和摄像识别点名,可一次识别多个人脸,同时该系统也对系统难以识别的学生提供手动签到 ...

  • ML之FE:数据处理—特征工程之稀疏特征的简介、如何处理、案例应用之详细攻略

    ML之FE:数据处理-特征工程之稀疏特征的简介.如何处理.案例应用之详细攻略 稀疏特征的简介 信号稀疏表示是过去近20年来信号处理界一个非常引人关注的研究领域,众多研究论文和专题研讨会表明了该领域的蓬 ...

  • 【人脸表情识别】不得不读的重要论文推荐(2019-2020篇)

    上一篇专栏文章我们介绍了2015-2018年基于图片的人脸表情识别代表性方法.本文将延续上一篇的内容,继续盘点2019-2020基于图片的人脸表情识别的代表性工作. 作者&编辑 | Menpi ...

  • 【人脸表情识别】不得不读的重要论文推荐(2015-2018篇)

    前两篇专栏我们介绍了人脸表情识别的相关概念以及研究现状,并且了解了基于图片的人脸表情识别常用的数据集和预处理方法.接下来两篇专栏,笔者将从近5年基于图片的人脸表情识别的论文中推荐一些个人觉得具有代表性 ...

  • 【学习笔记】嵌入式技术(6):改进的多姿态矫正的人脸识别算法

    2016年微型机与应用第3期 作者:杨作宝1,2,侯凌燕1,2,杨大利1,2 摘要:针对人脸多姿态导致人脸识别率下降这一问题,提出一种改进姿态矫正处理方法,通过改进对人脸特征点的有效定位,来计算人脸姿 ...

  • 明景人像鉴定分析系统 视频侦查中的人像鉴定

    人(脸图)像=人像? 在视频侦查领域,"人脸图像"经常代以"人像"的称呼,但"人像"就="人脸图像"吗? 我们必须明确的 ...

  • GaitSet:通过交叉视角步态识别

    重磅干货,第一时间送达 小白导读 论文是学术研究的精华和未来发展的明灯.小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...