你可以识别一百万张脸吗?也许某个算法可以

自从有了24小时的电视直播后,脸部识别就成为了公众关注的话题之一。这种技术现在常常出现在警匪片、间谍片中,需要的仅仅是运行一个简单的脸部识别程序,事实真的如此吗?

有些脸是非常具有标志性的,可能只需要几个像素点你就能认出来,Salvador Dali在它的作品·中就曾利用了这个特点。

达利幻觉中的林肯

(如果你不能看出这幅画的奥秘,看一下女人脚部的提示)

这幅《达利幻觉中的林肯》是西班牙超现实主义画家萨尔瓦多·达利的画,从近处看,是一个裸体女人背对着观众朝窗外看;从远处看,是一个带有幻觉色彩的美国第16任总统亚伯拉罕·林肯的头像。更多有趣的像素画,可以看这里:site1(http://www.opticalillusion.net/optical-illusions/pixelated-faces/ )、site2(http://www.michaelbach.de/ot/fcs_mosaic/index.html)。

除了一些患有面孔失认症(脸盲)(https://en.wikipedia.org/wiki/Prosopagnosia)的可怜人,大多数人都能够识别出成千上万的脸,并能轻易地记住上百个面孔。计算机算法,和人一样,也非常善于作脸部识别,“某某人的可能长相是什么?”,在警匪片或者侦探小说中,这个任务常常出现在太平间,或者警察的一方,或者是在看大头照的时候。证人比较罪犯与一般人的脸部样本究竟有多大?如果给你看一百万张照片,然后随机取出一张,你能确定这是否是那一百万张中的一个吗?

现在有一个机器学习挑战称为MegaFace挑战(http://megaface.cs.washington.edu/),使用一百万个脸部样本,旨在提高脸部识别的准确性,2007年创建的Labeled Faces in the Wild (LFW)(http://vis-www.cs.umass.edu/lfw/)标准只使用了13000个样本,对于这个数量级,现在的许多面部识别系统都能达到90%以上的准确度。

Ira Kemelmacher-Shlizerman,西雅图华盛顿大学计算机科学的助理教授,是Megaface的首席研究员,该项目背后的主要理念是:算法的准确性应当使用大规模数据进行验证。“使用百万数量级的样本,我们有了许多新的发现…,现在许多人有这样的错觉,认为面部识别领域已经趋于饱和,因为有大量的算法使用LFW标准都能达到95%以上的识别率。” Kemelmacher-Shlizerman说道。

然而,当使用MegaFace的百万级样本库时,戏剧性的事情发生了,之前最好的算法准确度已经降到70%,最差的甚至下降到30%。使用更大数据集的另一个动因是排除由LFW 标准一手调教出的算法。许多算法的高成功率往往是由于针对特定数据进行了某些调整。

MegaFace是面部识别的极限挑战,一方面测试算法的正确性,能否分辨出两张照片为同一个人或不同的人,另一方面给出某个人的脸部照片,要求从一百万张照片中找出同一个人的照片(注意照片并非完全一样,只是同一个人)。2016年6月30号发表在IEEE(美国电器和电子工程师学会)计算机视觉和模式识别会议(http://cvpr2016.thecvf.com/)上的论文(http://megaface.cs.washington.edu/KemelmacherMegaFaceCVPR16.pdf)对此结果进行了详细的分析。

除了一些可能干扰识别的因素,例如照明,头部方向,表情等,这篇论文甚至还关注了同一个人的细微差别与年龄差异。此外,几乎所有的算法识别儿童脸部都存在困难,这可能是因为之前的样本库中儿童比例只占很小的一部分。

我职业生涯的很大一部分时间都花在语音识别技术上,也知道最近才发现其对儿童语音的适用性并不高。事实上,早期的(1960s、1970s晚期)语音识别技术只能识别中年人、学术的、中西部的(电视新闻播音员)口音。大多数研究人员也都面临同样的问题,他们常常使用自己创建的语料库。这些存在绝对偏差的样本由Google, Nuance, AT&T这样的组织进行大规模收集并修正。

由于大量的面部识别系统都是商用的专有的,因而很难合并或完善其底层算法,即使是他们使用的训练数据都不会共享。Kemelmacher-Shlizerman指出:“这是一个巨大的问题,如果没有相似的训练数据,就没有开放的研究与竞争,就无法产生创新的技术。”

但是现在,华盛顿大学的研究人员已经创建了一个有用超过300个研究小组的联合会。随着项目的发展我们将会从megaface挑战中看到更多令人振奋的进展(http://megaface.cs.washington.edu/results/fgnetresults.html#distractorsvsrate)。敬请关注!

不久的将来,面部识别技术将会像汽车牌照阅读器/识别器/追踪器一样无处不在。(也许下次出去旅行的时候我需要带上Groucho Marx眼镜)。

Groucho Marx glasses

(注:Groucho Marx Glasses,一种伪装眼镜)

关于 “你可以识别一百万张脸吗?也许某个算法可以” 的 1 个意见

评论关闭。