在我们都吐槽苹果的创新力在衰竭的时候,2017 年,iPhone X 带来了 FaceID 人脸识别功能,一度让上游供应商和其它手机品牌忙不迭的一波技术和产品更迭,如果不了解这里面的硬件技术,我们会直观的将这里的 FaceID 纳入生物识别的范畴,因为它也是基于人脸这一生物特征来实现。在近日的慕尼黑上海电子展期间,通过与非网记者与艾迈斯半导体 OPC 部门业务发展经理徐冰博士和旷视科技产品市场总经理沈瑄的交流,刷新了我们对 iPhone 人脸识别背后的 3D 结构光技术的认知,也让我们看到这一技术未来的更多可能性。
左:艾迈斯半导体 OPC 部门业务发展经理徐冰博士 右:旷视科技产品市场总经理沈瑄
厘清 3D 识别的概念
徐冰博士首先澄清,人脸识别的实现方式有多种,如果具体讨论 iPhone 人脸识别功能背后,采用的是 3D 结构光的技术,这种技术本身并不能等同于生物识别。
从手机的内部结构来看,除了基本的前置摄像头外,还集成了六七个传感器。其中点阵投影器会投射出高达 30000 个光点,红外镜头能就能获取人脸各个部分位置的形变数据,即脸的 “结构”,加上前置镜头记录的人脸图像,两者借助算法结合,就能得出一张精准的 3D 人脸数据图。比起单纯的基于 2D 平面图进行分析,这种三维深度数据显然更加真实有效,也更有价值。
搞清楚 3D 结构光的背后原理就会发现,人脸识别解锁,只是这一技术的一个应用场景,背后包含了对更高维度信息的掌握和运用—让手机能够感知到现实世界的 3D 信息,才是结构光技术真正想要达成的目的。
在这次疫情期间,对那些用惯了人脸识别解锁的用户而言,首先带来的不便就是手机打不开了,要回到传统的密码解锁模式。而很快我们发现多家科技公司实现了戴着口罩也可以进行人脸识别的技术。对此,徐冰博士解释,“随着技术进步,这是完全可能而且是可行的。3D 结构光这一技术是通过光打在人脸或物体上面来探测不同部分的深度,也叫人脸的特征点,不戴口罩的情况下,探测的特征点集中在耳朵、鼻子、嘴巴、眼睛这些部分,可以还原出整个人脸的轮廓特性。现在戴了口罩怎么办?当然有解决办法,就是把特征点选择在口罩以上部分,人的眼、眉毛、额头,都可以作为特征点。这时可能产生一个问题,从技术角度,这些特征点比过去少很多,怎么办?我们也有技术解决的路线。比如增加探测的特征点,因为这些特征点是通过光照上去的,将点密度增加,以上提到的眼、眉毛、额头的特征点就会体现的更加完整,更加精确。这就是随着技术进步说我们戴着口罩在某些场合某些设备是完完全全可以识别人脸的。”
沈瑄补充,“实现戴口罩解锁,关键点是在瞳孔的距离,瞳孔与鼻尖的距离,这些数据其实都在我们的设备里面,现在只是来比对口罩以上的部分。引出的另一个讨论是不戴口罩的时候,半侧脸是否也可以接受,因为现在我们必须要正对着摄像头才能接受。从误识率的角度,是完全没有任何问题的,算法已经可以完美的解决戴口罩的识别问题。”
那些问题
协同设计问题。3D 识别以及手机里各种传感部分部分的增多,引出的一个问题就是处理的数据量不断激增,带来的是端侧传感、处理等部分的协同设计问题。对此,沈瑄表示,“解决这个问题,要尽可能在端侧,包括手机的主芯片里有一个加密区,以及另一个趋势是往 sensor 端,明年会看到很多摄像头的 sensor 开始有数据处理能力,包括人工智能的计算单元在 sensor 端,可以将一些原始数据进行预处理。这样做的好处是,一方面让主芯片、边缘侧以及云端的数据量的计算减少很多;另一方面,我们会把用户的个人隐私的数据在这部分进行剥离,做不可逆的脱敏处理,也是为了保护个人隐私。这里数据量我觉得不是问题,问题还是把 sensor 端、主芯片、端侧、云侧这些分布式的算力提高上来。”
“从技术角度,在光源方面, 3D 人脸识别发出来的是主动光源,是点状的光源,用于 3D 人脸识别,有非常多的发光点,这个时候信息的处理量就非常大。”徐冰博士从上游芯片供应商的角度提到,“我们在重新设计光源,可以实现分片、分区或分条点亮,这样的处理带来两个好处,第一是数据处理量可以急剧减小,第二是明显降低功耗。”
定制和通用的未来。仅就手机厂商的 3D 人脸识别而言,也存在普遍的定制化现象,而这跟供应商想要达到的规模效应存在一定矛盾,未来是定制化还是通用产品的?“定制化带来的确实成本非常高,这个趋势现在没有根本的改变。”徐冰博士称,“从现在到将来会不会有一款标品可以用到所有的应用场景,或至少适用于相当一部分应用场景,在我看起来是完全有可能的。”事实上艾迈斯半导体正在为此努力,跟上下游的产业链合作,做一款标准的光源、探测器和 3D 的解决方案,但徐冰博士也坦言,“我们不能指望一天、两天就把这一工作完成,而且应用到所有的手机产品也是不现实的,但是我们一定会做这方面的努力。”
沈瑄从商业和市场角度解释,“厂商定制化的需求背后是希望有一些产品的独特性和差异化,但不管是消费品还是工业品,一定是以降低成本为大方向,而通用化、标准化才能规模化,才可以降低成本,这个趋势是对的;除了徐博士提到的硬件的标准化,另一个问题是现在人工智能的软件算法方面,也有很多的定制化,我们现在正在努力把各种 3D 方案做一些标准化,逐渐收敛,让软件可以更统一。”
这一过程中的阻力则在于整个供应链、产业链的共识和协作,以及终端品牌的接受度。因此徐冰博士强调,“但从长远来说,如果要实现 3D 人脸识别的普及,一定会朝标准化方向走。”
3D 识别的可能性
因为上面提到人脸识别背后的 3D 结构光技术,如果了解到这种通过 3D 空间结构探测来实现识别的技术,就可以理解除了手机,它的应用场景可以有无限的想象空间。
沈瑄表示,“手机当然是最大的市场,但其实只要有摄像头的地方,都可以做人脸识别。包括安防、无人机、家电,包括现在量不大,但未来有很大市场空间的汽车电子,以及智能家居,除了电视外,像音箱、扫地机、门锁里越来越多的涉及到人脸识别。”
“车载是想象力无限的 3D 应用场景。”徐冰博士把 3D 识别的可能从人脸放大到更多的空间:
第一,无人驾驶,开始一定是有人的,需要对驾驶员做人体检测,出现异常情况时,如过度疲劳或酒驾,可以根据人脸识别做出及时的处理,还可以对车内乘客进行检测,这是在车内的场景;
第二,车周围环境的检测,如果考虑小范围内,可以通过 3D 检测来实现自动倒车入库,也是自动驾驶的一部分。但如果把探测的距离拉长到 100 米、150 米,将助推真正的自动驾驶。这将给人们的生活和社会经济结构带来巨大的改变,包括“首先,家里是不是还需要拥有车辆?如果拥有车辆需要两辆及以上吗?我想一辆车绝对够了。可以实现社会资源的统一安排,可以想像通过 3D 检测,无人车在路上像一个车队前后连在一起,车距非常近,车跟车之间可以相互交流,车的密度可以非常高,车速会非常快,这样整个社会的车辆保有量会非常低,将完全颠覆我们现在的社会形态。”
这里谈到的是近场和远场检测的概念,有了这一概念的拓展,3D 检测在未来的想象空间确认无限。