在我們都吐槽蘋果的創(chuàng)新力在衰竭的時候,2017 年,iPhone X 帶來了 FaceID 人臉識別功能,一度讓上游供應商和其它手機品牌忙不迭的一波技術和產品更迭,如果不了解這里面的硬件技術,我們會直觀的將這里的 FaceID 納入生物識別的范疇,因為它也是基于人臉這一生物特征來實現(xiàn)。在近日的慕尼黑上海電子展期間,通過與非網記者與艾邁斯半導體 OPC 部門業(yè)務發(fā)展經理徐冰博士和曠視科技產品市場總經理沈瑄的交流,刷新了我們對 iPhone 人臉識別背后的 3D 結構光技術的認知,也讓我們看到這一技術未來的更多可能性。
左:艾邁斯半導體 OPC 部門業(yè)務發(fā)展經理徐冰博士 右:曠視科技產品市場總經理沈瑄
厘清 3D 識別的概念
徐冰博士首先澄清,人臉識別的實現(xiàn)方式有多種,如果具體討論 iPhone 人臉識別功能背后,采用的是 3D 結構光的技術,這種技術本身并不能等同于生物識別。
從手機的內部結構來看,除了基本的前置攝像頭外,還集成了六七個傳感器。其中點陣投影器會投射出高達 30000 個光點,紅外鏡頭能就能獲取人臉各個部分位置的形變數(shù)據(jù),即臉的 “結構”,加上前置鏡頭記錄的人臉圖像,兩者借助算法結合,就能得出一張精準的 3D 人臉數(shù)據(jù)圖。比起單純的基于 2D 平面圖進行分析,這種三維深度數(shù)據(jù)顯然更加真實有效,也更有價值。
搞清楚 3D 結構光的背后原理就會發(fā)現(xiàn),人臉識別解鎖,只是這一技術的一個應用場景,背后包含了對更高維度信息的掌握和運用—讓手機能夠感知到現(xiàn)實世界的 3D 信息,才是結構光技術真正想要達成的目的。
在這次疫情期間,對那些用慣了人臉識別解鎖的用戶而言,首先帶來的不便就是手機打不開了,要回到傳統(tǒng)的密碼解鎖模式。而很快我們發(fā)現(xiàn)多家科技公司實現(xiàn)了戴著口罩也可以進行人臉識別的技術。對此,徐冰博士解釋,“隨著技術進步,這是完全可能而且是可行的。3D 結構光這一技術是通過光打在人臉或物體上面來探測不同部分的深度,也叫人臉的特征點,不戴口罩的情況下,探測的特征點集中在耳朵、鼻子、嘴巴、眼睛這些部分,可以還原出整個人臉的輪廓特性?,F(xiàn)在戴了口罩怎么辦?當然有解決辦法,就是把特征點選擇在口罩以上部分,人的眼、眉毛、額頭,都可以作為特征點。這時可能產生一個問題,從技術角度,這些特征點比過去少很多,怎么辦?我們也有技術解決的路線。比如增加探測的特征點,因為這些特征點是通過光照上去的,將點密度增加,以上提到的眼、眉毛、額頭的特征點就會體現(xiàn)的更加完整,更加精確。這就是隨著技術進步說我們戴著口罩在某些場合某些設備是完完全全可以識別人臉的?!?/p>
沈瑄補充,“實現(xiàn)戴口罩解鎖,關鍵點是在瞳孔的距離,瞳孔與鼻尖的距離,這些數(shù)據(jù)其實都在我們的設備里面,現(xiàn)在只是來比對口罩以上的部分。引出的另一個討論是不戴口罩的時候,半側臉是否也可以接受,因為現(xiàn)在我們必須要正對著攝像頭才能接受。從誤識率的角度,是完全沒有任何問題的,算法已經可以完美的解決戴口罩的識別問題?!?/p>
那些問題
協(xié)同設計問題。3D 識別以及手機里各種傳感部分部分的增多,引出的一個問題就是處理的數(shù)據(jù)量不斷激增,帶來的是端側傳感、處理等部分的協(xié)同設計問題。對此,沈瑄表示,“解決這個問題,要盡可能在端側,包括手機的主芯片里有一個加密區(qū),以及另一個趨勢是往 sensor 端,明年會看到很多攝像頭的 sensor 開始有數(shù)據(jù)處理能力,包括人工智能的計算單元在 sensor 端,可以將一些原始數(shù)據(jù)進行預處理。這樣做的好處是,一方面讓主芯片、邊緣側以及云端的數(shù)據(jù)量的計算減少很多;另一方面,我們會把用戶的個人隱私的數(shù)據(jù)在這部分進行剝離,做不可逆的脫敏處理,也是為了保護個人隱私。這里數(shù)據(jù)量我覺得不是問題,問題還是把 sensor 端、主芯片、端側、云側這些分布式的算力提高上來。”
“從技術角度,在光源方面, 3D 人臉識別發(fā)出來的是主動光源,是點狀的光源,用于 3D 人臉識別,有非常多的發(fā)光點,這個時候信息的處理量就非常大?!毙毂┦繌纳嫌涡酒痰慕嵌忍岬剑拔覀冊谥匦略O計光源,可以實現(xiàn)分片、分區(qū)或分條點亮,這樣的處理帶來兩個好處,第一是數(shù)據(jù)處理量可以急劇減小,第二是明顯降低功耗?!?/p>
定制和通用的未來。僅就手機廠商的 3D 人臉識別而言,也存在普遍的定制化現(xiàn)象,而這跟供應商想要達到的規(guī)模效應存在一定矛盾,未來是定制化還是通用產品的?“定制化帶來的確實成本非常高,這個趨勢現(xiàn)在沒有根本的改變?!毙毂┦糠Q,“從現(xiàn)在到將來會不會有一款標品可以用到所有的應用場景,或至少適用于相當一部分應用場景,在我看起來是完全有可能的?!笔聦嵣习~斯半導體正在為此努力,跟上下游的產業(yè)鏈合作,做一款標準的光源、探測器和 3D 的解決方案,但徐冰博士也坦言,“我們不能指望一天、兩天就把這一工作完成,而且應用到所有的手機產品也是不現(xiàn)實的,但是我們一定會做這方面的努力?!?/p>
沈瑄從商業(yè)和市場角度解釋,“廠商定制化的需求背后是希望有一些產品的獨特性和差異化,但不管是消費品還是工業(yè)品,一定是以降低成本為大方向,而通用化、標準化才能規(guī)?;?,才可以降低成本,這個趨勢是對的;除了徐博士提到的硬件的標準化,另一個問題是現(xiàn)在人工智能的軟件算法方面,也有很多的定制化,我們現(xiàn)在正在努力把各種 3D 方案做一些標準化,逐漸收斂,讓軟件可以更統(tǒng)一?!?/p>
這一過程中的阻力則在于整個供應鏈、產業(yè)鏈的共識和協(xié)作,以及終端品牌的接受度。因此徐冰博士強調,“但從長遠來說,如果要實現(xiàn) 3D 人臉識別的普及,一定會朝標準化方向走?!?/p>
3D 識別的可能性
因為上面提到人臉識別背后的 3D 結構光技術,如果了解到這種通過 3D 空間結構探測來實現(xiàn)識別的技術,就可以理解除了手機,它的應用場景可以有無限的想象空間。
沈瑄表示,“手機當然是最大的市場,但其實只要有攝像頭的地方,都可以做人臉識別。包括安防、無人機、家電,包括現(xiàn)在量不大,但未來有很大市場空間的汽車電子,以及智能家居,除了電視外,像音箱、掃地機、門鎖里越來越多的涉及到人臉識別?!?/p>
“車載是想象力無限的 3D 應用場景。”徐冰博士把 3D 識別的可能從人臉放大到更多的空間:
第一,無人駕駛,開始一定是有人的,需要對駕駛員做人體檢測,出現(xiàn)異常情況時,如過度疲勞或酒駕,可以根據(jù)人臉識別做出及時的處理,還可以對車內乘客進行檢測,這是在車內的場景;
第二,車周圍環(huán)境的檢測,如果考慮小范圍內,可以通過 3D 檢測來實現(xiàn)自動倒車入庫,也是自動駕駛的一部分。但如果把探測的距離拉長到 100 米、150 米,將助推真正的自動駕駛。這將給人們的生活和社會經濟結構帶來巨大的改變,包括“首先,家里是不是還需要擁有車輛?如果擁有車輛需要兩輛及以上嗎?我想一輛車絕對夠了。可以實現(xiàn)社會資源的統(tǒng)一安排,可以想像通過 3D 檢測,無人車在路上像一個車隊前后連在一起,車距非常近,車跟車之間可以相互交流,車的密度可以非常高,車速會非??欤@樣整個社會的車輛保有量會非常低,將完全顛覆我們現(xiàn)在的社會形態(tài)?!?/p>
這里談到的是近場和遠場檢測的概念,有了這一概念的拓展,3D 檢測在未來的想象空間確認無限。