近年來,3D 感知技術越來越多地應用于各行各業(yè),尤其是工業(yè)自動化、機器人、自動駕駛、醫(yī)療保健、AR/VR 和安全領域。3D 感知是用于捕捉環(huán)境與物體三維形狀并進行數字化處理的技術的統稱,而深度感知在其中起著關鍵作用。
深度感知是實現 3D 測繪、物體識別、空間感知等高級認知功能的基礎技術。對于需要精確實時處理環(huán)境與物體的形狀、位置和運動的領域,這項技術不可或缺。通過深度感知技術,可以準確獲取目標物體的位置信息,有助于實現自適應和智能化操作。
本文為第一篇,將主要介紹深度感知應用、深度感知的方法。
深度感知應用
工業(yè)自動化和機器人
隨著智能工廠的發(fā)展,深度感知正被應用于生產線的自動化和質量檢驗。它能夠捕捉傳統二維視覺難以處理的三維形狀,從而實現高精度定位和自適應控制。
協作機器人(取放)
為了準確識別和抓取隨機放置的零件,垂直方向的距離檢測至關重要。通過深度感知生成 3D 點云,并結合基于 AI 的物體識別算法,機器人就能適應環(huán)境的變化,實現精準拾取操作。
此外,確保人機協作的安全性也是一個關鍵問題。傳統上,為了安全起見,機器人工作區(qū)域的周圍會放置物理屏障;當有人靠近時,機器人必須停止工作,這會導致生產線暫停和生產效率降低。2D 攝像頭可以檢測到有物體進入工作區(qū)域,但是很難準確判斷物體靠近的距離。如果能夠獲取實時深度信息,機器人就可以在不停止生產線的情況下控制運轉速度。
自主移動機器人 (AMR) 和自動引導車輛 (AGV)
在工廠和倉庫中,負責貨物運輸的倉庫機器人 (AGV/AMR) 為了安全工作,需要識別周圍環(huán)境并確定自己的位置。SLAM(同步定位與地圖構建)技術可用于生成必要的 3D 地圖、估算機器人的位置并避開障礙物。深度感知對于 SLAM 的定位起著至關重要的作用。此外,深度感知還用于人機協作時檢測人員和動態(tài)避讓,或是用于手勢識別來實現控制目的。
測量包裹尺寸
使用深度傳感器可以實時捕捉傳送帶上移動的物料和包裹的形狀、體積與尺寸,從而有望實現產品識別和根據配送目的地分揀等流程的自動化。
檢驗和質量控制
在產品外觀檢查環(huán)節(jié),利用深度感知技術可以高精度地檢測出細微的形狀瑕疵。它能夠檢測高度方向上的異常(例如表面不規(guī)則或扭曲),而傳統的二維圖像處理很難做到這一點。
門禁控制
在門禁控制(出入口管理)和監(jiān)控系統中應用深度感知技術,可以顯著增強傳統的安全技術。深度感知在生物識別認證和非法入侵偵測等領域發(fā)揮著至關重要的作用。
3D 人臉識別(生物識別驗證)
與傳統的 2D 人臉識別相比,采用深度感知技術的 3D 人臉識別具有更高的安全性。通過利用深度傳感器和基于深度學習的人臉識別算法,可以實現以下先進的身份驗證功能:
防止深度偽造和照片偽造(利用 3D 深度信息實現反詐騙)
提高弱光和夜間環(huán)境下的識別準確度(NIR 深度傳感器)
大型設施中的實時身份驗證和監(jiān)控(同時識別多人)
非法入侵檢測
將監(jiān)控攝像頭與深度感知技術相結合,可以實現更準確的非法入侵檢測。3D 邊界監(jiān)控和人員追蹤系統在增加了距離信息后,能夠識別傳統 2D 監(jiān)控攝像頭難以檢測到的情況,從而降低誤檢的可能性。
自動駕駛汽車利用激光雷達和立體攝像頭實現深度感知,從而識別周圍環(huán)境。此技術使得汽車能夠實時了解周圍的空間情況,有助于汽車檢測障礙物和規(guī)劃行駛路徑。 此外,深度感知越來越多地用于座艙應用,例如駕駛員監(jiān)控系統 (DMS) 和乘客監(jiān)控系統 (OMS)。
AR/VR 和娛樂
VR 頭戴設備和 AR 設備利用深度感知技術識別用戶周圍環(huán)境,讓用戶實現與虛擬物體的交互。最近,飛行時間 (ToF) 傳感器的引入大幅提升了空間測繪的精度。運動捕捉技術利用深度信息可以實現流暢的運動分析,不再需要使用傳統的標記點。
圖 1. 深度感知在倉庫中的應用
醫(yī)療保健
手術輔助機器人利用深度感知技術進行實時 3D 成像,提升內窺鏡手術的精準度。結合 ToF 攝像頭和立體視覺,手術機器人可以測量器官組織的深度,從而提高手術的安全性。此外,在康復治療中,可以利用深度攝像頭分析患者的運動情況;當結合機器學習時,可以制定優(yōu)化的康復方案。
深度感知的主要方法
立體視覺
立體視覺是一種利用左右兩個攝像頭拍攝的圖像的視差來識別三維物體的技術。通過分析兩幅圖像的視差來獲取深度信息,再利用三角測量原理確定物體的距離。由于它僅依賴光線接收,因此目標物體的反射率一般不會影響測量結果。
然而,測量精度會受到攝像頭之間的距離(基線)、鏡頭的焦距和圖像傳感器的像素數量的影響。因此,攝像頭尺寸與精度之間存在反比關系。此外,在夜間或弱光條件下,測量精度通常會降低。為獲取深度信息所需的計算量相對較大。
結構光
結構光方法涉及投射特定的光圖案,并分析反射光圖案的失真度,以此獲取深度信息。通過使用高分辨率投影儀和高靈敏度 / 高分辨率 CMOS 傳感器,從多個角度捕捉圖像,可以構建高精度的 3D 掃描儀。該方法廣泛應用于機器視覺等測量應用。
獲取深度信息所需的計算量相對較大。此外,如果物體在測量過程中移動,則無法獲得準確信息,因此該方法通常不適合動態(tài)移動目標。
飛行時間 (ToF)
飛行時間法利用光線往返時間來測量深度(距離)。ToF 方法主要分為兩類:直接飛行時間 (dToF) 和間接飛行時間 (iToF)。
直接飛行時間 (dToF):直接飛行時間 (dToF) 是一種直接測量光脈沖發(fā)射后從物體反射回來所需時間的方法。通過精確測量從激光脈沖發(fā)射到反射光接收的時間,可以計算出目標的距離。該方法適合于需要長距離測量和高精度的場合,廣泛應用于自動駕駛和機器人領域,例如光檢測和測距 (LiDAR)。然而,它測量的是光脈沖的飛行時間,所以本質上測量的是點 (1D)。為了實現 2D 或 3D 成像,必須掃描光源,或者采用多個光源和光電探測器組成的陣列。因此,用這種方法實現高分辨率通常很困難。
間接飛行時間 (iToF):間接飛行時間 (iToF) 是一種通過發(fā)射調制連續(xù)光并測量反射光的相移來計算距離的方法。該技術涉及以恒定頻率調制照射光,并分析反射光的相移,從而獲取深度信息。iToF 支持同時獲取整個畫面中每個像素的距離信息,這使得實時距離測量(即錄制包含距離信息的視頻)和高分辨率成像成為可能。但是,它容易受到環(huán)境光干擾,并且測量范圍相對較短。此外,深度計算需要多次曝光,這在目標快速移動時可能會導致圖像模糊。
與其他方法相比,利用飛行時間 (ToF) 法獲取深度信息所需的計算量較小。直接飛行時間 (dToF) 技術廣泛用于 LiDAR 等眾多應用。然而,它在提高 3D 分辨率方面存在結構性挑戰(zhàn),而且成本高昂。 另一方面,間接飛行時間 (iToF) 技術雖然更容易實現高分辨率,但較易受到環(huán)境光干擾,導致應用范圍受限。
未完待續(xù),后續(xù)推文將介紹安森美的 iToF 方案:Hyperlux? ID等。