AI算法加碼純視覺方案,自動駕駛會否迎來新轉折?

2022/12/26
935
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

/?導讀?/

作為全球資本市場的風口,自動駕駛從來都不曾離開舞臺的中央。

自動駕駛主要包括感知、決策和執(zhí)行三個環(huán)節(jié)。其中,周邊態(tài)勢的感知,作為自動駕駛控制系統(tǒng)的輸入,重要性不言而喻。更早以及更加精準的信息輸入,將幫助自動駕駛控制器盡快做出一個準確的決策,調整車輛姿態(tài)來實現(xiàn)自動駕駛功能。

但在汽車自動駕駛領域,周邊態(tài)勢感知的技術路線選擇之爭從來就沒有停歇過。以特斯拉為最知名的代表是純視覺方案的堅定擁護者,至于國內很多企業(yè)則是視覺加雷達融合方案的擁躉。在線控底盤方案已經(jīng)非常成熟且自動駕駛軟件平臺日趨完善的大背景下,對于周邊態(tài)勢的感知正在成為自動駕駛領域中的一個受到越來越多關注的分支。

得到全球公認的NuScenes數(shù)據(jù)集

NuScenes數(shù)據(jù)集是由現(xiàn)代汽車集團和Aptiv資成立的一家無人駕駛公司Motional開發(fā),該數(shù)據(jù)集在2019年3月開源,填補了彼時自動駕駛汽車行業(yè)尚無大規(guī)模多模態(tài)數(shù)據(jù)集的空白。目前,NuScenes是被全球各大自動駕駛領域相關公司引用最多的數(shù)據(jù)集,其權威性得到各方的認同。

基于NuScenes數(shù)據(jù)集的NuScenes挑戰(zhàn)賽,也已經(jīng)成為檢驗感知算法在自動駕駛相關任務性能的試金石。我們所熟知的全球范圍內多家自動駕駛領域的知名企業(yè)及知名高校在NuScenes挑戰(zhàn)賽中進行了相關測試結果的提交,諸如卡內基梅隆大學、加利福尼亞大學伯克利分校、MIT等。作為自動駕駛AI感知算法的一個重要的比拼舞臺,大家通過NuScenes挑戰(zhàn)賽這樣一個“試金石”平臺,同場競技,來了解自己所處的位置以及競爭對手的狀態(tài),進而達到共同促進自動駕駛感知技術發(fā)展的目標。

3D目標檢測任務是自動駕駛感知性能的關鍵指標

在NuScenes數(shù)據(jù)集中,相關評測任務包括了3D 目標檢測、3D 目標跟蹤、預測軌跡 、激光雷達分割、全景分割和跟蹤。其中, 3D目標檢測任務是最為重要的一個評測指標。

和普通的對于周邊物體感知不同,自動駕駛所面臨的是一個包含時間軸在內的4維坐標空間。所以自動駕駛感知系統(tǒng)不僅需要判斷周邊物體的遠近和大小,同時也還需要判斷這些物體是靜止的還是運動的,以及他們的運動方向和速度。這對于自動駕駛軟件算法進行下一步路徑的預判至關重要。

NuScenes數(shù)據(jù)集的3D目標檢測任務,覆蓋了包括汽車、卡車、公交車、行人等10種我們在日常出行中會遇到的絕大部分檢測對象。通過為它們標出3D目標框,并估計出相應類別的屬性信息和當前的速度信息等,NuScenes提出了一個綜合指標NDS (NuScenes Detection Score, NDS)。這個指標由平均精度(mAP)、平均平移誤差(ATE)、平均尺度誤差(ASE)、平均方向誤差(AOE)、平均速度誤差(AVE)和平均屬性誤差(AAE)綜合計算得到,成為衡量自動駕駛對于周邊物體識別的一個比較客觀公正的評價指標。

純視覺方案的優(yōu)勢在哪里?

自動駕駛系統(tǒng)中,感知系統(tǒng)的硬件是由一系列的傳感器組成,主要包括攝像頭、超聲波雷達、毫米波雷達和激光雷達等。它們作為自動駕駛系統(tǒng)的“眼睛”,構成了整個自動駕駛系統(tǒng)的輸入,其中最核心的就是攝像頭和激光雷達。

當前,在自動駕駛領域,感知系統(tǒng)的技術路線選擇的爭議從來沒有平息過。作為全球知名的車企,特斯拉一直是純視覺方案堅定的支持者。而國內不少整車企業(yè),目前都采用了采用雷達加攝像頭的融合方案來實現(xiàn)3D目標任務檢測。

兩種技術路線各有優(yōu)劣

視覺+雷達方案的最大優(yōu)勢來源于激光雷達。激光雷達采集的點云信息與生俱來就存儲了三維空間信息,因此基于激光點云信息的3D目標檢測任務實現(xiàn)出來相對就簡單了許多。但是這套方案也有自己比較明顯的劣勢:

1.較高的成本:激光雷達較高的成本,始終是阻礙其在車型上商業(yè)化部署的最大制約因素。最早的Velodyne的激光雷達高達8萬美元一個,讓其始終停留在測試車上。而如今雖然固態(tài)激光雷達成本大幅下降,但依然是整車不可忽視的一個零部件成本支出。

2.數(shù)據(jù)融合難度不小:攝像頭和雷達的數(shù)據(jù)結構并不相同,將兩者采集的數(shù)據(jù)進行融合,給到自動駕駛控制器最為準確的黃靜信號輸入,對數(shù)據(jù)融合算法也是不小的考驗。

至于純視覺解決方案,其最大的優(yōu)勢在于較低的成本。特斯拉所使用的單目攝像頭單件成本不過25美元,全車搭載8個的話,費用也只有200美元。對于需要大規(guī)模商業(yè)化部署的整車,成本從來就不是一個可以忽略的難題。過高的成本,必然會阻礙消費者的購買意愿,讓相關的技術方案只能停留在實驗室階段。另外,純視覺解決方案依托技術可帶來比較客觀的迭代提升及較大的上升空間。隨著AI技術的提升,純視覺3D目標檢測算法能夠得以優(yōu)化提升。

但視覺方案也有自己的不足,這個來源于攝像頭自身的缺陷:無論是對于靜態(tài)的物體還是對于識別紋理或者色彩信息較為豐富的物體時,都會顯得力不從心。但攝像頭的天生缺陷也可以用來彌補。通過更為強大的AI算法以及更多的實際道路場景數(shù)據(jù)的積累,能夠幫助純視覺方案在辨識周邊道路情況時能夠更加游刃有余。所以當AI算法達到一定的成熟度可以滿足自動駕駛對于周邊環(huán)境態(tài)勢感知的要求之后,純視覺方案就可以被部署在高等級自動駕駛系統(tǒng)上,來為整車企業(yè)提供一個可以同時兼顧商業(yè)化部署和周邊態(tài)勢感知要求的技術方案。

浪潮信息AI算法實現(xiàn)監(jiān)測精度大幅度提升

今年10月,在最新一期NuScenes所公布的競賽測評榜單中,浪潮信息憑借DABNeT4D登頂自動駕駛數(shù)據(jù)集NuScenes 純視覺3D目標檢測任務榜單,引發(fā)了極大的關注。

在這次3D目標檢測任務中,浪潮信息的DABNet4D算法的NDS檢測精度達到了0.624,相比于年初的NDS精度是0.474的BEV3D算法提升了15%。在同一時期,激光雷達的NDS精度從年初的0.685提升到0.728,提升約4個點。通過簡單的數(shù)據(jù)比對就可以發(fā)現(xiàn),浪潮信息AI的純視覺檢測精度在數(shù)值上正在大幅迫近激光雷達,而這背后都是AI算法的功勞。

浪潮信息此次所提交的算法DABNet4D是Depth-awared BEVNet 4D的縮寫,即深度感知的四維鳥瞰圖(bird’s eye view, BEV)神經(jīng)網(wǎng)絡,其核心本質就是鳥瞰圖。

傳統(tǒng)的純視覺方案,是依靠布置在車身的攝像頭來采集信息。然后通過對于每個攝像頭數(shù)據(jù)的融合,來實現(xiàn)對車輛周邊態(tài)勢的感知。但這種策略最大的一個弊端在于一旦遇到比較體積較大的卡車時,會導致每個攝像頭只能捕捉到卡車的一部分的情況,以致出現(xiàn)錯判和漏檢的情況發(fā)生。這種情況下,浪潮信息AI團隊引入了鳥瞰圖,即通過上帝視角,來把不同水平視角的圖像融合成一個統(tǒng)一的以自動駕駛車輛為中心的俯視視角的特征圖。這樣就可以最清晰和完整地為自動駕駛控制器提供車輛周邊的情況。在遇到體積較大的物體時,3D目標檢測以及其他的檢測、分類、分割等視覺感知任務就能夠非常輕松地完成。

但要獲得上帝視角的鳥瞰圖的構建并非一蹴而就。浪潮信息AI團隊早在今年年初就構建了一個基于Transformer架構的多視角特征融合模型CBTR、MASTER(Multi-camerA Spatial and Temporal feature ExtractoR,多相機時空特征提取器)算法、并在MASTER算法的基礎上進一步引入了深度估計網(wǎng)絡等等,最終實現(xiàn)了更為高效穩(wěn)定的BEV(鳥瞰圖)輸出。此外,通過圖像數(shù)據(jù)增強、BEV特征增強和樣本貼圖增強等多尺度的數(shù)據(jù)增強技術等,提升模型的檢測效果,進而持續(xù)助力DABNet4D算法在NuScenes數(shù)據(jù)集中的優(yōu)異表現(xiàn)。

總結

浪潮此次打榜成功的DABNet4D算法,讓我們看到了感知層的另一個解決思路方案:通過對于態(tài)勢感知算法的持續(xù)優(yōu)化,來不斷提升純視覺方案的辨識精度,為純視覺方案在自動駕駛領域的部署蹚出了一條新的道路。

在滾滾向前的自動駕駛浪潮中,作為全球領先級AI算力基礎設施提供商,浪潮不僅在于利用自己過往在服務器這樣的硬件領域的優(yōu)勢,持續(xù)強化自己硬件平臺協(xié)同優(yōu)勢,同時也正在大力提升自己在AI算法方面的競爭力,通過算法優(yōu)化來提升相關的效率,雙向賦能,提升橫跨軟硬件的集群優(yōu)勢。從NuScenes榜單技術的快速迭代來看,我們有理由相信,隨著算力、算法的持續(xù)型突破,自動駕駛產(chǎn)業(yè)化落地進程也將多一層“騰飛動力之源”。而這些,也都是車企所關注的方向,也是未來車企發(fā)展智能駕駛能力的關鍵。

相關推薦