作者:北京華興萬邦管理咨詢有限公司 翔煜 商瑞
智能汽車時代的加速到來,使車載智能系統(tǒng)面臨前所未有的算力需求。隨著越來越多車型引入電子電氣架構(gòu)轉(zhuǎn)向中心化、智能駕駛的多傳感器融合、智能座艙的多模態(tài)交互以及生成式AI驅(qū)動的虛擬助手等創(chuàng)新技術(shù),都要求車用主芯片能夠同時勝任圖形渲染、AI推理和安全計算等多重任務(wù)。當(dāng)下,功能安全、高效高靈活性的算力、產(chǎn)品生命周期,以及軟件生態(tài)兼容性這“四大核心要素”,已成為衡量智能汽車AI芯片創(chuàng)新力和市場競爭力的核心標(biāo)準(zhǔn)。
傳統(tǒng)汽車計算架構(gòu)中,往往采用CPU與GPU或/和NPU等計算單元組成異構(gòu)計算模式;隨著自動駕駛算法從L1向L5快速演進對軟件適配性的要求越來越高,以及不斷有新的傳感器和信息娛樂設(shè)備加入車內(nèi),不同的架構(gòu)開始出現(xiàn)不同的發(fā)展軌跡。同時,系統(tǒng)復(fù)雜性快速提升、大量的數(shù)據(jù)搬運、資源調(diào)度協(xié)同難度提升和軟件快速迭代等新挑戰(zhàn)開始出現(xiàn),使缺乏靈活性的硬件架構(gòu)成為了在技術(shù)、安全和成本等多個方面制約汽車智能化發(fā)展的瓶頸。
市場急需一種既能靈活地提供高性能、高效圖形與AI加速能力,同時滿足功能安全標(biāo)準(zhǔn)、可與廣泛的軟件生態(tài)對接且總成本更低的車用芯片架構(gòu)。
功能安全不僅關(guān)乎安全也是芯片成本控制關(guān)鍵
功能安全永遠(yuǎn)是消費者、主機廠、Tier-1和芯片供應(yīng)商首先關(guān)心的問題,但它并不是一個智能駕駛技術(shù)快速發(fā)展進程中才出現(xiàn)的問題;行業(yè)已經(jīng)形成了完善的ISO26262標(biāo)準(zhǔn)和ASIL認(rèn)證體系,以及鎖步(Lock-Step)和雙套硬件結(jié)果對比等解決方案。但是隨著車用芯片中的CPU、GPU和NPU越來越復(fù)雜并占用更大面積,這些原本為MCU提供的功能安全解決方案的硅成本和復(fù)雜性都大幅提升,因此市場需要在汽車芯片功能安全解決方案領(lǐng)域?qū)崿F(xiàn)創(chuàng)新。
作為汽車電子領(lǐng)域的一項創(chuàng)新產(chǎn)品,Imagination DXS GPU IP專注于智能座艙與自動駕駛場景的深度優(yōu)化,其設(shè)計充分體現(xiàn)了業(yè)界近期在功能安全方面的巨大突破,同時確保了性能的提升、安全性的增強以及芯片成本的有效控制。Imagination DXS GPU的峰值性能較前一代產(chǎn)品提升了50%,算力從單核的0.25TFLOPS擴展至1.5TFLOPS,最高可達(dá)6TFLOPS和24TOPS,同時支持高達(dá)192GPixel/s的圖形渲染速率。
在功能安全的實現(xiàn)上,Imagination DXS GPU采用了針對GPU運算開放的分布式安全機制(DSM),僅以10%的面積開銷就實現(xiàn)了ISO 26262 ASIL-B功能安全認(rèn)證。DSM利用了處理器的并行特性,在空閑周期運行安全測試,既保證了性能不受影響,又確保了安全,打破了鎖步和備份等傳統(tǒng)安全設(shè)計的局限性。這一創(chuàng)新設(shè)計從架構(gòu)層面闡釋了功能安全領(lǐng)域仍然存在著許多創(chuàng)新機會,可以幫助越來越先進的GPU在安全保障、系統(tǒng)復(fù)雜性、成本控制與下游廠商獲得認(rèn)證等多個方面創(chuàng)造價值。
正是因為Imagination DXS GPU在功能安全性和計算性能等方面實現(xiàn)了開創(chuàng)性的突破,在2025年5月于上海舉辦的 “第十二屆汽車電子創(chuàng)新大會暨汽車芯片產(chǎn)業(yè)生態(tài)發(fā)展論壇(AEIF 2025)”上,Imagination DXS GPU IP憑借其創(chuàng)新的、先進的GPU技術(shù),
榮獲“2025 汽車電子?金芯獎-新銳產(chǎn)品”殊榮。據(jù)了解,從該公司的D系列GPU IP產(chǎn)品開始,包括最新的公布了架構(gòu)的E系列中的車用GPU IP都將采用這種成本和復(fù)雜性都具有明顯優(yōu)勢的分布式功能安全機制。目前,DXS GPU IP已集成于瑞薩R-Car Gen 5系列SoC中,助力智能駕駛技術(shù)的商業(yè)應(yīng)用,滿足從入門級到旗艦車型的全方位需求。
高靈活性的高效算力是車用處理器的核心功能
對于車用芯片設(shè)計企業(yè),為了處理越來越復(fù)雜的AI計算和圖形渲染,在其計算芯片中采用GPU或者NPU這樣的并行處理器成為了必然;然而隨著汽車電子電氣架構(gòu)從域控制轉(zhuǎn)向中央控制,車用核心處理器不僅需要更高的算力,而且還需要針對不同的應(yīng)用可以在架構(gòu)上靈活地進行優(yōu)化,也就是需要性能更高、同時又不會被鎖死在NPU或者GPU架構(gòu)上的靈活架構(gòu),這也成了汽車和其他很多邊緣AI應(yīng)用中高性能并行計算的發(fā)展方向。
對于這種可以針對應(yīng)用進行優(yōu)化和定義的并行計算處理器架構(gòu),依然是Imagination憑借其技術(shù)前瞻性和能力,而重新定義了面向汽車和端側(cè)AI的高性能并行計算行業(yè)標(biāo)準(zhǔn)。2025年5月,Imagination推出了專為端側(cè)智能場景設(shè)計的新一代E系列(E-Series) GPU IP架構(gòu),該系列GPU憑借其高效的并行處理架構(gòu),在提供卓越圖形性能的同時,針對人工智能工作負(fù)載具備靈活算力擴展能力。
E系列GPU架構(gòu)集成了神經(jīng)核(Neural Cores)和爆發(fā)式處理器(Burst Processors),支持算力從2TOPS靈活擴展至200TOPS(INT8/FP8),滿足從基礎(chǔ)端側(cè)計算到高階智駕的多樣化算力需求。這樣的架構(gòu)設(shè)計使Imagination E系列GPU同時具有了NPU的高性能和GPU的高靈活性;通過優(yōu)化指令調(diào)度和數(shù)據(jù)復(fù)用機制,端側(cè)計算的平均功耗效率提升了 35%,在相同算力條件下,車載系統(tǒng)的功耗降低了20%。
這種高效且靈活的AI算力及圖形處理功能調(diào)配,完美貼合了在包括汽車在內(nèi)的端側(cè)AI場景中同時存在大量的AI計算與圖形處理需求的應(yīng)用,優(yōu)化了中央計算模式下核心車用芯片同時處理駕駛和座艙需求的性能與能耗。此外,通過升級硬件級虛擬化技術(shù),E系列GPU IP支持多達(dá)16個虛擬機任務(wù)隔離,實現(xiàn)了AI、圖形、UI等多任務(wù)的異步并行處理,確保了智能座艙多系統(tǒng)協(xié)同工作和自動駕駛多任務(wù)并行處理的車用場景需求。以“高靈活性的高效算力”為核心,E-Series GPU不僅滿足了未來智能汽車車用處理器的算力需求,并推動了汽車智能化體驗的進一步提升。
更長的產(chǎn)品生命周期:GPU 架構(gòu)的可編程性打破總成本困局
隨著智能駕駛和智能座艙技術(shù)從旗艦車型向中低端車型的滲透,主機廠對芯片成本的嚴(yán)格控制正在推動行業(yè)打破傳統(tǒng)開發(fā)模式的局限性。根據(jù)行業(yè)數(shù)據(jù),傳統(tǒng)車用計算芯片的開發(fā)成本高達(dá)2億-3億美元,研發(fā)周期長達(dá)3~5年。在算法需要迭代時,固定功能架構(gòu)的NPU芯片必須重新流片,每次迭代的成本占到初始開發(fā)費用的40%~50%。這種“高投入、長周期、低彈性”的開發(fā)模式,在主機廠追求“一款芯片滿足多車型10年生命周期”的目標(biāo)面前,明顯暴露出成本上的限制。
因此,相對于從架構(gòu)到功能都基本固定的基于NPU車用控制芯片,采用GPU IP的車用芯片可以更加從容地去面對這樣的總成本壓力,因為采用GPU的硬件設(shè)計可以通過更高的可編程性來實現(xiàn)跨算法、跨廠商和跨車型應(yīng)用,用更大數(shù)量的市場應(yīng)用來攤低高昂的芯片研發(fā)成本,因而基于GPU架構(gòu)的車用芯片比基于NPU的車用芯片擁有更長的產(chǎn)品生命周期和更高的應(yīng)用靈活性。
當(dāng)然,如果車用芯片中GPU本身的AI計算與圖形處理能力就可以靈活配置,那么還會帶來更高的成本節(jié)省和更長的產(chǎn)品生命周期。以Imagination在其GPU IP產(chǎn)品中推動的可編程泛化架構(gòu)以及由此開發(fā)的E系列GPU為例,其通過軟件定義硬件的設(shè)計,可將芯片硬件生命周期延長至10年以上:當(dāng)AI模型升級時,僅需數(shù)月軟件適配即可完成迭代,較傳統(tǒng)NPU迭代方案大幅減少。這種統(tǒng)一計算單元設(shè)計可跨汽車、工業(yè)等幾大場景復(fù)用,硬件設(shè)計成本降低40%,研發(fā)投入回收周期顯著縮短。
開放軟件生態(tài):一次開發(fā)、多場景部署
軟件生態(tài)和可適配性正在變成各種高性能計算的重要門檻,英偉達(dá)的CUDA生態(tài)使其在AI計算和汽車芯片方面占盡了先機。因此,其他的汽車和端側(cè)AI芯片廠商要在市場中斬獲更多份額,就需要其核心計算單元IP提供商構(gòu)建更加開放的軟件生態(tài);隨著諸多基于此目的的標(biāo)準(zhǔn)組織不斷建立和壯大,其中的主要玩家正在支持新一代車用芯片開發(fā)商解決軟件生態(tài)的問題。
例如,Imagination就構(gòu)建了一個面向未來的開放體系,其核心優(yōu)勢在于“一次開發(fā),多場景部署”。其算力可以通過OpenCL、Vulkan等主流API直接調(diào)用,開發(fā)者利用oneAPI、Apache TVM等工具鏈,可以輕松地將工作負(fù)載遷移到E系列GPU中的神經(jīng)核。這種可編程性不僅大幅降低了跨平臺開發(fā)的成本,還賦予了設(shè)備適應(yīng)未來算法變革的靈活性。面對生成式AI、多模態(tài)交互等前沿應(yīng)用的快速迭代,E系列GPU無需硬件迭代,僅通過軟件升級就能迅速適應(yīng),確保產(chǎn)品持續(xù)滿足新興需求。
在自動駕駛領(lǐng)域,Imagination的GPU IP同樣遵循“一次開發(fā),多場景部署”的理念。通過集成FP16流水線以及imgBLAS、imgNN等高效計算庫,顯著提升了雷達(dá)點云數(shù)據(jù)、視覺SLAM等傳感器數(shù)據(jù)的處理速度,有效減輕了CPU和NPU的負(fù)擔(dān)。同時,通過與OpenCL、Vulkan等開放標(biāo)準(zhǔn)以及CoreAVI安全驅(qū)動的兼容,確保了在復(fù)雜場景下系統(tǒng)的實時響應(yīng)和穩(wěn)定運行,使技術(shù)能力貫穿智能座艙、自動駕駛等多個場景,鞏固了跨場景部署的技術(shù)基礎(chǔ)。
結(jié)語
從Imagination的E系列GPU等產(chǎn)品實現(xiàn)的架構(gòu)創(chuàng)新來看,用于智能汽車等端側(cè)應(yīng)用的AI芯片也在重塑其技術(shù)邏輯,更揭開了端側(cè)AI計算革命的序幕。在智能汽車領(lǐng)域,功能安全、高效靈活的算力、生命周期管理與開放軟件生態(tài)這四大要素構(gòu)建的技術(shù)護城河,正推動行業(yè)從“硬件堆砌”向“智能進化”轉(zhuǎn)型;而在更廣闊的端側(cè) AI場景中,,這種“軟件定義硬件”的理念正在幫助消費電子、工業(yè)物聯(lián)網(wǎng)、智慧城市和智能商業(yè)等邊緣計算等領(lǐng)域全面擁抱AI技術(shù)。
這種變革的深層意義,在于打破了“云-邊-端”的技術(shù)壁壘。當(dāng)智能汽車的GPU架構(gòu)能夠通過軟件升級支持智慧城市的交通調(diào)度算法,當(dāng)工業(yè)設(shè)備的計算單元可復(fù)用至消費電子的AI交互場景,端側(cè)AI正從單一功能模塊進化為“可生長的智能體”。可進化的端側(cè)芯片將如同今日的CPU般,成為所有智能設(shè)備的“數(shù)字大腦”。