AI大模型正在重新定義CPU,它除了具備更高的可靠性、穩(wěn)定性、可擴展性,還要具備更強的AI計算能力,以滿足AI大模型對計算資源的需求。同時,能效比越來越重要,這樣才能保證大模型訓練和推理過程中,能源和成本的合理支出。在這些趨勢下,CPU逐漸從傳統的通用計算能力,轉變?yōu)楦螦I大模型需求的“多面手”。
IDC表示,隨著AI應用的日益普及,預計到2027年,各組織在生成式AI(GenAI)方面的支出將高達1530億美元,而機器學習和分析的總支出將達到3610億美元。英特爾至強6處理器經過優(yōu)化,有望在這一蓬勃發(fā)展的市場中扮演重要角色,并可作為機頭節(jié)點CPU,在傳統機器學習、小型生成式AI模型和GPU加速工作負載中提供出色性能。
英特爾臨時聯合首席執(zhí)行官兼英特爾產品首席執(zhí)行官Michelle Johnston Holthaus表示,“英特爾深耕數據中心市場數十余年,并通過x86 架構引領標準制定和行業(yè)發(fā)展。目前,英特爾的處理器正為絕大多數數據中心提供動力?!?/p>
為了充分滿足市場多樣需求,英特爾不斷完善至強產品系列,日前推出了至強6性能核處理器6700/6500,實現了2倍的AI處理性能提升;同時,專為網絡和邊緣應用設計的全新至強6 SoC芯片,實現了2.4倍的無線接入網(RAN)工作負載容量提升。
至強6700/6500——提供出色性能與能效平衡
最新的至強6700/6500性能核處理器,在數據中心和網絡產品組合方面均取得了顯著進展。與上一代產品相比,至強6處理器在廣泛的企業(yè)工作負載中實現了平均1.4倍的性能提升。作為AI系統的機頭節(jié)點CPU,至強6可與GPU搭配,為客戶提供優(yōu)選組合。
此外,它以更少的核心數量,提供1.5倍的AI推理性能提升。至強6處理器還具備出色的每瓦性能效率,以五年使用周期計,平均可以實現以一臺新的服務器替代五臺舊服務器,在某些用例中該比例可達10:1,從而節(jié)省高達68%的總體擁有成本(TCO)。
上述特性使得至強6700/6500性能核處理器在性能與能效平衡方面表現更為出色,更加符合數據中心需求。
英特爾數據中心與AI集團副總裁兼中國區(qū)總經理陳葆立介紹,最新推出的6700/6500性能核處理器目標是傳統數據中心企業(yè)應用。相比高核高密度計算的大芯片,這些新品的TDP也比較適合傳統機架,比如150W-350W的TDP,在內存通道上也有8個內存通道的配置。
同時在內存技術方面,英特爾推出了MRDIMM技術,顯著提升了內存帶寬,可以更好地支持AI工作負載。MRDIMM技術是首次在至強6產品上推出,相比第五代至強的內存速度4800-5600MT/s,至強6速度提升至DDR5 6400MT/s,而、MRDIMM進一步將速率提升至8800MT/s,相比現有數據中心服務器提升超過50%。據透露,很多客戶對此表現出濃厚興趣,并正在進行快速試驗以期快速落地。
陳葆立指出,傳統AI應用如推薦引擎、語音助手和圖像識別等,適合CPU處理。全新的至強6處理器憑借多核、高內存帶寬、AI加速指令和完整軟件棧,是支持傳統AI應用的理想選擇。
對于大語言模型來說,盡管需要GPU等加速器,但每個GPU系統仍需兩顆CPU作為機頭,以加快數據傳輸,這要求CPU具備快速I/O、良好單核性能和更快內存。此外,GPU服務器長時間運行對系統穩(wěn)定性要求極高,至強處理器憑借其可靠性和穩(wěn)定性,成為智算中心和GPU服務器設計的重要選擇。
“在小于20B的模型規(guī)模下,用至強進行生成式AI的推理很有優(yōu)勢。因為對小規(guī)模大語言模型來說,推理過程在生成首個Token時需要密集計算,后續(xù)多數Token推理則對內存帶寬需求高”,英特爾技術專家補充,“至強6處理器結合MRDIMM技術,可提升性能,128核至強AP平臺性能甚至超競品50%核心平臺,MRDIMM帶寬達8800MT/s,對性價比要求高的中小模型推理重要?!?/p>
據英特爾技術專家分析,當前客戶面臨的兩類問題比較突出:一是系統老舊問題,需考慮是否更換新系統,這涉及更新TCO的ROI計算。以目前市面上應用廣泛的五年更新周期的第二代至強為例,客戶關注空間與能耗節(jié)省,更新后可實現10:1整合比例,節(jié)省約2/3的TCO,鼓勵客戶更新基礎設置。
其二,在客戶采購時,需對比市面同類產品。至強AP平臺在傳統數據、網絡服務、科學計算及AI領域性能優(yōu)于競品。至強6處理器系列,包括SP平臺的6700P和6500P系列,在傳統AI推薦系統、科學計算、網絡服務、圖像構建等業(yè)務中,帶來顯著性能提升與TCO節(jié)省。
據透露,英特爾將在2026年發(fā)布采用18A制程的下一代至強Clearwater Forest,目前進展順利,這也將會是英特爾至強處理器發(fā)展歷程中下一個重要的里程碑。
面向網絡和邊緣應用的英特爾至強6處理器SoC——提供高性能與能效
英特爾同時還推出一款面向網絡和邊緣應用的至強6處理器,它是一款系統級芯片(SoC),集成多種加速器,旨在提供高性能與能效。該產品主要面向運營商,涵蓋從辦公室到數據中心的網絡與邊緣領域,涉及多樣化工作負載,兼顧計算密度、連接性能、功耗及物理尺寸,整合了多種安全和控制功能。
由于至強6系統級芯片定位于網絡與邊緣場景,因此針對多樣化的功能特性進行了高度集成。它融合了英特爾至強6性能核處理器特性,核心數達72個,整合了多種加速器,例如:整合vRAN boost技術、英特爾媒體轉碼加速器及英特爾AMX等加速器等,實現了功耗性能的平衡優(yōu)化。
據英特爾中國網絡與邊緣事業(yè)部總經理阮伯超介紹,至強6 SoC廣泛應用于運營商網絡及網絡與邊緣領域,所實現的優(yōu)勢包括:在運算網絡中,為vRAN帶來高性能功耗比增長,如與諾基亞合作提升了70%的性能功耗比,從而幫助運營商提升了整體密度,達到2.4倍的無線接入網(RAN)工作負載容量;在AI領域,通過內置英特爾AMX使單核AI RAN性能較上一代提升3.2倍;在網絡安全領域,大幅提升Webroot CSI上傳模型推理速度,相比英特爾至強D-2899NT處理器提升最高達4.3倍。
作為首款媒體轉碼加速器的服務器SoC,至強6 SoC在編解碼時可以實現較大的性能功耗比提升。相較于英特爾至強6538N處理器,每瓦性能提升達到了14倍。同時,內置的媒體加速器也可以幫助傳統的VDI(虛擬桌面基礎架構)領域,提升媒體的處理效率,減少總體擁有成本。
值得注意的是,由于網絡與邊緣領域,智算網融合是一個重要方向。以 AI 應用為例,邊緣服務器可應用于智能工廠,助力礦山開采作業(yè),亦能用于智能攝像頭相關場景。用于這些場景的設備需要集成多種網絡功能,如 SD-WAN(軟件定義廣域網),同時整合安全功能。更為重要的是,它將各類 AI 應用集成于一體,例如智能監(jiān)控與安全監(jiān)控應用。通過性能均衡設計,將英特爾AMX和英特爾媒體轉碼加速器集成在同一設備中,通過一個38核系統可以同時支持38路攝像頭視頻流的int8推理,系統實現了功耗、性能的平衡和優(yōu)化。
AI算力需求井噴,至強6如何滿足數據中心需求?
隨著AI算力需求的不斷增長,至強6如何成為符合AI大模型需求的“多面手”?
陳葆立指出,早在大模型興起之前,AI就已經廣泛應用于數據中心,包括推薦引擎和搜索等領域,國內許多大型互聯網企業(yè)一直使用大量的至強處理器來支持這些業(yè)務。多年來,英特爾推出了多種AI加速技術,例如AMX加速器,幫助客戶提升AI計算性能。相比友商,英特爾在支持AI場景方面充滿信心,技術上也具有明顯優(yōu)勢。
面對大規(guī)模應用的GPU服務器,陳葆立認為,機頭位置的CPU選擇至關重要。因為處理大模型計算時需要著重關注兩個性能指標:一是提問后第一個回答的延遲時間,二是CPU內存帶寬,因為CPU需要快速調取數據進行分析并給出響應。
“盡管隨著更多新模型的出現,客戶對推理算力的需求增加,但并非所有場景都需要超大規(guī)模模型??蛻糸_始關注至強6處理器與MRDIMM的組合是否能在不同場景下有效支持大模型運算。我們已經證明,這種組合是可行的。盡管國內有許多不同類型的加速卡,現階段最新一代至強6處理器系列依然是客戶和合作伙伴的首選平臺,并且能夠進行更好的適配和驗證”,陳葆立強調。