2022年11月底,ChatGPT的橫空出世,讓生成式人工智能技術(shù)迅速席卷全球。目前,ChatGPT已經(jīng)更新迭代至第四代,最新一代的ChatGPT在規(guī)模、知識(shí)廣度、交互能力和自我修正能力等方面較之其發(fā)布之初有了很大提升。此外,由于ChatGPT的風(fēng)靡,也讓許多科技公司競(jìng)相推出相關(guān)競(jìng)品。
這些大語(yǔ)言模型都有一個(gè)共同點(diǎn),那就是都需要龐大的數(shù)據(jù)進(jìn)行訓(xùn)練和推理。據(jù)公開(kāi)資料顯示,2022年11月發(fā)布的ChatGPT是基于GPT 3.5架構(gòu)進(jìn)行訓(xùn)練的,而ChatGPT 3包含的參數(shù)就已經(jīng)達(dá)1750億個(gè),最新一代的ChatGPT 4的參數(shù)更是已經(jīng)增加至1.6萬(wàn)億個(gè),呈指數(shù)級(jí)增長(zhǎng)趨勢(shì)。
據(jù)相關(guān)數(shù)據(jù)顯示,過(guò)去四年,大模型參數(shù)量以年均400%的復(fù)合增長(zhǎng)率增長(zhǎng),AI算力需求的增長(zhǎng)也超過(guò)15倍。如此龐大的數(shù)據(jù)量,以CPU為中心的傳統(tǒng)計(jì)算基礎(chǔ)設(shè)施已經(jīng)無(wú)法滿(mǎn)足需求,需要有新一代的人工智能基礎(chǔ)設(shè)施來(lái)支撐這些大模型的訓(xùn)練和推理,以及生成式AI應(yīng)用的規(guī)?;涞亍?/p>
IDC研究副總裁Peter Rutten表示:“IDC的研究表明,專(zhuān)用基礎(chǔ)設(shè)施的構(gòu)建不足或缺乏,往往是AI項(xiàng)目失敗的主要原因。”
人工智能支柱——數(shù)據(jù)中心需求激增
隨著人工智能,尤其是生成式人工智能熱潮的持續(xù)升溫,帶來(lái)了巨大的算力需求,而數(shù)據(jù)中心作為人工智能技術(shù)發(fā)展的主要基礎(chǔ)設(shè)施之一,它可以為人工智能提供硬件基礎(chǔ)和海量的數(shù)據(jù)資源,同時(shí)也為人工智能提供強(qiáng)大的計(jì)算能力。但以往的數(shù)據(jù)中心主要是為社會(huì)提供數(shù)字化轉(zhuǎn)型所需的通用算力,這樣的數(shù)據(jù)中心顯然不能滿(mǎn)足人工智能等技術(shù)帶來(lái)的算力激增的需求,它們需要具有更高帶寬、更低延時(shí)的數(shù)據(jù)中心,顯然,我們需要建設(shè)更多、更先進(jìn)的數(shù)據(jù)中心。
我國(guó)的新型數(shù)據(jù)中心發(fā)展三年行動(dòng)計(jì)劃(2021-2023年)明確到2023年底,全國(guó)數(shù)據(jù)中心機(jī)架規(guī)模年均增速保持在20%左右,平均利用率力爭(zhēng)提升到60%以上,總算力超過(guò)200EFLOPS,高性能算力占比達(dá)到10%。
2023年1月,麥肯錫公司預(yù)測(cè),到2030年,數(shù)據(jù)中心行業(yè)每年將增長(zhǎng)10%,超大規(guī)模數(shù)據(jù)中心市場(chǎng)預(yù)計(jì)每年增長(zhǎng)20%,全球新設(shè)施建設(shè)支出將達(dá)到490億美元。
而另一分析機(jī)構(gòu)Gartner則預(yù)測(cè),2025年服務(wù)器、數(shù)據(jù)中心和存儲(chǔ)的市場(chǎng)規(guī)模將達(dá)到1,120億美元,2020至2025年期間的CAGR為8.0%。
目前全球領(lǐng)先科技巨頭,包括谷歌、亞馬遜、Meta以及微軟等公司都紛紛投入數(shù)據(jù)中心的建設(shè)與升級(jí)競(jìng)賽中。據(jù)富國(guó)銀行投資研究所數(shù)據(jù)顯示,上述這些科技巨頭在2023年用于數(shù)據(jù)中心新建和升級(jí)的總資本支出高達(dá)約1400億美元。未來(lái),數(shù)據(jù)中心的需求還將持續(xù)增長(zhǎng),它將不僅僅是存儲(chǔ)和處理數(shù)據(jù)的場(chǎng)所,更將成為支撐人工智能創(chuàng)新的重要基石。
可靠連接是構(gòu)建數(shù)據(jù)中心關(guān)鍵
數(shù)據(jù)中心的重要性已經(jīng)不言而喻。如果將數(shù)據(jù)中心比喻為人的‘大腦’,而大腦的很多指令則需要通過(guò)大量的神經(jīng)元之間的連接下達(dá),而快速的‘連接’才能實(shí)現(xiàn)這些指令的快速甚至實(shí)時(shí)實(shí)施。因此,如果說(shuō)數(shù)據(jù)中心是人工智能的發(fā)展基石,那連接則是數(shù)據(jù)中心的骨干。
五十多年來(lái),以太網(wǎng)協(xié)議一直是互聯(lián)網(wǎng)數(shù)據(jù)連接的骨干網(wǎng)絡(luò)。目前,數(shù)據(jù)中心的網(wǎng)絡(luò)連接多采用以太網(wǎng)連接,據(jù)IDC報(bào)告顯示,當(dāng)前主流數(shù)據(jù)中心網(wǎng)絡(luò)連接采用以太網(wǎng)的占比超過(guò)95%。
AI場(chǎng)景下,海量的參數(shù)分布于各個(gè)服務(wù)器之間,尤其是那些大模型,如上所述,它們有數(shù)萬(wàn)億個(gè)參數(shù),它們的參數(shù)數(shù)量每隔幾個(gè)月就會(huì)翻一番,大多數(shù)數(shù)據(jù)都保存在內(nèi)存中,需要同時(shí)進(jìn)行處理,因此系統(tǒng)需要通過(guò)低延遲網(wǎng)絡(luò)連接許多處理器。為了處理這樣的工作負(fù)載,整個(gè)集群將充當(dāng)單個(gè)計(jì)算設(shè)備,多個(gè)集群一起處理數(shù)TB的數(shù)據(jù)。
這樣的場(chǎng)景需要大量的算力和快速的連接來(lái)支撐,算力和網(wǎng)絡(luò)連接能力之間是協(xié)同互動(dòng)的,它們需要同步提升效率才能更好滿(mǎn)足這些場(chǎng)景的需求。毫無(wú)疑問(wèn),以太網(wǎng)為這些大型系統(tǒng)提供了理想的連接協(xié)議,同時(shí),這些大型系統(tǒng)的發(fā)展也催生了以太網(wǎng)傳輸速率的快速提升。
目前的以太網(wǎng)協(xié)議速度多為400G和800G為主。從下圖中可以看出,2019年,400G以太網(wǎng)的部署剛剛起步,但普及率不是很快,后在2023年,由于ChatGPT等技術(shù)的涌現(xiàn),立刻推動(dòng)了400G甚至800G以太網(wǎng)的快速迭代和部署。據(jù)Dell’Oro的數(shù)據(jù)預(yù)測(cè),2024年,400G和800G以太網(wǎng)的部署將提速,未來(lái)2-3年,800G以太網(wǎng)的占比將超一半。
而即使是將現(xiàn)有的數(shù)據(jù)中心連接迅速迭代至400G和800G,隨著未來(lái)如生成式人工智能等數(shù)據(jù)密集型應(yīng)用場(chǎng)景的不斷增加,它們也將無(wú)法滿(mǎn)足不斷增長(zhǎng)的帶寬需求,需要迭代至具有更高速率的網(wǎng)絡(luò)技術(shù),1.6T以太網(wǎng)被認(rèn)為將很快成為行業(yè)標(biāo)準(zhǔn)。
未來(lái)的連接標(biāo)準(zhǔn)——1.6T以太網(wǎng)
作為下一代以太網(wǎng)技術(shù),1.6T以太網(wǎng)能夠提供比當(dāng)前以太網(wǎng)協(xié)議更高的數(shù)據(jù)傳輸速度。相較于800G以太網(wǎng),1.6T以太網(wǎng)通過(guò)采用更高效的傳輸技術(shù)和更先進(jìn)的數(shù)據(jù)處理算法,實(shí)現(xiàn)了2倍的太比特的傳輸速度。
在傳輸方面,1.6T以太網(wǎng)可能采用更高速的物理層傳輸技術(shù),如PAM4(四相振幅調(diào)制),以提高每個(gè)時(shí)間周期內(nèi)可傳輸?shù)臄?shù)據(jù)量。同時(shí),它還可能采用更為先進(jìn)的編碼和解碼算法,以確保數(shù)據(jù)在傳輸過(guò)程中的準(zhǔn)確性和可靠性。
在數(shù)據(jù)處理方面,1.6T以太網(wǎng)可能采用高度并行化的處理架構(gòu),以處理大規(guī)模數(shù)據(jù)流,可以很好滿(mǎn)足人工智能時(shí)代數(shù)據(jù)量暴增的需求。
雖然,負(fù)責(zé)以太網(wǎng)標(biāo)準(zhǔn)制定的IEEE預(yù)計(jì)將于2026年才完成1.6TbE標(biāo)準(zhǔn)的最新版本,但2024年,他們將通過(guò)802.3dj工作組完成一組基線功能。如上圖Dell’Oro的預(yù)測(cè),1.6T以太網(wǎng)的部署也將始于2024年。
業(yè)界首款完整1.6T以太網(wǎng)IP解決方案滿(mǎn)足高帶寬需求
近日,新思科技推出了業(yè)界首款完整1.6T以太網(wǎng)解決方案,它大幅提升了數(shù)據(jù)密集型AI工作負(fù)載的帶寬和吞吐量。
新思科技的綜合IP解決方案,包括新型1.6T MAC和PCS以太網(wǎng)控制器、224G以太網(wǎng)PHY IP和驗(yàn)證IP,可加快AI和HPC網(wǎng)絡(luò)芯片的上市時(shí)間。與現(xiàn)有SoC方案相比,該款完整的1.6T以太網(wǎng)IP解決方案可將互連功耗降低多達(dá)50%,從而優(yōu)化超大規(guī)模數(shù)據(jù)中心的能效。新的多通道、多速率新思科技1.6T以太網(wǎng)MAC和PCS控制器通過(guò)實(shí)施獲得專(zhuān)利的Reed-Solomon前向糾錯(cuò)架構(gòu),將面積減少了50%,延遲減少了40%,同時(shí)有助于確高達(dá)至1.6T以太網(wǎng)速率的可靠數(shù)據(jù)。經(jīng)過(guò)硅驗(yàn)證的224G以太網(wǎng)PHY IP還可以提供強(qiáng)大的鏈路性能、出色的信號(hào)完整性和跨通道長(zhǎng)度的無(wú)縫生態(tài)系統(tǒng)互操作性。
該款1.6T以太網(wǎng)驗(yàn)證IP,還采用了原生SystemVerilog和通用驗(yàn)證方法實(shí)施,可縮短首次測(cè)試時(shí)間。它還提供業(yè)界首款1.6T驗(yàn)證IP(VIP),支持早期RTL驗(yàn)證、SoC啟動(dòng)和系統(tǒng)級(jí)驗(yàn)證,為設(shè)計(jì)人員提供快速實(shí)現(xiàn)設(shè)計(jì)驗(yàn)證收斂的途徑。
新思科技完整1.6T以太網(wǎng)解決方案特點(diǎn)總結(jié)如下:
與現(xiàn)有已實(shí)施方案相比,1.6T以太網(wǎng)IP解決方案可將互連損耗最多可降低50%;
與現(xiàn)有多速率800G IP解決方案相比,新型多通道/多速率以太網(wǎng)控制器可支持1.6T,延遲最多減少40%,面積最多減少50%;
可定制的、經(jīng)過(guò)硅驗(yàn)證的224G以太網(wǎng)PHY IP,可支持芯片到芯片、芯片到模塊和銅纜連接,從而對(duì)功耗和性能進(jìn)行了權(quán)衡優(yōu)化;
新思科技面向1.6T以太網(wǎng)的驗(yàn)證IP,通過(guò)一整套協(xié)議、方法和生產(chǎn)力提升等優(yōu)勢(shì)加速了驗(yàn)證收斂速度。
正因?yàn)樾滤伎萍伎?.6T以太網(wǎng)解決方案具有的上述諸多優(yōu)勢(shì),目前它也已經(jīng)被多家客戶(hù)采用,助力他們快速、便捷地開(kāi)發(fā)面向人工智能和高性能計(jì)算等應(yīng)用的產(chǎn)品。
結(jié)語(yǔ)
邁入人工智能時(shí)代,數(shù)據(jù)和連接將是最為關(guān)鍵的兩個(gè)因素,它們之間相輔相承,不斷增長(zhǎng)的數(shù)據(jù)量需要更寬的帶寬和更快的傳輸速率進(jìn)行傳輸,為此也推動(dòng)著網(wǎng)絡(luò)技術(shù)的快速迭代。雖然,目前1.6T以太網(wǎng)的標(biāo)準(zhǔn)還沒(méi)有最終出爐,但不可否認(rèn)的是,它將是未來(lái)的主流連接技術(shù)。而新思科技推出的完整1.6T以太網(wǎng)IP解決方案,可以提供高速數(shù)據(jù)連接,未雨綢繆,為未來(lái)做好準(zhǔn)備,讓人工智能時(shí)代連接無(wú)憂。