• 正文
    • 液冷技術在數(shù)據(jù)中心應用的機遇
    • 數(shù)據(jù)中心采用的主要液冷技術
    • 液冷技術在數(shù)據(jù)中心應用面臨的挑戰(zhàn)
  • 推薦器件
  • 相關推薦
申請入駐 產業(yè)圖譜

數(shù)據(jù)中心“風生水起”,液冷技術嶄露頭角

2023/07/19
1841
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

液冷在數(shù)據(jù)中心行業(yè)屬于熱點技術,但并不是新技術。液冷技術在數(shù)據(jù)中心應用較晚,2018年才被收錄到《計算機科學技術名詞》(第三版)中,其定義為“使用流動液體將計算機內部元器件產生的熱量傳遞到計算機外,以保證計算機工作在安全溫度范圍內的一種冷卻方法?!睌?shù)據(jù)中心冷卻系統(tǒng)分為一次冷卻(IT設備冷卻)和二次冷卻(熱量散熱過程),通常提到的液冷都用于一次冷卻過程,而二次冷卻過程多采用傳統(tǒng)風冷模式。

數(shù)據(jù)中心傳統(tǒng)的風冷模式,通過封閉冷熱通道,利用末端空調、列間空調等設施把IT設備產生的熱量通過風帶走,確保IT設備處于最優(yōu)的工作環(huán)境。隨著AI大模型等科技和產業(yè)技術不斷升級,以及IT設備計算能力和運算需求不斷提升,風冷模式的弊端日益凸顯。液體導熱能力是空氣的25倍,液體代替空氣直接對IT設備進行冷卻,可以極大地提高散熱效率。

公開數(shù)據(jù)表明,液冷在冷卻效率方面要比風冷至少提高15%~20%。液冷技術由于具有高效散熱等優(yōu)勢,在近幾年得到了快速發(fā)展,同時也將有力推動數(shù)據(jù)中心實現(xiàn)“雙碳”目標。

液冷技術在數(shù)據(jù)中心應用的機遇

積極的政策導向

1.正向傾斜

近兩年國家出臺的數(shù)據(jù)中心液冷相關政策如表1所示。

表1 2021年以來國家出臺的數(shù)據(jù)中心液冷相關政策(部分)

從2021年開始,國家一直持續(xù)鼓勵數(shù)據(jù)中心在研發(fā)、測試和應用中,采用液冷相關技術,并將液冷等高效方案作為政府采購的優(yōu)先選項。

2.反向約束

國家出臺的相關政策表明,數(shù)據(jù)中心雖然是數(shù)字經濟的基座,但電力資源的緊張、“雙碳”目標的要求,以及整體用電量的快速提升,都使得數(shù)據(jù)中心運營難度越來越大,同時還要面臨節(jié)能審查和“碳能雙考”等多重壓力。以PUE為例,按照國家一體化數(shù)據(jù)中心建設要求,東部數(shù)據(jù)中心集群的PUE要小于1.25,西部要小于1.2。在2022年北京地區(qū)通過節(jié)能審查的13個數(shù)據(jù)中心項目中,PUE全部小于1.2,超過60%的項目小于1.15。如此低的PUE,采用傳統(tǒng)的風冷技術很難實現(xiàn),液冷技術已成為公認的最佳實現(xiàn)路徑。

行業(yè)技術提升的必然

1.液冷服務器正快速迭代

作為數(shù)據(jù)中心上游企業(yè),IT設備的發(fā)展與數(shù)據(jù)中心息息相關。比如浸沒式液冷需要密封艙體存儲冷卻液,IT設備為滿足對冷卻液的兼容,通常需要定制化。因此,液冷技術在數(shù)據(jù)中心的規(guī)?;涞兀厝恍枰狪T廠商的深度配合。公開數(shù)據(jù)顯示,我國過去3年液冷服務器出廠量不到服務器總量的5%。2022年至今,主流IT設備廠商均已公開表明將加大研發(fā)力度并加快產品迭代速度,這也將加速液冷在數(shù)據(jù)中心的規(guī)模化落地。

2.液冷比風冷更適合IT設備

以浸沒式液冷為例,與風冷技術相比,其不但可以大幅減小濕度、振動、塵埃粒子等對IT設備的影響,而且產生的噪聲比風冷降低20~35分貝,生產環(huán)境將變得更加穩(wěn)定和更加舒適,IT設備的使用效率與穩(wěn)定性將得到有效提升。

大模型等業(yè)務需求驅動

CDCC發(fā)布的《2022年中國數(shù)據(jù)中心運營質量分析發(fā)展報告》顯示,新一輪AI和大模型正處于史上最高速的發(fā)展期,我國數(shù)據(jù)中心在業(yè)務需求的加持下,繼續(xù)向高功率密度方向發(fā)展。相應的芯片熱功率密度也在急劇上升,CPU已達到單芯片300W以上,GPU更是達到單芯片700W以上。如此高的功率,傳統(tǒng)的風冷散熱已無法支撐。研究表明,采用風冷方式的數(shù)據(jù)中心單機柜功率密度如果超過15kW,制冷效率將大幅下降,而AI和大模型的功率需求通常都在20kW以上,因此采用液冷將成為必然。

今年7月6日,在第六屆世界人工智能大會上,互聯(lián)網(wǎng)頭部企業(yè)和運營商合計發(fā)布了30多款大模型和10多款高算力智能芯片,其背后都有液冷數(shù)據(jù)中心的影子。隨著大模型時代的到來,能夠實現(xiàn)超高密度IT設備散熱的液冷技術必將在數(shù)據(jù)中心領域得到高速發(fā)展。

企業(yè)持續(xù)發(fā)展的推動力

1.液冷助力實現(xiàn)碳中和

數(shù)據(jù)中心實質上是將能源轉換為算力的載體,轉換效率越高,意味著數(shù)據(jù)中心實現(xiàn)相同算力付出的能源成本越低。CDCC發(fā)布的《2022年中國數(shù)據(jù)中心運營質量分析發(fā)展報告》指出,能源成本在數(shù)據(jù)中心整體運營成本中占比最高,達到41%。液冷技術將有效提升轉換效率,不僅可以提高數(shù)據(jù)中心整體利潤,還可以降低碳排放,加快實現(xiàn)碳中和。

2.液冷助力實現(xiàn)余熱回收

在數(shù)據(jù)中心IT設備散熱的過程中,大量的熱能被帶走,在傳統(tǒng)風冷技術的實現(xiàn)路徑中,產生的熱量過于分散且溫度不高,不利于集中回收與利用。液冷技術應用后回收的液體的溫度和熱量密度比風冷高很多,不僅便于收集,也便于進行二次交換,進而用于集中供暖、供熱水等場景中。在實際項目中,大量數(shù)據(jù)中心均將液冷系統(tǒng)與余熱回收系統(tǒng)結合在一起建設。如果將IT設備余熱的二次利用考慮到PUE的計算當中,利用液冷技術實現(xiàn)余熱回收的系統(tǒng),其等效PUE比常規(guī)算法下的PUE更低。

數(shù)據(jù)中心采用的主要液冷技術

數(shù)據(jù)中心液冷技術主要分為冷板式、浸沒式和噴淋式三種,主要區(qū)別體現(xiàn)在散熱方式的不同,國內主要采用冷板式液冷、單相浸沒式液冷。

其一,冷板式液冷研發(fā)初衷是為了避免冷卻液與IT設備直接接觸,同時還可對高熱源進行精確冷卻,實現(xiàn)方式更像是風冷和液冷的混合。該技術在機柜內對CPU、GPU等高能耗部件采用液冷冷板散熱,通過冷板內的流動液體將部件的熱量帶走,而對主板、存儲等其他部件依舊采用風冷散熱。

由于傳統(tǒng)風冷技術已經非常成熟,冷板式液冷技術一般不會改變數(shù)據(jù)中心機房和機柜整體結構,通常情況下不需要調整承重,IT設備也不需要做出相應改變,仍然工作在空氣中。

其二,噴淋式液冷是將冷卻液通過噴淋的方式,帶走IT設備散熱元件上的熱量,這項技術在國內應用較少。

其三,浸沒式液冷是指將IT設備完全浸沒在冷卻液中,通過冷卻液的流動或相變帶走熱量,根據(jù)冷卻液散熱過程中形態(tài)的不同,分為單相液冷和相變液冷兩類。浸沒式液冷需要將IT設備的生產環(huán)境由空氣改為液體,因此在機房架構上需要重新設計和優(yōu)化,IT設備也要與之匹配。

浸沒式液冷的冷卻液與IT設備直接接觸,具有較低的對流熱阻和超強的散熱效果,在大模型時代具有廣闊的應用前景。傳統(tǒng)風冷、冷板式液冷和浸沒式液冷的多維度對比如表2所示。

表2 數(shù)據(jù)中心傳統(tǒng)風冷、冷板式液冷和浸沒式液冷對比

液冷技術在數(shù)據(jù)中心應用面臨的挑戰(zhàn)

在政策、技術與市場的多重推動下,液冷技術在數(shù)據(jù)中心的應用前景雖然被普遍看好,但實現(xiàn)規(guī)?;涞剡€需解決以下4個核心問題。

行業(yè)標準亟需完善

任何一個行業(yè)的高質量發(fā)展,都離不開標準規(guī)范的引導,只有標準統(tǒng)一才能開展更多專業(yè)化服務。數(shù)據(jù)中心液冷系統(tǒng)的邏輯要比風冷復雜,在各階段需要考慮的問題也更多,不僅要做好管道、冷卻液、密封件、閥門、線材、電氣等組件的浸泡測試、適配測試和可靠性測試,還要做好小分子材料長期的溶解性測試、兼容性測試,相關標準和規(guī)范缺失可能產生隱患甚至引發(fā)事故。

截至目前,我國尚未出臺液冷數(shù)據(jù)中心的相關國家標準,只有中國通信標準化協(xié)會出臺了8個行業(yè)標準,如表3所示。而已有行業(yè)標準更多是關于技術要求和測試方法的,無法覆蓋數(shù)據(jù)中心全生命周期中的設計、建設以及運維管理。此外,部分行業(yè)協(xié)會也在積極制定團體標準,但由于權威性等問題,在實際應用中尚未被普遍認同和實施。

表3 數(shù)據(jù)中心液冷相關行業(yè)標準匯總

多領域、多專業(yè)間仍需協(xié)同

液冷是一項跨專業(yè)的創(chuàng)新技術,基礎設施、IT設備需要多領域的協(xié)同,要具備整體思維模式。以PUE為例,液冷能將PUE做到極致的部分原因是其能夠將原有風冷機柜中IT設備的風扇能耗轉移到液冷機柜中的基礎設施上。

現(xiàn)階段,真正實現(xiàn)從土建到機電全部采用液冷的數(shù)據(jù)中心并不多,大部分是在原有基礎架構上進行改造,或者在土建完工的框架上新建液冷設施,這不可避免地會遇到基礎設施和IT設備在液冷方面的協(xié)同問題。比如,樓板承重情況、消防系統(tǒng)改造、電氣系統(tǒng)兼容等。

IT設備的生命周期相對較短,而電氣和暖通系統(tǒng)的生命周期通常在10年以上。因此在規(guī)劃時,基礎設施如何匹配未來IT設備的需求,如何實現(xiàn)風冷向液冷的混合過渡,是需要深入思考的問題。

運維模式需要轉變

液冷并不只是單一的技術,隨之而來的數(shù)據(jù)中心整體架構的重構,也為運維帶來了更大的挑戰(zhàn)。在風冷模式下,冷凍、冷卻或末端系統(tǒng)出現(xiàn)問題時,影響到機房內IT設備通常會有延時,也就是不會立刻對業(yè)務系統(tǒng)產生影響。而在液冷模式下,由于芯片和IT設備都是高功率運行,當系統(tǒng)出現(xiàn)泄壓、漏液、氣阻等情況會立刻影響業(yè)務系統(tǒng),因此需要將基礎設施和IT設備進行聯(lián)動控制以免引發(fā)故障。這就要求運維人員在運維方式、運維習慣、運維工具等方面都要做出相應的調整。

安全風險需做好把控

液冷架構下整體散熱模式與風冷也有一定差別,在風冷模式下,維護的顆粒度較大,容錯性也較強。在液冷架構下,任何一個部件發(fā)生損壞或者需要維修更換,都將對系統(tǒng)整體產生影響,因此液冷對各部件、IT設備的可靠性要求通常也更高。

同時,由于液冷數(shù)據(jù)中心的運行項目相對較少,運行時間相對較短,依靠現(xiàn)有運行數(shù)據(jù)無法全面評估存在和潛在的各種安全隱患以及風險點,從安全的角度來看,暫時不足以支撐液冷規(guī)?;涞?。

進入2023年以來,隨著大模型系統(tǒng)、高算力芯片、超高功率密度機柜等快速發(fā)展,液冷技術對于現(xiàn)有數(shù)據(jù)中心來說,是巨大的機遇,也是巨大的挑戰(zhàn)。相信在標準、協(xié)同、安全等方面逐步完善后,液冷技術必將在數(shù)據(jù)中心占據(jù)更為重要的地位,為行業(yè)發(fā)展作出更大的貢獻。

作者:聯(lián)通數(shù)字科技有限公司?車凱

責編/版式:王鶴迦

審核:舒文瓊

監(jiān)制:劉啟誠

 

 

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風險等級 參考價格 更多信息
KSZ9031RNXCC-TR 1 Microchip Technology Inc IC TXRX ETHERNET 48QFN

ECAD模型

下載ECAD模型
$2.81 查看
LAN8720AI-CP-ABC 1 Microchip Technology Inc Ethernet Transceiver

ECAD模型

下載ECAD模型
$1.26 查看
KSZ8895FQXI 1 Microchip Technology Inc DATACOM, ETHERNET TRANSCEIVER
$13.59 查看

相關推薦