• 正文
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

數(shù)據(jù)中心冷板液冷系統(tǒng)設(shè)計(jì)的五大關(guān)注要素

7小時(shí)前
149
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

冷板液冷系統(tǒng)的分類

根據(jù)CDU一次側(cè)散熱形式的差異,冷板液冷系統(tǒng)大體上可以分為液液型冷板液冷和風(fēng)液型冷板液冷。

液液型冷板液冷系統(tǒng)包含一個(gè)二次側(cè)閉環(huán)回路,可通過間接冷卻(如機(jī)架安裝的后門熱交換器)或直接冷卻(如芯片級(jí)冷板)為IT設(shè)備提供冷卻流體。二次側(cè)回路是一個(gè)低壓密封系統(tǒng),IT設(shè)備的高熱密度區(qū)域的熱量通過一個(gè)低壓降板式熱交換器排出到外部冷卻水源(一次側(cè)回路)。二次側(cè)回路可確保數(shù)據(jù)中心環(huán)境中的冷卻液保持最小容量,對(duì)流量、壓力和溫度進(jìn)行嚴(yán)密控制(冷凝控制),并準(zhǔn)確保持流體質(zhì)量(過濾和添加)。一次側(cè)冷卻源可以是冷凍水系統(tǒng)(專用或來自建筑物系統(tǒng))、冷卻塔或干冷器,具體取決于所需的二級(jí)溫度和傳熱規(guī)格。

風(fēng)液型冷板液冷系統(tǒng)包含二次側(cè)回路,為IT 設(shè)備提供冷卻液供給以進(jìn)行直接冷卻(例如芯片級(jí)冷板)。冷卻液回路是一個(gè)低壓密封的系統(tǒng),低壓降制冷盤管換熱器將熱量從IT設(shè)備的高熱密度區(qū)域排出到環(huán)境空氣中。一次側(cè)冷源是數(shù)據(jù)中心的冷空氣,通過風(fēng)液型CDU將服務(wù)器熱量,傳遞至機(jī)房,最終通過機(jī)房空調(diào)帶走所有熱量。熱傳遞將取決于空氣溫度和流速。

冷板液冷系統(tǒng)設(shè)計(jì)的五大關(guān)注要素

1) 供液溫度

冷板液冷系統(tǒng)的供液溫度設(shè)計(jì)需充分考慮不同芯片及服務(wù)器制造商的特定要求,如Dell可能接受高達(dá)32℃甚至更高的供液溫度,而Nvidia則設(shè)定在25℃至45℃的較寬范圍內(nèi)。需要注意的是,必須嚴(yán)格避免供液溫度過低,以防止水蒸氣凝結(jié)現(xiàn)象的發(fā)生,這可能嚴(yán)重?fù)p害IT設(shè)備的正常運(yùn)行。此外,系統(tǒng)還需具備強(qiáng)大的穩(wěn)定性,確保在一次側(cè)流量出現(xiàn)波動(dòng)時(shí),二次側(cè)仍能維持穩(wěn)定的供液溫度,以保障整體散熱效能與設(shè)備安全(如下圖)。

2) 供液流量

冷板液冷系統(tǒng)的供液流量設(shè)計(jì)是確保高效散熱與穩(wěn)定運(yùn)行的關(guān)鍵環(huán)節(jié)。CDU(冷量分配單元)在此過程中扮演著核心角色,負(fù)責(zé)精確調(diào)控一次流體與二次流體的流量。具體而言,二次流體需維持穩(wěn)定的流速進(jìn)入IT設(shè)備,以在設(shè)備滿載時(shí)能夠有效從冷板中帶走所有熱量,保持IT入口溫度的恒定。同時(shí),一次流體的流量則根據(jù)需散熱的熱量動(dòng)態(tài)調(diào)整,并依據(jù)CDU的接近溫度(ATD)進(jìn)行調(diào)整。

為了確保流量控制的精準(zhǔn)性,系統(tǒng)要采用壓差控制并輔以實(shí)時(shí)監(jiān)控,以確保系統(tǒng)中的泄漏不會(huì)導(dǎo)致壓力下降。此外,通過CDU內(nèi)泵與電源的冗余設(shè)計(jì),系統(tǒng)能夠在關(guān)鍵業(yè)務(wù)場(chǎng)景下保障流量的連續(xù)供應(yīng),進(jìn)一步提升整體系統(tǒng)的可靠性與穩(wěn)定性。

3) 過濾要求

冷板液冷系統(tǒng)要求冷卻液順暢通過冷板內(nèi)極其微小的通道,這些通道的寬度可精細(xì)至僅27微米。堵塞不僅會(huì)限制流量,甚至可能完全中斷IT設(shè)備的冷卻,導(dǎo)致維護(hù)成本急劇上升,因此系統(tǒng)對(duì)冷卻液的過濾精度提出了嚴(yán)格標(biāo)準(zhǔn)。通常,這一精度需低于冷板通道的最小尺寸,業(yè)界經(jīng)驗(yàn)傾向于采用25微米或更細(xì)的過濾級(jí)別。此外,為確保系統(tǒng)長期保持清潔狀態(tài),CDU(冷量分配單元)需持續(xù)進(jìn)行在線過濾,這是維護(hù)系統(tǒng)高效運(yùn)行與延長使用壽命的關(guān)鍵措施。

4) 流體選擇

在設(shè)計(jì)冷板液冷系統(tǒng)的初期,選擇合適的流體化學(xué)成分及可靠的供應(yīng)商非常重要。一旦確定流體策略,后續(xù)的任何更改都將涉及繁瑣且成本高昂的清洗與凈化過程。此外,流體的選擇還會(huì)在調(diào)試階段帶來顯著復(fù)雜性,包括循環(huán)測(cè)試、雜質(zhì)沖洗以及系統(tǒng)氣泡的排除,這些工作對(duì)于每臺(tái)服務(wù)器及整體解決方案的順利運(yùn)行都至關(guān)重要。在整個(gè)系統(tǒng)使用周期內(nèi),對(duì)液體的持續(xù)關(guān)注同樣不可或缺,需定期進(jìn)行pH值、外觀、抑制劑濃度及污染物水平的檢測(cè),以確保其性能穩(wěn)定與系統(tǒng)的持續(xù)高效運(yùn)行。同時(shí),所有冷卻液均需遵循嚴(yán)格的存儲(chǔ)與處理規(guī)范,并配備適當(dāng)?shù)膫€(gè)人防護(hù)設(shè)備以保障操作安全。

在冷板液冷系統(tǒng)的二次側(cè)流體選擇中,存在三種主流方案。首先,去離子水配方液換熱效果優(yōu)越,然而其腐蝕風(fēng)險(xiǎn)不容忽視,需采取額外措施加以防范。其次,乙二醇配方液雖具備一定的防腐能力,但其毒性相對(duì)較大,且在環(huán)保要求較高的地區(qū),其排放處理成為一大現(xiàn)實(shí)問題。最后,丙二醇配方液作為Intel、Nvidia等業(yè)界巨頭推薦的選擇,由于其防腐效果更好,成為眾多用戶信賴的優(yōu)選方案。

在選擇時(shí),需綜合考慮流體性能、成本、環(huán)保要求及安全性等多方面因素,以做出最適合自身需求的決策。

5) 故障預(yù)防和檢測(cè)

在冷板液冷系統(tǒng)中,除了二次流體網(wǎng)絡(luò)內(nèi)其他傳感器的監(jiān)測(cè)外,CDU的嚴(yán)密監(jiān)控與管理是預(yù)防并盡早發(fā)現(xiàn)故障的關(guān)鍵。數(shù)據(jù)中心尤為關(guān)注泄漏問題,大部分泄漏案例發(fā)生在manifold與服務(wù)器軟管快速斷開附件處,對(duì)IT設(shè)備影響很小。但服務(wù)器機(jī)箱內(nèi)部的泄漏,特別是發(fā)生在內(nèi)部manifold、軟管與冷板之間的泄漏,則對(duì)IT設(shè)備構(gòu)成重大威脅。因此,實(shí)施額外過濾與傳感器在內(nèi)的防錯(cuò)系統(tǒng)至關(guān)重要,這些措施不僅能在熱交換性能下降時(shí)提供預(yù)警,還能有效遏制人為錯(cuò)誤導(dǎo)致的污染物增加或液體質(zhì)量漏檢風(fēng)險(xiǎn),從而全面提升系統(tǒng)的穩(wěn)定性與安全性。

節(jié)選自《智算中心液冷技術(shù)發(fā)展報(bào)告(2024 版)》

該報(bào)告深入分析液冷技術(shù)在智算中心的應(yīng)用現(xiàn)狀、技術(shù)發(fā)展和未來趨勢(shì)。旨在為智算中心的規(guī)劃和建設(shè)提供參考,幫助行業(yè)同仁更好地理解和應(yīng)用液冷技術(shù),推動(dòng)AI行業(yè)的可持續(xù)發(fā)展。

相關(guān)推薦