TDP 變化對室內(nèi)散熱技術(shù)的影響
AI芯片更高的熱設(shè)計功耗是推動液冷技術(shù)普及的關(guān)鍵因素。隨著人工智能、云計算、大數(shù)據(jù)以及區(qū)塊鏈等技術(shù)的快速發(fā)展,數(shù)據(jù)資源的存儲、計算和應(yīng)用需求迅速擴張,特別是像ChatGPT這樣的AI算力大功率應(yīng)用場景加速落地,這導(dǎo)致AI芯片TDP(熱設(shè)計功耗:處理器達(dá)到最大負(fù)荷時釋放的熱量)不斷增加,2022年Intel第四代服務(wù)器處理器單CPU功耗已突破350W,英偉達(dá)單GPU芯片功耗突破700W,帶來了更高的散熱需求。
同時,服務(wù)器制造商正在將更多的CPU和GPU裝入每個機架單元(U)。由于機架內(nèi)有多個高性能服務(wù)器,即使有密封裝置,向機架輸送冷風(fēng)的空調(diào)系統(tǒng)也無法提供足夠的冷卻能力。此外,在處理密集型應(yīng)用中,分散計算的策略并不可行,因為即使是在單個服務(wù)器中,也存在物理距離帶來的延遲挑戰(zhàn)。因此,組件被壓縮到單個設(shè)備內(nèi),從而形成高熱密集的1U服務(wù)器,將機架熱密度提高到前所未有的水平。
前幾年,風(fēng)冷系統(tǒng)通過讓冷源更靠近熱源,或者密封冷通道/熱通道的方案,來適應(yīng)更高的熱密度散熱需求。但是,隨著機架密度升至20kW以上,傳統(tǒng)風(fēng)冷技術(shù)在面對高熱密度場景時顯現(xiàn)出散熱效率瓶頸,無法跟上計算效率的提升。液冷技術(shù)以其高能效和高熱密度散熱特點,成為解決散熱壓力和節(jié)能挑戰(zhàn)的有效手段。液冷技術(shù)相較于風(fēng)冷技術(shù),在低能耗、高散熱、低噪音和低總擁有成本(TCO) 等方面具有明顯優(yōu)勢。
液體的冷卻能力是空氣的1000至3000倍,導(dǎo)熱能力是空氣的25倍,這使得液冷技術(shù)特別適合需要大幅度提高計算能力、能源效率和部署密度的場景。想要部署密度極高機架(60kW以上)的設(shè)施在是否使用液冷方面幾乎沒有選擇余地。無論如何配置或優(yōu)化系統(tǒng),風(fēng)冷都無法提供維持IT系統(tǒng)可靠性所需的散熱能力。在邊緣計算和核心數(shù)據(jù)中心都是如此。因此,當(dāng)芯片的熱設(shè)計功耗(TDP)超過700-800W時,液冷是解決高密散熱的必要有效措施。
TDP 變化對室外冷源技術(shù)的影響
液冷系統(tǒng)的換熱主要分為一次側(cè)換熱系統(tǒng)和二次側(cè)換熱系統(tǒng)兩個部分,二次側(cè)系統(tǒng)負(fù)責(zé)將電子設(shè)備高熱流密度元件的發(fā)熱量帶出機房,送抵與外循環(huán)系統(tǒng)做熱交換的冷量分配單元的冷卻介質(zhì)循環(huán)系統(tǒng)。主要由冷量分配單元( 二次側(cè)循環(huán)通道部分)、液冷設(shè)備、冷卻介質(zhì)供回歧管、循環(huán)管路、連接管路等構(gòu)成;一次側(cè)換熱系統(tǒng)負(fù)責(zé)將二次側(cè)冷卻環(huán)路送抵的機房內(nèi)元件產(chǎn)生的熱量排至室外大氣環(huán)境或通過熱回收系統(tǒng)回收利用。一次側(cè)冷卻環(huán)路由冷量分配單元( 一次側(cè)循環(huán)通道部分)、冷卻水循環(huán)管路、水泵、冷源等構(gòu)成。
在室外側(cè)循環(huán)中,低溫水在冷量分配單元(CDU)中吸收二次側(cè)冷卻液攜帶的大量熱量變?yōu)楦邷厮裳h(huán)水泵輸入到室外冷散熱設(shè)備中。在室外散熱設(shè)備中,高溫水與大氣進行熱交換,釋放熱量,變成低溫水再由循環(huán)水泵輸送進CDU中與冷卻液進行熱交換,完成室外側(cè)循環(huán)。
在一次側(cè)循環(huán)中熱量轉(zhuǎn)移主要通過水溫升降實現(xiàn),根據(jù)不同水溫,可分為完全自然冷卻和機械冷卻兩種形式。自然冷卻系統(tǒng)主要有開式冷卻塔、閉式冷卻塔和干冷器等類型,可提供30℃以上冷卻水;機械制冷系統(tǒng)主要包含風(fēng)冷冷凍水系統(tǒng)和水冷冷凍水系統(tǒng),可提供溫度較低的冷凍水。隨著TDP的不斷提高,要保證芯片側(cè)的換熱效果需要降低二次側(cè)管路的冷卻液溫度,進而需要更低的一次側(cè)水溫。
當(dāng)TDP在900~1500W范圍或以上時,對液冷一次側(cè)進水溫度的需求越來越低,此時自然冷卻提供的30℃以上的冷卻水難以滿足要求,因此就需要機械制冷系統(tǒng)提供溫度更低的冷凍水。即室外冷源由冷卻塔逐步過渡到冷水機組。
節(jié)選自《智算中心液冷技術(shù)發(fā)展報告(2024 版)》
該報告深入分析液冷技術(shù)在智算中心的應(yīng)用現(xiàn)狀、技術(shù)發(fā)展和未來趨勢。旨在為智算中心的規(guī)劃和建設(shè)提供參考,幫助行業(yè)同仁更好地理解和應(yīng)用液冷技術(shù),推動AI行業(yè)的可持續(xù)發(fā)展。