雖然高密度計算常常給人一種難以捉摸的感覺,但現(xiàn)代人工智能卻依賴于大量的電力、硅芯片以及專用的人工智能數(shù)據(jù)中心冷卻基礎(chǔ)設(shè)施。每一個快速的聊天機器人回復(fù)或每一個復(fù)雜的人工智能生成圖像的背后,都隱藏著一個物理設(shè)施,其中布滿了高密度服務(wù)器機架,它們不斷地將電力轉(zhuǎn)化為熱量。
通常情況下,這種熱能會通過蒸發(fā)逸散到大氣中,而蒸發(fā)過程會從當?shù)亓饔驇ё咚帧.斦舭l(fā)成為主要的冷卻機制時,水分就會實際離開當?shù)亓饔颍瑥亩鴮?shù)字過程轉(zhuǎn)化為對當?shù)厣鷳B(tài)系統(tǒng)的實際影響。
冷卻塔通過蒸發(fā)水來散熱,并通過排污來控制礦物質(zhì)沉積。這意味著水資源并非簡單地被“借用”,而是被計入當?shù)氐?/span>用水量統(tǒng)計中。隨著人工智能工作負載的不斷增長,為其提供冷卻的基礎(chǔ)設(shè)施已成為各地社區(qū)面臨的一項重大可持續(xù)發(fā)展挑戰(zhàn)。
國際能源署最新發(fā)布的《能源與人工智能》分析報告預(yù)測,2024年全球數(shù)據(jù)中心用電量約為415太瓦時,并在基準情景下預(yù)測到2030年可能接近945太瓦時。人工智能工作負載的快速增長迫使基礎(chǔ)設(shè)施設(shè)計應(yīng)對新的、嚴峻的可持續(xù)性挑戰(zhàn)。
這場辯論已經(jīng)從簡單的用水問題演變?yōu)殛P(guān)注保護當?shù)毓┧璧木唧w機械策略。

AI數(shù)據(jù)中心冷卻、用水及其對本地供應(yīng)的影響
關(guān)于AI數(shù)據(jù)中心冷卻、用水和能源影響的簡要事實
分析現(xiàn)代基礎(chǔ)設(shè)施龐大的運營規(guī)模,就能明白為什么可持續(xù)性指標如今已成為工程團隊關(guān)注的核心。一些關(guān)鍵指標和預(yù)測數(shù)據(jù)表明,這些設(shè)施正經(jīng)歷快速增長,并產(chǎn)生巨大的環(huán)境影響。
- 根據(jù)國際能源署的數(shù)據(jù),2024 年全球數(shù)據(jù)中心消耗了約415 太瓦時的電力,在基本情景下,到 2030 年這一數(shù)字可能達到約 945 太瓦時。
- 根據(jù)勞倫斯伯克利國家實驗室的分析,美國數(shù)據(jù)中心在 2023 年使用了約176 太瓦時,到 2028 年可能會上升到 325 至 580 太瓦時。
- 冷卻塔通過蒸發(fā)水來去除熱量,并通過排污釋放額外的水,這意味著水是被消耗而不是循環(huán)利用的。
- 水資源利用效率 (WUE)衡量的是年度站點用水量除以 IT 設(shè)備能耗。
- 水資源使用影響(WUI)根據(jù)當?shù)氐乃Y源壓力情況調(diào)整用水總量。
- 在高效的超大規(guī)模設(shè)施中,冷卻約占能源開銷的 7%,而在優(yōu)化程度較低的設(shè)施中,冷卻可能超過 30%,正如皮尤研究中心關(guān)于美國數(shù)據(jù)中心的簡報中所指出的那樣。
以指標為導(dǎo)向的洞察為評估快速技術(shù)進步與資源可用性之間的矛盾提供了關(guān)鍵基準。精確的數(shù)據(jù)確??沙掷m(xù)發(fā)展方面的討論始終立足于工程現(xiàn)實。這些數(shù)據(jù)使各方能夠擺脫猜測,做出更實際的決策。
生活在干旱地區(qū)的家庭往往覺得蒸發(fā)水的概念很抽象,直到當?shù)匾?guī)劃委員會的會議讓他們切身感受到這個問題。決定當?shù)靥甲阚E的,不僅僅是人工智能模型,還有制冷系統(tǒng)的設(shè)計。
保持AI冷卻的隱性用水成本
數(shù)據(jù)中心是發(fā)熱機器
數(shù)據(jù)中心雖然常被視為密封的保險庫,但其主要功能是作為龐大的熱力學系統(tǒng)運行。電力流入處理器,處理器產(chǎn)生熱量,而這些熱量必須持續(xù)散發(fā),以避免設(shè)備故障。
蒸發(fā)和風力:水為什么會消失
在傳統(tǒng)的蒸發(fā)冷卻系統(tǒng)中,服務(wù)器產(chǎn)生的熱量傳遞給水。然后,水在冷卻塔中通過蒸發(fā)一部分熱量進入大氣進行冷卻。相變蒸發(fā)則能有效地將服務(wù)器產(chǎn)生的熱量散發(fā)到周圍大氣中。運營商會定期排放二次水(稱為排污),以防止冷卻回路中礦物質(zhì)積聚,這遵循了美國能源部關(guān)于數(shù)據(jù)中心冷卻水效率提升的指南。
水資源具有地域性:為什么地理位置會改變其影響
蒸發(fā)是指水不會在原地或同一時間返回流域,而是以水蒸氣的形式散失。在地下水補給有限的地區(qū),這會對當?shù)卦斐煽珊饬康挠绊憽?/span>
Uptime Institute 提醒我們,水資源具有地域性,這意味著不能對所有設(shè)施的水資源影響一概而論。在水資源豐富的地區(qū)可行的冷卻設(shè)計,在水資源緊張的地區(qū)可能造成壓力。當社區(qū)提出類似語音搜索的簡單問題時——例如:數(shù)據(jù)中心是否使用地下水進行冷卻?——這種區(qū)別就顯得尤為重要。
運行數(shù)據(jù)證實,地下水的使用取決于當?shù)氐墓┧才?,冷卻方法和氣候決定了具體的消耗量。
人工智能增長為何加劇降溫權(quán)衡?
隨著人工智能工作負載的擴大和功率密度的提高,制冷需求與電力需求同步增長,這有助于解釋為什么人工智能基礎(chǔ)設(shè)施正成為智慧城市電網(wǎng)規(guī)劃的關(guān)鍵組成部分。國際能源署指出,制冷可能占能源消耗的很大一部分,尤其是在優(yōu)化程度較低的設(shè)施中。電力和水之間的關(guān)聯(lián)是可持續(xù)發(fā)展挑戰(zhàn)的核心所在。
冷卻:方法與效率權(quán)衡
構(gòu)建可持續(xù)的人工智能基礎(chǔ)設(shè)施需要對機械冷卻系統(tǒng)進行深入分析。每種方法在用水量、能源效率和區(qū)域適用性方面都各有優(yōu)劣。
空氣管理和控制
通過合理控制氣流,將暖排氣與冷進氣分離,可以立即提高效率。熱通道和冷通道隔離策略能夠?qū)⑴艢馀c冷進氣隔離,減少混合,從而降低額外冷卻需求。在設(shè)施硬件升級之前,通過優(yōu)化氣流和暖通空調(diào)系統(tǒng)策略降低冷卻需求,可以顯著提高效率,相關(guān)研究已有大量文獻證實了這一點。
實施氣流控制是降低冷卻成本的有效切入點,無需對整個工廠進行重新設(shè)計。設(shè)施團隊通過有針對性的運行改進,可以顯著降低能耗:
- 調(diào)整服務(wù)器布局以消除熱點。
- 密封電纜開口和地板穿孔處,防止空氣泄漏。
- 將送風溫度提高到安全運行范圍內(nèi)。
這些改進措施為設(shè)施專家推崇的精準控制方法奠定了基礎(chǔ)。濕度控制是一個容易被忽視的能源陷阱。當設(shè)定值過于嚴格時,制冷機組會陷入低效的空調(diào)制冷循環(huán),浪費電力,卻無法提高可靠性。
一位設(shè)施工程師曾將這種挑戰(zhàn)比作給房間降溫與給機器降溫之間的區(qū)別。精準控制仍然是確保能源用于硬件保護而非機械沖突的最有效方法。空氣管理雖然無法完全消除蒸發(fā)系統(tǒng)中的水資源消耗,但可以顯著降低這些塔架的機械負荷。
空氣側(cè)和水側(cè)節(jié)能器
節(jié)能系統(tǒng)利用室外環(huán)境條件來繞過高能耗的機械制冷。通過以下兩種主要策略,利用環(huán)境條件可以顯著降低機械制冷負荷:
- 空氣側(cè)節(jié)能器:當溫度和濕度允許時,利用空氣側(cè)節(jié)能器直接引入過濾后的室外空氣。
- 水側(cè)節(jié)能器:部署水側(cè)節(jié)能器,利用熱交換器冷卻設(shè)施回路,而無需啟動耗能巨大的壓縮機。
空氣側(cè)節(jié)能器可以顯著降低寒冷氣候下的能源消耗。然而,這些系統(tǒng)并非自動具備節(jié)水功能。關(guān)于制冷能耗降低的搜索查詢中,節(jié)能器經(jīng)常被提及。然而,這些系統(tǒng)并非自動具備節(jié)水功能。
蒸發(fā)式冷卻塔
蒸發(fā)式冷卻塔利用潛熱的強大物理特性,能夠?qū)崿F(xiàn)很高的散熱率。但其根本的代價是耗水量。據(jù)美國能源部稱,水的損失途徑包括蒸發(fā)、排污和少量漂移。增加濃縮倍數(shù)仍然是降低總補水需求量的有效方法。
在干旱流域,對排污管理進行精準改進可顯著節(jié)約資源。自動化排污回收系統(tǒng)展示了改造如何在減少水資源浪費的同時,將化學成分控制在合理范圍內(nèi)。蒸發(fā)式冷卻塔通常能效高但耗水量大。這種雙重特性使其成為任何關(guān)于可持續(xù)數(shù)據(jù)中心冷卻討論的核心。

混合式干濕系統(tǒng)
混合式制冷系統(tǒng)力求平衡水和能源消耗。在氣溫較低時,它們以干式模式運行;在氣溫高峰期,則切換至蒸發(fā)式模式。與純蒸發(fā)式制冷系統(tǒng)相比,這種混合式系統(tǒng)既能降低總用水量,又能避免在炎熱氣候下純干式制冷帶來的高額電費。
混合系統(tǒng)的可持續(xù)性表現(xiàn)取決于氣候、負荷曲線和運行策略。具體情況決定了每個設(shè)施的理想解決方案。這些系統(tǒng)在僅在特定季節(jié)出現(xiàn)高溫的地區(qū)尤為重要。
液冷和直接芯片系統(tǒng)
隨著人工智能功率密度突破傳統(tǒng)風冷極限,先進的液冷架構(gòu)標志著散熱管理方式的轉(zhuǎn)變。諸如開放計算項目(OCP)的冷卻環(huán)境倡議等行業(yè)組織正在推動這些方法的標準化。這種轉(zhuǎn)變體現(xiàn)在百億億次級超級計算機和高密度集群的出現(xiàn)上,在這些系統(tǒng)中,散熱不再是原始計算性能,而是瓶頸所在。
硅級冷卻劑分配使運營商能夠?qū)崿F(xiàn)關(guān)鍵的可持續(xù)性和性能目標:
- 與空氣式系統(tǒng)相比,散熱效率顯著提高。
- 大幅減少設(shè)施運行所需的冷空氣量。
- 整合閉環(huán)設(shè)計,消除持續(xù)的蒸發(fā)性水分損失。
- 能夠支持超過傳統(tǒng) 10 兆瓦限制的高密度 AI 集群。
部署液態(tài)基礎(chǔ)設(shè)施使運營商能夠在擴展計算能力的同時,保持可預(yù)測的環(huán)境足跡。標準化這些液態(tài)路徑可確保設(shè)施在升級硬件時無需重新設(shè)計散熱管理策略。下一代設(shè)施越來越依賴這種方法,尤其是在那些對散熱管理要求極高的專用高密度芯片艙中。
浸沒式冷卻
在這些系統(tǒng)中,特殊的浸沒式冷卻技術(shù)使服務(wù)器能夠浸入液浴中直接吸收熱量。加熱后的液體將熱量傳遞到輔助回路,該回路可以連接到干式冷卻器、混合系統(tǒng)或其他散熱方式。
浸沒式冷卻系統(tǒng)可以減少對傳統(tǒng)空氣處理的依賴,并且根據(jù)設(shè)施設(shè)計,可以顯著降低用水量。最終的散熱方式和能源來源決定了整體的可持續(xù)性。
可持續(xù)制冷創(chuàng)新:首先部署什么
設(shè)計一座節(jié)水型人工智能數(shù)據(jù)中心并非依靠單一突破,而是需要巧妙地循序漸進地進行改進。
從低成本氣流優(yōu)勢入手
優(yōu)化設(shè)施氣流和密閉性是降低數(shù)據(jù)中心PUE和WUE的首要步驟。這些措施能夠以最小的成本降低能源和用水需求,并得到了能源之星和聯(lián)邦機構(gòu)的既定指導(dǎo)。
在氣候條件允許的情況下,使用節(jié)能器和自然冷卻。
其次,在氣候條件允許的情況下部署節(jié)能器。較冷的地區(qū)可以利用室外空氣或水冷來減少冷水機組的運行時間,從而降低電力需求。
減少塔式冷卻系統(tǒng)中的水損
第三,如果使用蒸發(fā)冷卻塔,則應(yīng)改進水管理。增加濃縮循環(huán)次數(shù)并采用排污回收技術(shù)可以顯著降低耗水量。熱虹吸冷卻器混合系統(tǒng)試驗平臺表明,將干熱排放與冷卻塔相結(jié)合,可以在不犧牲可靠性的前提下減少現(xiàn)場用水量。
第四,在缺水地區(qū)過渡到混合干濕散熱系統(tǒng),以減少中等條件下的蒸發(fā)。
轉(zhuǎn)向液冷和閉環(huán)系統(tǒng)以提高人工智能密度
通過采用液冷或?qū)S眯酒壚鋮s系統(tǒng),可以擴展至高密度人工智能集群。微軟曾報道過一種用于下一代數(shù)據(jù)中心設(shè)計的零水冷方案,該方案通過使用閉環(huán)冷卻系統(tǒng)完全避免了水的蒸發(fā),這些冷卻系統(tǒng)只需加注一次即可持續(xù)循環(huán)。不過,微軟也指出,在某些氣候條件下,用全機械式冷卻系統(tǒng)取代蒸發(fā)式冷卻系統(tǒng)可能會增加能源消耗。
將廢熱轉(zhuǎn)化為有用資源
整合先進的余熱再利用方案,將熱能副產(chǎn)品轉(zhuǎn)化為社區(qū)能源資產(chǎn)。谷歌位于芬蘭哈米納的數(shù)據(jù)中心冷卻系統(tǒng)采用海水冷卻,并接入區(qū)域級熱回收項目,將多余的熱能輸送到本地電網(wǎng)。這表明,廢熱可以成為社區(qū)資源,而不是被丟棄的副產(chǎn)品。
參加當?shù)匾?guī)劃會議的居民發(fā)現(xiàn),全蒸發(fā)式冷卻塔和閉環(huán)液體冷卻系統(tǒng)之間的區(qū)別并非抽象的工程爭論。這可能意味著持續(xù)抽取地下水和主要依靠電力供應(yīng)來承擔用水負擔之間的區(qū)別。
人工智能制冷的未來很可能融合這些策略??沙掷m(xù)設(shè)施會最大限度地減少用水量,透明地報告諸如用水效率(WUE)和用水城市間相互作用(WUI)等指標,并使制冷設(shè)計與當?shù)丨h(huán)境實際情況相符。

零水蒸發(fā)和基于自然的散熱器解決方案
循環(huán)式或閉環(huán)式冷卻:零水蒸發(fā)的工作原理
閉環(huán)冷卻的通俗解釋
零水冷卻是一種工程方法,它通過循環(huán)固定體積的冷卻劑來避免持續(xù)蒸發(fā)。所有冷卻系統(tǒng)都使用導(dǎo)熱流體。其機械差異取決于水是蒸發(fā)到大氣中還是在密封回路中循環(huán)。
在閉式冷卻系統(tǒng)中,水或冷卻劑被注入密封回路并持續(xù)循環(huán)。服務(wù)器產(chǎn)生的熱量傳遞到該回路,然后通過干式冷卻器或其他非蒸發(fā)式系統(tǒng)排出。由于該系統(tǒng)不依賴蒸發(fā)散熱,因此不會持續(xù)消耗水。
零蒸發(fā)水會帶來哪些變化
下一代數(shù)據(jù)中心架構(gòu)采用芯片級液冷設(shè)計,徹底消除蒸發(fā)冷卻。微軟重點介紹了一種零水冷方案,該方案利用芯片級液冷和閉環(huán)系統(tǒng),避免了水的蒸發(fā),這些系統(tǒng)只需一次加注即可重復(fù)使用。微軟還指出,在某些氣候條件下,完全機械冷卻會增加能源消耗。
社區(qū)對水-能源權(quán)衡的真實感受
監(jiān)測地下水枯竭的社區(qū)認為,這種區(qū)別對當?shù)刭Y源管理至關(guān)重要。蒸發(fā)式冷卻塔會從當?shù)匮h(huán)系統(tǒng)中抽取水。閉環(huán)系統(tǒng)則將負擔轉(zhuǎn)移到電力生產(chǎn),而不是淡水抽取。這種在節(jié)水和能源效率之間的權(quán)衡,既是一個工程問題,也是一個政策問題。
干旱地區(qū)的居民起初可能分不清蒸發(fā)式冷卻和閉環(huán)式冷卻的區(qū)別。但一旦解釋說一種設(shè)計會持續(xù)消耗水,而另一種設(shè)計則主要增加電力需求,談話的內(nèi)容就會迅速改變。
自然界是如何降溫的,以及為什么它突然變得正常了。
當?shù)乩沓蔀槔鋮s基礎(chǔ)設(shè)施
在氣候和地理條件適宜、擁有天然散熱器的地區(qū),環(huán)境冷卻策略的效率最高。這些地區(qū)使運營商能夠完全繞過高能耗的機械冷卻器。天然散熱器是使人工智能基礎(chǔ)設(shè)施與當?shù)丨h(huán)境物理特性相適應(yīng)的最直接方式。
在芬蘭等沿海地區(qū),越來越多的設(shè)施利用海水進行冷卻,這種轉(zhuǎn)變的許多最引人注目的例子都涉及在極端地點最大限度地提高效率,在這些地方,運營商將環(huán)境視為基礎(chǔ)設(shè)施。
熱能再利用和區(qū)域供熱
熱回收協(xié)議將廢熱轉(zhuǎn)化為共享基礎(chǔ)設(shè)施,從而提升設(shè)施的整體循環(huán)利用率。設(shè)施不再將熱能排放到大氣中,而是可以與區(qū)域供熱系統(tǒng)對接,減少對化石燃料建筑供暖的需求。這種從廢熱到共享基礎(chǔ)設(shè)施的轉(zhuǎn)變體現(xiàn)了可持續(xù)城市更廣泛的設(shè)計理念。
實際上,這意味著附近公寓樓冬季的部分供暖可能由用于訓練人工智能模型的服務(wù)器提供。對居民而言,這一概念變得觸手可及:樓宇保持溫暖,服務(wù)器保持涼爽。系統(tǒng)從剝削轉(zhuǎn)變?yōu)榛セ莼ダ?/span>
這種方法最適用的場景
在氣候和地理條件有利于自然散熱的地區(qū),環(huán)境冷卻策略的效率最高。雖然這些策略并不能取代精心的設(shè)計,但它們表明,冷卻并非總是需要大規(guī)模的水蒸發(fā)。

社區(qū)參與指南:確保數(shù)據(jù)中心開發(fā)的透明度
如果您社區(qū)正在建設(shè)數(shù)據(jù)中心,以下是一些實用的核對清單。
冷卻和水問題
當擬在當?shù)亓饔蚪ㄔO(shè)新的數(shù)據(jù)中心時,技術(shù)咨詢有助于澄清社區(qū)的擔憂。如果居民能夠利用一份結(jié)構(gòu)化的技術(shù)問題清單來闡明設(shè)施的影響,那么參與討論的效果會更好。
- 將采用哪種冷卻方式?主要是蒸發(fā)冷卻、混合冷卻還是閉環(huán)液體冷卻?
- 預(yù)期用水效率是多少?將如何向公眾公布?
- 該設(shè)施是否會披露其用水量對當?shù)厮Y源壓力的影響?
- 市政供水、再生水和地下水的使用必須根據(jù)當?shù)亓饔騼?nèi)的區(qū)域水風險進行評估。
能源、熱能再利用和報告問題
- 是否有通過區(qū)域供熱或工業(yè)一體化實現(xiàn)熱能再利用的計劃?
- 可再生能源配額將如何分配?是按年度配額分配,還是按小時設(shè)定無碳目標,還是兩者兼而有之?
- 運營商是否會發(fā)布透明的可持續(xù)發(fā)展報告,以便進行獨立評估?
帶著這些問題,社區(qū)成員不再情緒化地做出反應(yīng);他們會認真對待人工智能基礎(chǔ)設(shè)施的工程現(xiàn)實。
真正的可持續(xù)發(fā)展勝利
由于冷卻塔的設(shè)計原理是蒸發(fā)水,因此人工智能基礎(chǔ)設(shè)施的可持續(xù)性取決于機械工程設(shè)計與當?shù)刭Y源限制的匹配程度。這一熱力學事實構(gòu)成了圍繞人工智能基礎(chǔ)設(shè)施可持續(xù)性爭論的根本基礎(chǔ)。
在最關(guān)鍵的領(lǐng)域設(shè)計能夠減少水資源消耗的系統(tǒng)才是真正的制勝之道。為了實現(xiàn)這一目標,一些成熟的技術(shù)正在被納入超大規(guī)模設(shè)計的主流:
- 閉式循環(huán)液冷。
- 混合式散熱系統(tǒng)。
- 空氣側(cè)和水側(cè)節(jié)能器。
- 工業(yè)余熱再利用策略。
這些不再是邊緣實驗。硬件瓶頸,例如CoWoS高級計算封裝瓶頸,會引發(fā)基礎(chǔ)設(shè)施需求的突然激增。冷卻升級正日益成為現(xiàn)代超大規(guī)模設(shè)計的常規(guī)組成部分。
隨著人工智能日益融入日常生活,支撐其運行的物理系統(tǒng)的可持續(xù)性將決定人工智能是被視為榨取型還是適應(yīng)型。技術(shù)本身并非問題所在,冷卻和能源方面的設(shè)計選擇才是決定其影響的關(guān)鍵。







參與評論 (0)