人工智能迫使數(shù)據(jù)中心重新思考設(shè)計
隨著人工智能在企業(yè)中的大規(guī)模應(yīng)用,其后果之一是其消耗了數(shù)據(jù)中心更大比例的工作負(fù)載。
人工智能不僅將加速對數(shù)據(jù)中心的需求,為投資創(chuàng)造新的動力,而且還將對數(shù)據(jù)中心的可持續(xù)性戰(zhàn)略和要部署的基礎(chǔ)設(shè)施的性質(zhì)產(chǎn)生影響。
例如,Tirias Research預(yù)測,按照目前的情況,到2028年,生成式人工智能數(shù)據(jù)中心服務(wù)器基礎(chǔ)設(shè)施加上運營成本將超過7600萬美元,是Amazon AWS目前估計年度運營成本的兩倍多,占全球云服務(wù)市場的三分之一。
預(yù)測硬件計算性能將提高400%,這與Tirias估計的處理工作負(fù)載將增加50倍相比,相形見絀。
更高的密度
根據(jù)Schneider Electric的一份新白皮書,大型訓(xùn)練集群和小型邊緣推理服務(wù)器的爆炸式增長,也將意味著向更高機架功率密度的轉(zhuǎn)變。
白皮書稱:“人工智能初創(chuàng)企業(yè)、企業(yè)、主機托管提供商和互聯(lián)網(wǎng)巨頭現(xiàn)在必須考慮這些密度對數(shù)據(jù)中心物理基礎(chǔ)設(shè)施的設(shè)計和管理的影響。”
Schneider能源管理研究中心對人工智能對能源需求的影響做出了自己的預(yù)測。據(jù)估計,人工智能目前代表著4.3GW的電力需求,到2028年將以26%至36%的復(fù)合年增長率增長。
這將導(dǎo)致總需求達(dá)到13.5GW至20GW,是數(shù)據(jù)中心整體電力需求增長的兩到三倍。到2028年,人工智能工作負(fù)載將占數(shù)據(jù)中心總能源的20%。
Schneider指出,雖然預(yù)計會比訓(xùn)練集群消耗更多的電量,但推理工作負(fù)載可以在各種機架密度下運行。
“另一方面,人工智能訓(xùn)練工作負(fù)載一直以非常高的密度運行,每個機架的功率在20-100 kW或更高。”
“網(wǎng)絡(luò)需求和成本推動這些培訓(xùn)機架聚集在一起。這些極高功率密度的集群從根本上挑戰(zhàn)了數(shù)據(jù)中心的電源、冷卻、機架和軟件管理設(shè)計。”
動力系統(tǒng)的挑戰(zhàn)
Schneider概述了四個關(guān)鍵領(lǐng)域可能產(chǎn)生的影響:電源、冷卻、機架和軟件管理。
在電力方面,人工智能工作負(fù)載對開關(guān)設(shè)備和配電系統(tǒng)的動力系統(tǒng)提出了挑戰(zhàn)。
目前使用的一些電壓將被證明部署起來不切實際,而較小的配電塊尺寸可能會浪費IT空間。較高的機架溫度也會增加發(fā)生故障和危險的機會。
隨著數(shù)據(jù)中心過渡到液體冷卻,冷卻將是至關(guān)重要的,也是需要進(jìn)行重大改變的領(lǐng)域之一,半個多世紀(jì)以來,液體冷卻一直用于專業(yè)高性能計算。
Schneider表示:“盡管在不久的將來,空氣冷卻仍將存在,但預(yù)測,從空氣冷卻到液體冷卻的轉(zhuǎn)變將成為具有人工智能集群的數(shù)據(jù)中心的首選或必要解決方案。”
“與空氣冷卻相比,液體冷卻具有許多優(yōu)點,例如提高處理器可靠性和性能、節(jié)省空間和更高的機架密度、管道中水的熱慣性更大以及減少用水量。”
對于人工智能集群,服務(wù)器需要更深入,電力需求更大,冷卻也更復(fù)雜。
因此,機架需要具有更大的密度和承重能力。
數(shù)字孿生
最后,DCIM、BMS和電氣設(shè)計工具等軟件工具將成為管理人工智能集群的關(guān)鍵。
適當(dāng)配置和實施的軟件可以提供數(shù)據(jù)中心的數(shù)字孿生,以識別功率限制和冷卻資源的性能,從而為更好的布局決策提供信息。
在日益動態(tài)的環(huán)境中,容錯空間越小,操作風(fēng)險就會越高。因此,Schneider建議創(chuàng)建整個IT空間的數(shù)字孿生,包括機架中的設(shè)備和虛擬機。
”通過數(shù)字化添加或移動IT負(fù)載,可以驗證是否有足夠的電力、冷卻和地板承重能力來支持。這為決策提供了信息,以避免資源擱淺,并最大限度地減少可能導(dǎo)致停機的人為錯誤。“
- 上一篇
云邊協(xié)同架構(gòu):實現(xiàn)深度集成的跨層次服務(wù)
隨著信息技術(shù)的飛速發(fā)展,云計算和邊緣計算逐漸成為了現(xiàn)代社會的支柱。然而,單純地將云計算和邊緣計算視為兩個孤立的領(lǐng)域,已經(jīng)不再能夠滿足日益復(fù)雜和多樣化的應(yīng)用需求。因此,云邊協(xié)同架構(gòu)應(yīng)運而生,成為了實現(xiàn)深度集成的跨層次服務(wù)的關(guān)鍵。
- 下一篇
揭秘物聯(lián)網(wǎng)網(wǎng)關(guān):物聯(lián)網(wǎng)無縫通信背后的引擎
物聯(lián)網(wǎng)網(wǎng)關(guān)是連接設(shè)備與其他設(shè)備以及云的重要樞紐。其工作過程涉及數(shù)據(jù)采集、傳輸、處理等多個環(huán)節(jié)。在此過程中,物聯(lián)網(wǎng)網(wǎng)關(guān)必須與多個設(shè)備連接,以便將收集到的數(shù)據(jù)上傳到云端。此外,所有這些都需要可靠的硬件和軟件。