我們能從超級計算機革命中學(xué)到什么
當(dāng)然,你辦公桌上或公司數(shù)據(jù)中心的系統(tǒng)與最快的系統(tǒng)相比,仍存在巨大的性能差異,即使你口袋里的智能手機的處理能力超過了載人登月的處理能力。超級計算機現(xiàn)在正在進(jìn)入“億億億次”時代,提供億億次的處理能力,這意味著它們每秒可以計算超過1018次IEEE 754雙精度(64位)算術(shù)運算。這些系統(tǒng)的成本超過了大多數(shù)組織的承受能力,高達(dá)數(shù)億美元。它們往往是大型大學(xué)、政府和跨國研究機構(gòu)的領(lǐng)域,資源被共享給這個星球上最具突破性的科學(xué)項目。
但在許多情況下,這些系統(tǒng)的基礎(chǔ)現(xiàn)在離公司服務(wù)器、工作站甚至家用臺式機和筆記本電腦并不遙遠(yuǎn)。第一臺億億次超級計算機是最近委托橡樹嶺國家實驗室的Frontier,它擁有136,408個AMD EPYC 7a 53 CPU,每個CPU有64個核心。這些是配備Zen 3內(nèi)核的第三代AMD EPYC處理器的特殊“Trento”變體,因此是最近在數(shù)據(jù)中心和云服務(wù)中推出的同一“米蘭”一代的一部分。Frontier的GPU加速也來自AMD,以Instinct系列的形式出現(xiàn),它與最終用戶應(yīng)用程序使用的GPU也相差不遠(yuǎn)——只是專門用于GPU計算。
在歐洲,該地區(qū)最快的超級計算機(在全球500強名單)是LUMI,但它的故事更有趣,因為它不僅功能強大,而且其設(shè)計初衷是盡可能減少對環(huán)境的影響。它可以從其20萬個內(nèi)核中提供高達(dá)550 petaFLOPS的速度,但它是由綠色水電能源提供動力的。它產(chǎn)生的熱量被收集起來,用來為該地區(qū)的建筑物供暖。這將是有用的,考慮到LUMI位于芬蘭,眾所周知其寒冷的冬季天氣??紤]到COP26協(xié)議和應(yīng)對氣候變化的日益增長的需求,隨著我們的超級計算和一般計算需求的擴(kuò)大,我們必須考慮這對環(huán)境的影響。
LUMI超級計算機朝著自己的億億次計算能力邁出的一步,這有可能通過安裝在德國于利希超級計算中心的JUPITER(創(chuàng)新和變革性億次計算研究的聯(lián)合先驅(qū))來實現(xiàn)。歐盟將撥出5億歐元用于硬件、安裝和基礎(chǔ)設(shè)施建設(shè)。木星預(yù)計將在2024年后上線,與一系列超級計算設(shè)施并列。
木星內(nèi)部的硬件尚未得到證實,但AMD的處理器可能會在運行中,因為他們已經(jīng)贏得了許多這些項目,由于他們的效率。目前,前十名最快的超級計算機中有五名使用AMD處理器,前二十名中有十名使用AMD處理器。從效率的角度來看,在Frontier出現(xiàn)之前,世界上最快的超級計算機是日本的Fugaku。它的平均功耗為29MW。Frontier還沒有用500強榜單的高性能共軛梯度(HPCG)基準(zhǔn)進(jìn)行衡量,但在主要前10名名單它的Rpeak分?jǐn)?shù)是它的三倍多,Rmax分?jǐn)?shù)也是它的近三倍。然而,它只消耗了19MW,這表明其AMD EPYC驅(qū)動的硬件與Fugaku的富士通A64FX 48核ARM處理器相比是多么高效。JUPITER的目標(biāo)是以僅15MW的功耗提供億億次計算。
由于能源價格快速上漲,電力使用已經(jīng)成為一個主要的環(huán)境問題,這種效率對于高性能計算(HPC)的未來至關(guān)重要。Frontier提供的每兆瓦petaFLOPS是Fugaku的近五倍,提供了更便宜、更環(huán)保的超級計算。但是HPC甚至更多的日常服務(wù)器應(yīng)用程序可以通過采用一些超級計算的方法來模擬這種效率。AMD EPYC處理器的核心密度和效率也可在常規(guī)基座和機架安裝格式。
使用x86兼容CPU的超級計算機還有其他好處,比如AMD的EPYC。目前排名前十的超級計算機中有四個采用了非x86處理器,但是為了利用它們巨大的處理能力,有必要廣泛定制應(yīng)用程序以在它們的硬件上運行。相比之下,像Frontier和LUMI這樣的超級計算機運行x86代碼,因此盡管它們有更大的規(guī)模和必要的特定優(yōu)化來利用這一點,但這可以從最初針對更普通的商用硬件的軟件中派生出來。
研究人員可以在部門服務(wù)器或本地數(shù)據(jù)中心測試他們的工作負(fù)載,以在超級計算機上釋放它們之前消除錯誤。事實上,在Frontier到來之前,這就是研究人員一直在做的事情,通過加速應(yīng)用就緒中心,該中心為八個科學(xué)團(tuán)隊提供了訪問測試節(jié)點的機會。他們能夠測試自己的工作負(fù)載,包括天體物理學(xué)、分子動力學(xué)、光子科學(xué)和生物系統(tǒng)。
這種代碼的通用性也包括超級計算機GPU,與CPU一樣,它與不太專業(yè)的硬件有足夠的共同點,使得在非超級計算機硬件上測試工作負(fù)載成為可能。AMD的HIP開發(fā)環(huán)境和ROCm驅(qū)動程序等軟件甚至可以通過適度的努力將GPU代碼從競爭對手的硬件中移植過來。
基于計算流體動力學(xué)(CFD)或TensorFlow機器學(xué)習(xí)等工作負(fù)載的超級計算機代碼可以提供令人難以置信的結(jié)果,例如分別計算車輛空氣動力學(xué)和人工智能模型。這些結(jié)果可以用同一家族的代碼在較弱的系統(tǒng)上以較小的規(guī)模復(fù)制。在超級計算環(huán)境中對這些現(xiàn)代任務(wù)的了解甚至可以為那些無法訪問的人帶來巨大的紅利。超級計算機也被部署來加強網(wǎng)絡(luò)安全,測試各種場景,并尋找可以在政府和商業(yè)組織中推廣的保護(hù)措施。
在誕生之初,超級計算機被部署來處理任何其他設(shè)備都無法處理的工作負(fù)載。與桌面系統(tǒng)和常規(guī)數(shù)據(jù)中心相比,它們?nèi)匀痪哂星八从械囊?guī)模。但是,這兩個領(lǐng)域之間的連續(xù)性比以往任何時候都要多,特別強調(diào)計算對環(huán)境的影響。最新超級計算機的效率適用于每個級別的計算,這要歸功于類似的架構(gòu)也適用于較小的數(shù)據(jù)中心。我們還可以受益于可以在通用硬件上運行的面向超級計算機的軟件,反之亦然。超級計算革命不僅僅是罕見的專門機器,而是在數(shù)據(jù)處理活動的整個范圍內(nèi)提供學(xué)習(xí)。
- 上一篇
測試和驗證在專用網(wǎng)絡(luò)部署中的重要作用
物聯(lián)網(wǎng)和5G專用網(wǎng)絡(luò)有可能在未來幾年徹底改變商業(yè)運營。事實上,70%的企業(yè)準(zhǔn)備利用部署物聯(lián)網(wǎng)專用網(wǎng)絡(luò)的優(yōu)勢。然而,對于不知情的采納者來說,仍然存在重大挑戰(zhàn)。
- 下一篇
中小企業(yè)能從超級計算革命中學(xué)到什么
曾幾何時,超級計算機與商業(yè)中使用的日常系統(tǒng)非常不同。它們?nèi)匀皇欠浅I(yè)的機器,但現(xiàn)在規(guī)模大于核心技術(shù)。即使是世界上最快的超級計算機和第一個Exascale系統(tǒng)Frontier,也是基于與高端游戲PC相差不遠(yuǎn)的硬件。