咨詢(xún)電話(huà)
021-80392549
相比幾年前談?wù)摰闹攸c(diǎn)只有GPU,在擁有CPU和DPU之后,英偉達(dá)作為系統(tǒng)公司能夠談?wù)摰脑?huà)題更加豐富。
在剛剛過(guò)去的Computex和時(shí)隔兩年重新回歸線(xiàn)下的ISC 2022(國(guó)際超級(jí)計(jì)算機(jī)大會(huì)),英偉達(dá)都展示了諸多其GPU、CPU、DPU的最新合作成果,這在很大程度上表明了英偉達(dá)的“三芯”策略已經(jīng)初見(jiàn)成效。
英偉達(dá)「三芯」策略初步奏效 | ISC 2022
另外,英偉達(dá)在混合量子計(jì)算中的成果,也體現(xiàn)了其在高性能計(jì)算領(lǐng)域的前瞻性布局。
當(dāng)然,英偉達(dá)CEO黃仁勛也在與媒體的交流中再次強(qiáng)調(diào),“英偉達(dá)是一家系統(tǒng)公司,提供從硬件到系統(tǒng)軟件的全棧方案,客戶(hù)可以按照其需求選擇我們的產(chǎn)品。加速計(jì)算的世界與CPU截然不同,我們的產(chǎn)品和方案非常獨(dú)特。”
英偉達(dá)的“三芯”到底如何加速那些世界上最快的加速系統(tǒng)?
獨(dú)特的CPU+GPU組合
GPU作為英偉達(dá)發(fā)明的產(chǎn)品,也是英偉達(dá)的標(biāo)簽,在今年GTC 22上,雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))介紹了英偉達(dá)最新一代Hopper架構(gòu)GPU H100發(fā)布,相比兩年前的Ampere架構(gòu)A100 GPU,實(shí)現(xiàn)了數(shù)量級(jí)的性能提升。
黃仁勛表示,20個(gè) H100 GPU 便可承托相當(dāng)于全球互聯(lián)網(wǎng)的流量,使其能夠幫助客戶(hù)推出先進(jìn)的推薦系統(tǒng)以及實(shí)時(shí)運(yùn)行數(shù)據(jù)推理的大型語(yǔ)言模型。
不過(guò),相比GPU,英偉達(dá)的Grace CPU更能吸引外界的關(guān)注。市場(chǎng)上已經(jīng)有很多優(yōu)秀的CPU產(chǎn)品,英偉達(dá)在這樣的背景下推出CPU讓人感到意外,也讓人好奇Grace CPU的不同之處。
當(dāng)被問(wèn)及Grace CPU有何獨(dú)特之處時(shí),黃仁勛說(shuō),“Grace旨在比其它CPU更好地解決與數(shù)據(jù)處理有關(guān)的問(wèn)題,能夠更高效處理大量數(shù)據(jù),并且與我們的GPU緊密結(jié)合,更好地完成解決AI任務(wù)。”
英偉達(dá)的Grace CPU超級(jí)芯片集成了兩個(gè)基于Arm的CPU,有多達(dá)144個(gè)高性能Arm Neoverse核心,并且?guī)в锌缮炜s矢量擴(kuò)展和1 TB/s的內(nèi)存子系統(tǒng),支持最新的PCIe Gen5協(xié)議,可實(shí)現(xiàn)與GPU之間最高性能連接,同時(shí)還能連接NVIDIA ConnectX-7智能網(wǎng)卡以及NVIDIA BlueField-3 DPU。
由此看來(lái),英偉達(dá)在設(shè)計(jì)Grace CPU之處就已經(jīng)非常明確要將其所有硬件產(chǎn)品之間很好地互聯(lián)。這也容易理解,隨著摩爾定律的放緩,異構(gòu)計(jì)算成為了未來(lái)趨勢(shì),作為提供高性能計(jì)算產(chǎn)品的公司,英偉達(dá)有這樣的布局也十分合理。
ISC 2022上,英偉達(dá)CPU+GPU的產(chǎn)品組合獲得了認(rèn)可,美國(guó)和歐洲的領(lǐng)先超級(jí)計(jì)算中心都將率先采用這兩款超級(jí)芯片。
美國(guó)阿拉莫斯國(guó)家實(shí)驗(yàn)室(LANL)今日宣布,其新一代系統(tǒng)Venado將成為美國(guó)首個(gè)采用NVIDIA Grace CPU技術(shù)的系統(tǒng)。Venado是使用HPE Cray EX超級(jí)計(jì)算機(jī)構(gòu)建而成的異構(gòu)系統(tǒng),將同時(shí)配備Grace CPU和Grace Hopper,這一系統(tǒng)建成后的AI性能預(yù)計(jì)將超過(guò)10 exaflops(10的18次方,百億億次)。
另一個(gè)率先采用英偉達(dá)Grace CPU和GPU的系統(tǒng)是瑞士國(guó)家計(jì)算中心的新系統(tǒng)Alps,基于HPE Cray EX超級(jí)計(jì)算機(jī)構(gòu)建,這是一個(gè)通用系統(tǒng),向瑞士及其他國(guó)家的研究者開(kāi)放。
英偉達(dá)還宣布,源訊、戴爾科技,技嘉科技、慧與、浪潮、聯(lián)想和超微宣布計(jì)劃部署基于Grace CPU和Grace Hopper超級(jí)芯片的服務(wù)器。
DPU帶來(lái)的大幅性能提升
DPU是一個(gè)新概念,在英偉達(dá)帶動(dòng)下成為備受關(guān)注的產(chǎn)品,涌現(xiàn)了大量初創(chuàng)公司以及資本的投入
DPU的核心價(jià)值是將通信和計(jì)算負(fù)載從CPU卸載,進(jìn)而獲得巨大的性能提升。不過(guò)DPU能夠帶來(lái)的具體的性能提升,仍然需要實(shí)踐證明,英偉達(dá)借著ISC 2022給出了一些案例。
英偉達(dá)「三芯」策略初步奏效 | ISC 2022
洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室(LANL)的杰出高級(jí)科學(xué)Poole 正與英偉達(dá)進(jìn)行一項(xiàng)為期多年的廣泛合作,旨在將計(jì)算多物理應(yīng)用的性能提高30倍。這其中包括使用 BlueField 及其N(xiāo)VIDIA DOCA軟件框架在計(jì)算存儲(chǔ)、模式匹配等。
LANL 已經(jīng)感受到網(wǎng)絡(luò)計(jì)算的強(qiáng)大功能,加速閃存盒(ABoF)將固態(tài)存儲(chǔ)與DPU和InfiniBand加速器相結(jié)合,可為 Linux 文件系統(tǒng)的關(guān)鍵性能部分提供加速。它的性能高達(dá)同類(lèi)存儲(chǔ)系統(tǒng)的30倍,并將成為 LANL 基礎(chǔ)架構(gòu)中的關(guān)鍵組件。
俄亥俄州立大學(xué)的研究人員展示了 DPU 如何將一個(gè)HPC熱門(mén)編程模型的運(yùn)行速度提高 21%。他們通過(guò)卸載消息傳遞接口(MPI)的關(guān)鍵部分,加速了P3DFFT,這是一個(gè)用于眾多大規(guī)模HPC仿真的數(shù)學(xué)庫(kù)。
對(duì)于運(yùn)行藥物研發(fā)或飛機(jī)設(shè)計(jì)等HPC仿真應(yīng)用的超級(jí)計(jì)算機(jī),DPU也能夠帶來(lái)高達(dá)兩位數(shù)的性能加速。
歐洲的多個(gè)研究團(tuán)隊(duì)正利用BlueField DPU 加速 MPI 和其他 HPC 工作負(fù)載。英格蘭北部的達(dá)勒姆大學(xué)正在開(kāi)發(fā)一款軟件,用于在 16 個(gè)節(jié)點(diǎn)的 Dell PowerEdge 集群上使用 BlueField DPU 以實(shí)現(xiàn) MPI 作業(yè)的負(fù)載均衡。劍橋大學(xué)、倫敦和慕尼黑等的研究人員也在使用 DPU。
DPU也在用于加速分子動(dòng)力學(xué)研究,還能用于氣候?qū)W、天體物理學(xué)、大數(shù)據(jù)、AI 和更多方面的研究。這些研究人員也在考慮如何使用新一代的BlueField-3 DPU 的核心功能。
三芯策略初步奏效,布局量子計(jì)算
高性能計(jì)算系統(tǒng)對(duì)于算力有著更高要求,也有獨(dú)特需求,在英偉達(dá)擁有了GPU、CPU和DPU之后,它能夠?qū)崿F(xiàn)更多的硬件組合,再配合上層的軟件系統(tǒng),能夠更好滿(mǎn)足前沿應(yīng)用和更高計(jì)算的需求。
通過(guò)ISC 2022的眾多成果展示,也能看到英偉達(dá)的三芯策略已經(jīng)初見(jiàn)成效,不同的產(chǎn)品和產(chǎn)品組合已經(jīng)在HPC、AI等應(yīng)用中實(shí)現(xiàn)性能的顯著提升。
不止于此,英偉達(dá)還在布局前沿的量子計(jì)算。