智東西
作者 ZeR0
編輯 漠影
智東西8月23日?qǐng)?bào)道,NVIDIA昨夜推出一項(xiàng)重要網(wǎng)絡(luò)創(chuàng)新技術(shù)——NVIDIA Spectrum-XGS以太網(wǎng)。這項(xiàng)跨區(qū)域擴(kuò)展(scale-across)技術(shù)可將多個(gè)分布式數(shù)據(jù)中心組合成一個(gè)十億瓦級(jí)AI超級(jí)工廠。
NVIDIA Spectrum-X以太網(wǎng)提供橫向擴(kuò)展架構(gòu),可連接整個(gè)集群,快速將海量數(shù)據(jù)集傳輸?shù)紸I模型中,并協(xié)調(diào)整個(gè)數(shù)據(jù)中心的GPU間通信。Spectrum-XGS以太網(wǎng)是NVIDIA Spectrum-X以太網(wǎng)平臺(tái)的一部分,現(xiàn)可供貨。
年度芯片及系統(tǒng)架構(gòu)頂級(jí)會(huì)議Hot Chips舉行在即,AI推理和網(wǎng)絡(luò)將成為關(guān)注焦點(diǎn)。NVIDIA將在Hot Chips期間重點(diǎn)介紹NVIDIA Spectrum-XGS以太網(wǎng),并詳細(xì)分享NVIDIA網(wǎng)絡(luò)、數(shù)據(jù)中心機(jī)架、神經(jīng)渲染技術(shù)、NVIDIA GB10超級(jí)芯片與DGX Spark、集成硅光子學(xué)的共封裝光學(xué)器件(CPO)交換機(jī)等推理和加速計(jì)算領(lǐng)域的最新技術(shù)進(jìn)展。
隨著AI需求的激增,單個(gè)設(shè)施內(nèi)的數(shù)據(jù)中心功率和容量已達(dá)到極限。要實(shí)現(xiàn)數(shù)據(jù)中心擴(kuò)展,必須打破建筑物的限制,而現(xiàn)有的商用以太網(wǎng)網(wǎng)絡(luò)基礎(chǔ)設(shè)施因高延遲、高抖動(dòng)及性能的不可預(yù)測(cè)而無法滿足需求。
對(duì)此,NVIDIA Spectrum-X以太網(wǎng)平臺(tái)新增Spectrum-XGS以太網(wǎng),通過引入跨區(qū)域擴(kuò)展(scale-across)基礎(chǔ)設(shè)施打破了上述限制。
NVIDIA創(chuàng)始人兼CEO黃仁勛談道:“AI工業(yè)革命已經(jīng)到來,而巨型AI工廠是這場(chǎng)變革的核心基礎(chǔ)設(shè)施。繼縱向擴(kuò)展(scale-up)和橫向擴(kuò)展(scale-out)技術(shù)后,我們又通過推出NVIDIA Spectrum-XGS以太網(wǎng)提供跨區(qū)域擴(kuò)展(scale-across)技術(shù),將不同城市、國(guó)家乃至大洲的數(shù)據(jù)中心組合成龐大的十億瓦級(jí)的AI超級(jí)工廠。”
跨區(qū)域擴(kuò)展(scale-across)是繼縱向擴(kuò)展(scale-up)和橫向擴(kuò)展(scale-out)之后的AI計(jì)算“第三大支柱”。Spectrum-XGS以太網(wǎng)完全集成于Spectrum-X平臺(tái),通過算法實(shí)現(xiàn)了網(wǎng)絡(luò)和數(shù)據(jù)中心設(shè)施間距離動(dòng)態(tài)適配。
憑借先進(jìn)的、自動(dòng)調(diào)節(jié)的遠(yuǎn)距離擁塞控制、精準(zhǔn)延遲管理及端到端遙測(cè)技術(shù),Spectrum-XGS以太網(wǎng)將NVIDIA集合通信庫(kù)性能提升了近1倍,加速了多GPU和多節(jié)點(diǎn)的通信性能,實(shí)現(xiàn)了可預(yù)測(cè)異地AI集群的性能。這樣就可以將多個(gè)數(shù)據(jù)中心組合成一個(gè)統(tǒng)一的AI超級(jí)工廠運(yùn)行,全面優(yōu)化長(zhǎng)距離連接性能。
CoreWeave等超大規(guī)模云提供商已開始部署這種新基礎(chǔ)設(shè)施。其中CoreWeave將成為首批使用Spectrum-XGS以太網(wǎng)連接它的數(shù)據(jù)中心的企業(yè)。
Spectrum-X以太網(wǎng)網(wǎng)絡(luò)平臺(tái)為多租戶、超大規(guī)模AI工廠(包括全球最大的AI超級(jí)計(jì)算機(jī))提供的帶寬密度較傳統(tǒng)以太網(wǎng)高出1.6倍。該平臺(tái)由NVIDIA Spectrum-X交換機(jī)和NVIDIA ConnectX-8 SuperNIC組成,幫助構(gòu)建未來AI平臺(tái)的企業(yè)實(shí)現(xiàn)無縫擴(kuò)展、超低延遲和空前性能。
今日最新發(fā)布是NVIDIA一系列網(wǎng)絡(luò)創(chuàng)新技術(shù)發(fā)布的延續(xù),如NVIDIA Spectrum-X和NVIDIA Quantum-X CPO網(wǎng)絡(luò)交換機(jī)等,這些技術(shù)一起能夠?qū)⑽挥诓煌攸c(diǎn)的數(shù)百萬顆GPU組合成AI工廠,突破大規(guī)模AI基礎(chǔ)設(shè)施性能和效率的極限,同時(shí)降低能耗和運(yùn)營(yíng)成本。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.