8月29日,2025數(shù)博會(huì)“算力聚勢(shì) 智能未來”交流活動(dòng)在貴陽(yáng)國(guó)際生態(tài)會(huì)議中心舉行。在圓桌對(duì)話環(huán)節(jié),華為數(shù)字政府系統(tǒng)部CTO馬華民解釋了華為為何要推出CloudMatrix 384超節(jié)點(diǎn)集群。
一是整個(gè)大模型的發(fā)展趨勢(shì),從小模型到大模型,從短序列到長(zhǎng)序列,單模態(tài)到多模態(tài),而且還是從快應(yīng)答到深度思考。首先是需求的驅(qū)動(dòng)力作為驅(qū)動(dòng)去開發(fā)一個(gè)新的形態(tài)。另外,依托國(guó)內(nèi)半導(dǎo)體的支撐,華為從2019年就進(jìn)入了實(shí)體清單,華為很多的芯片只能是設(shè)計(jì)出來,但是生產(chǎn)加工不出來。所以這也導(dǎo)致華為現(xiàn)在芯片單顆的算力和國(guó)外先進(jìn)的廠商還有一定的差距,這個(gè)差距在短時(shí)間內(nèi)還無法突破。為了彌補(bǔ)當(dāng)前的短板,華為推出了384超節(jié)點(diǎn)的架構(gòu),通過系統(tǒng)化的功能傳遞,來滿足當(dāng)前國(guó)內(nèi)國(guó)外的需求。
另外,華為384節(jié)點(diǎn)有16個(gè)機(jī)柜,其中12個(gè)機(jī)柜是算力節(jié)點(diǎn),4個(gè)是網(wǎng)絡(luò)機(jī)柜,通過4個(gè)網(wǎng)絡(luò)機(jī)柜把12個(gè)機(jī)柜里面進(jìn)行全光互聯(lián),實(shí)現(xiàn)了384顆芯片成為了一體機(jī),真正成為一個(gè)服務(wù)器,保證了可以實(shí)現(xiàn)卡和卡之間的時(shí)延達(dá)到了150納秒左右。而為什么要做384顆,是因?yàn)橛ミ_(dá)提出72個(gè)節(jié)點(diǎn),華為一定要超越對(duì)手,推出384節(jié)點(diǎn)這個(gè)集群是英偉達(dá)的1.67倍,而且華為的帶寬時(shí)延比他還要低。但是隨著技術(shù)的演進(jìn),華為還在規(guī)劃更大顆數(shù)的集群。
據(jù)悉,華為推出的CloudMatrix 384超節(jié)點(diǎn)集群,通過新型高速互聯(lián)總線實(shí)現(xiàn)384張卡互聯(lián)成為一個(gè)超級(jí)云服務(wù)器,單集群算力規(guī)模最高可達(dá)300P(超業(yè)界67%),訓(xùn)練效率提升至41%以上,并顯著降低模型訓(xùn)練成本。
記者 李奕璇
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.