成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

算力不開放,智能難平權(quán):萬億參數(shù)時(shí)代,誰為開源模型托底?

0
分享至



2025 年8月7日,恰逢開放計(jì)算技術(shù)大會(huì)開幕,立秋的北京酷熱難耐,仍然無法阻止全球ICT、智算從業(yè)者,以及不少想用好AI的企業(yè)前來參會(huì)的熱情。人潮涌動(dòng)的展廳,座無虛席的會(huì)場,說明各個(gè)行業(yè)都有不少落地AI的困惑與問題,迫切渴望尋找解決之法。

企業(yè)做AI,一定都遇到過這樣的情況:

下載了開源大模型,想自己訓(xùn)練專有模型,但服務(wù)器顯存不夠,萬億參數(shù)模型的推理頻繁中斷,跑一次崩一次;

業(yè)務(wù)部門的同事對AI的響應(yīng)時(shí)間極為敏感,多個(gè)模型及智能體協(xié)同作業(yè)時(shí),等待時(shí)間一長就怨聲載道,IT部門沒少吃投訴;

聽說超節(jié)點(diǎn)技術(shù)能解決算力問題,一打聽,這東西也太貴了,部署之前還得解決液冷、高壓供電、復(fù)雜互聯(lián)系統(tǒng)之類的要求,只有巨頭能玩,自家企業(yè)的現(xiàn)有IT設(shè)施無法上車。

如何在業(yè)務(wù)中用好開源大模型,是當(dāng)下企業(yè)智能化最迫切的任務(wù)。而具備開放架構(gòu)、成熟技術(shù)、穩(wěn)定高效部署的超節(jié)點(diǎn),成了希望所在。2025開放計(jì)算技術(shù)大會(huì)現(xiàn)場,浪潮信息展廳的元腦SD200超節(jié)點(diǎn),就吸引了不少觀眾駐足。



據(jù)了解,元腦SD200超節(jié)點(diǎn)AI服務(wù)器是浪潮信息面向萬億參數(shù)大模型AI時(shí)代而設(shè)計(jì),以開放設(shè)計(jì)支持64路本土GPU芯片,可單機(jī)運(yùn)行超萬億參數(shù)大模型,實(shí)現(xiàn)多模型機(jī)內(nèi)并行與智能體實(shí)時(shí)協(xié)作,采用創(chuàng)新多主機(jī)低延遲內(nèi)存語義通信架構(gòu),64卡整機(jī)推理性能呈超線性擴(kuò)展,更重要的是已實(shí)現(xiàn)商用部署,可高效支持企業(yè)實(shí)現(xiàn)多開源大模型的規(guī)?;瘧?yīng)用。

實(shí)現(xiàn)AI普惠化需要開源大模型與開放超節(jié)點(diǎn)的協(xié)同創(chuàng)新。以DeepSeek、KIMI等開源大模型為基礎(chǔ),結(jié)合元腦SD200商用開放超節(jié)點(diǎn)的強(qiáng)大算力支撐,將產(chǎn)生怎樣的技術(shù)倍增效應(yīng)?

咱們就從這場開放計(jì)算技術(shù)大會(huì)上行業(yè)熱議的話題聊起。



先進(jìn)的大模型開源了,意味著所有企業(yè)都能用好AI了?沒那么簡單。所謂智能平權(quán),是指不同規(guī)模的企業(yè)、組織乃至個(gè)人,都能公平獲取和運(yùn)用AI能力。

開源大模型的普及,確實(shí)為各類企業(yè)提供了技術(shù)底座。但許多企業(yè)在部署開源大模型時(shí),還會(huì)面臨一個(gè)共性問題:如何找到能高效承載萬億級模型的AI基礎(chǔ)設(shè)施,讓技術(shù)潛力真正落地為業(yè)務(wù)生產(chǎn)力?

首先,開源大模型邁向萬億級,穩(wěn)定運(yùn)行的前提是放得下。KIMI-K2為代表的先進(jìn)開源大模型參數(shù)量達(dá)萬億規(guī)模,特別是當(dāng)邁入Agentic AI(代理式AI)階段,企業(yè)一般不會(huì)只用一個(gè)大模型。為了充分發(fā)揮不同大模型的特色優(yōu)勢,多個(gè)超大規(guī)模參數(shù)的大模型同時(shí)跑起來,產(chǎn)生的KV Cache超過了傳統(tǒng)多卡服務(wù)器的承載極限,實(shí)時(shí)交互時(shí)往往因內(nèi)存溢出導(dǎo)致任務(wù)中斷。如何解決這個(gè)問題?



本次開放計(jì)算技術(shù)大會(huì)上,業(yè)內(nèi)討論了scale out(橫向擴(kuò)展)與scale up(縱向擴(kuò)展)兩條技術(shù)路線,共識是:超節(jié)點(diǎn)通過scale up在單機(jī)內(nèi)高密度集成計(jì)算單元,構(gòu)建單一統(tǒng)一計(jì)算域,實(shí)現(xiàn)超大統(tǒng)一顯存空間,是必然選擇。

其次,AI應(yīng)用不僅要能跑,還要跑得快。將多張加速卡連起來,但這還不夠。傳統(tǒng)架構(gòu)中,跨節(jié)點(diǎn)鏈路過長會(huì)導(dǎo)致通信延遲飆升,尤其在推理場景中,幾MB的小數(shù)據(jù)包高頻交互,對延遲極為敏感。特別是當(dāng)AI應(yīng)用從訓(xùn)練階段轉(zhuǎn)向推理與后訓(xùn)練為主,海量token的實(shí)時(shí)處理需要極致的通信效率,所以scale up系統(tǒng)還需要解決高效通信的問題。

更關(guān)鍵的是,技術(shù)方案必須能落地。再好的超節(jié)點(diǎn)系統(tǒng),如果不能被部署到企業(yè)現(xiàn)有設(shè)施中,不能響應(yīng)實(shí)際業(yè)務(wù)需求,那也只是畫餅而無法充饑。目前,企業(yè)普遍存在多品牌多批次芯片的混搭算力現(xiàn)狀,而模型在異構(gòu)算力平臺間遷移困難的問題,正成為AI落地的主要障礙。而開放架構(gòu)的超節(jié)點(diǎn),可以兼容多元算力芯片,讓企業(yè)原來的IT投資不浪費(fèi),掌握選擇權(quán),并通過開源軟件生態(tài),支持模型的快速遷移與AI應(yīng)用的敏捷上線。





所以,能落地的開放超節(jié)點(diǎn),也就和開源大模型一起,成為智能平權(quán)的兩大基本要素,讓企業(yè)真正實(shí)現(xiàn)“技術(shù)平權(quán)、智能平權(quán)”。

回應(yīng)最終用戶的所想所要,才是企業(yè)級市場真正需要的超節(jié)點(diǎn),而以應(yīng)用導(dǎo)向、客戶需求來研發(fā),才能構(gòu)成對市場的正向引導(dǎo)??陀^來看,市面上成熟可商用的開放超節(jié)點(diǎn),并不多見。所以,元腦SD200在此次大會(huì)上讓大家格外關(guān)注。

那么,打造開放超節(jié)點(diǎn),究竟存在什么難點(diǎn)呢?



基于開放架構(gòu)的超節(jié)點(diǎn),為開源大模型的規(guī)模化落地和應(yīng)用創(chuàng)新提供支撐,二者協(xié)同才能真正突破算法與算力的雙重壁壘。這個(gè)理想很豐滿,但把開放超節(jié)點(diǎn)從理念轉(zhuǎn)化為成熟可商用的產(chǎn)品,并非易事。

首要挑戰(zhàn)就是構(gòu)建大規(guī)模、高集成度的Scale Up系統(tǒng),Scale out技術(shù)比較成熟,實(shí)現(xiàn)起來更簡單。而Scale Up的復(fù)雜度更高,以前的一些成熟技術(shù)和管理軟件也不夠用,需要針對性地開發(fā)。

其次,便是工程化的問題。芯片的跨距離傳輸會(huì)受到光模塊的影響,故障率和功耗都會(huì)影響傳輸性能。銅纜又有連接極限,怎么在有限的空間內(nèi)堆積更多的計(jì)算芯片,需要?jiǎng)?chuàng)新的架構(gòu)設(shè)計(jì)和工程實(shí)踐。



顯然,要把開放超節(jié)點(diǎn)帶進(jìn)現(xiàn)實(shí),必須得系統(tǒng)性創(chuàng)新。因此,元腦SD200率先闖過重重難關(guān),為行業(yè)提供了有益的實(shí)踐參考。具體是怎么做的?

第一步,開放架構(gòu),構(gòu)建AI可用的算力底座。

基于OCM(開放算力模組)+OAM(開放加速模塊)融合架構(gòu),元腦SD200實(shí)現(xiàn)多元算力芯片兼容,單機(jī)可集成64路本土GPU芯片,滿足萬億規(guī)模大模型運(yùn)行的算力需求。采用3D Mesh開放架構(gòu),實(shí)現(xiàn)8倍顯存擴(kuò)增,單機(jī)可提供4TB顯存與64TB內(nèi)存,支持1.2萬億參數(shù)Kimi K2模型的流暢推理。這種模塊化設(shè)計(jì)支持靈活擴(kuò)展,解決了傳統(tǒng)架構(gòu)在部署成本、擴(kuò)展難度和長期運(yùn)維上的痛點(diǎn),顯著降低開源大模型的落地門檻。



第二步,軟硬協(xié)同,實(shí)現(xiàn)AI好用的性能優(yōu)化。

軟件在超節(jié)點(diǎn)復(fù)雜的系統(tǒng)當(dāng)中,發(fā)揮著非常重要的作用。元腦SD200通過智能總線管理,實(shí)現(xiàn)64卡全局最優(yōu)路由自動(dòng)創(chuàng)建,支持多拓?fù)潇`活切換與資源按需分配。結(jié)合預(yù)填充-解碼(Prefill-Decoder)分離推理框架,系統(tǒng)實(shí)現(xiàn)軟硬件深度協(xié)同,智能化調(diào)度復(fù)雜AI計(jì)算任務(wù)。

軟硬協(xié)同的創(chuàng)新設(shè)計(jì),實(shí)現(xiàn)了性能的超線性擴(kuò)展,讓元腦SD200在大模型場景中展示出非常好的性能表現(xiàn),比如,滿機(jī)運(yùn)行DeepSeek R1全參模型推理性能超線性提升比為3.7倍,滿機(jī)運(yùn)行Kimi K2全參模型推理性能超線性提升比為1.7倍。說明超節(jié)點(diǎn)并不是堆更多卡就夠了,還要有軟硬協(xié)同、系統(tǒng)優(yōu)化,才能拉開差距。

第三步,產(chǎn)業(yè)鏈整合,打造AI易用的成熟方案。

據(jù)了解,元腦SD200采用了很多開源開放的技術(shù),作為系統(tǒng)級廠商,浪潮信息牽引產(chǎn)業(yè)鏈上下游開展協(xié)同創(chuàng)新。比如,元腦SD200原生支持PyTorch、TensorFlow等主流框架,確保本土頂級開源模型的無縫遷移與Day0快速上線。其高效風(fēng)冷散熱設(shè)計(jì)無需改造現(xiàn)有機(jī)房,成熟度與穩(wěn)定性優(yōu)勢顯著,可以靈活部署到企業(yè)已有的數(shù)據(jù)中心機(jī)房里,快速上線業(yè)務(wù)。

這種系統(tǒng)性創(chuàng)新使元腦SD200成為開放超節(jié)點(diǎn)的標(biāo)桿產(chǎn)品。萬億級模型也放得下、跑得快、能落地,元腦SD200的成功闖關(guān),把智能平權(quán)從口號變成了可觸摸的現(xiàn)實(shí),讓業(yè)內(nèi)看到了開放超節(jié)點(diǎn)的可行性。



今年一月,OpenAI CEO山姆?奧特曼坦言在開源問題上“OpenAI可能站錯(cuò)了歷史的一邊”,中國的DeepSeek、通義千問等開源模型迅速崛起,特朗普政府呼吁美國AI 開發(fā)商更多開源技術(shù)……

這些2025年的AI產(chǎn)業(yè)新變化,可以匯總出一個(gè)清晰的趨勢:通過開源開放,讓AI成為全社會(huì)的生產(chǎn)力工具,實(shí)現(xiàn)智能平權(quán),是技術(shù)演進(jìn)與產(chǎn)業(yè)發(fā)展的必然選擇。

但開源大模型爆發(fā)式增長的同時(shí),大模型落地的算力門檻,卻讓不少企業(yè)只能望“智”興嘆。



這時(shí)候,浪潮信息以元腦SD200開放超節(jié)點(diǎn)為支點(diǎn),將開放架構(gòu)與開源模型深度耦合,正站在歷史前進(jìn)的方向上。

為什么浪潮信息會(huì)成為開放超節(jié)點(diǎn)的破局者?打造成熟可商用的開放超節(jié)點(diǎn),要求企業(yè)具備橫跨硬件架構(gòu)、軟件棧優(yōu)化、生態(tài)協(xié)同的系統(tǒng)級能力。元腦SD200從芯片互連到應(yīng)用調(diào)度的全棧創(chuàng)新,正是系統(tǒng)級廠商獨(dú)有的技術(shù)壁壘。

更關(guān)鍵的是系統(tǒng)級廠商的產(chǎn)業(yè)鏈整合能力。

浪潮信息副總經(jīng)理趙帥表示,以應(yīng)用為導(dǎo)向,以系統(tǒng)為核心,聚焦系統(tǒng)架構(gòu)的創(chuàng)新,在當(dāng)前的成本和應(yīng)用性能約束的條件下,思考怎么為用戶創(chuàng)造更大的價(jià)值,這是最佳的突破路徑。



他提到,后續(xù)浪潮信息也會(huì)持續(xù)超節(jié)點(diǎn)架構(gòu)的開放戰(zhàn)略,通過技術(shù)共享促進(jìn)產(chǎn)業(yè)鏈協(xié)同創(chuàng)新,加速超節(jié)點(diǎn)技術(shù)的產(chǎn)業(yè)化進(jìn)程。隨著產(chǎn)業(yè)生態(tài)的成熟和市場選擇的多元化,企業(yè)將獲得更優(yōu)化的技術(shù)方案選擇:既能夠滿足高性能計(jì)算需求,又能實(shí)現(xiàn)更合理的成本。這一開放策略將有效降低技術(shù)應(yīng)用門檻,推動(dòng)AI基礎(chǔ)設(shè)施的規(guī)模化普及。

當(dāng)更多企業(yè)加入超節(jié)點(diǎn)應(yīng)用陣營,智算產(chǎn)業(yè)的市場蛋糕將持續(xù)做大,整個(gè)產(chǎn)業(yè)鏈也將在規(guī)模效應(yīng)中共享增長價(jià)值。

不難發(fā)現(xiàn),開放的生態(tài)活力,最終會(huì)反哺系統(tǒng)級廠商自身。通過開放架構(gòu),浪潮信息的技術(shù)壁壘與標(biāo)準(zhǔn)壁壘,有望構(gòu)建起長期優(yōu)勢,在全球市場獲得更大競爭力,打開廣闊商業(yè)空間。

以開源開放牽引產(chǎn)業(yè)鏈升級,進(jìn)擊全球智算市場,中國智算企業(yè)正站在歷史前進(jìn)的方向上——這或許是開放計(jì)算技術(shù)大會(huì)和元腦SD200超節(jié)點(diǎn),帶給我們的終極啟示。

這條智能平權(quán)之路,值得中國智算產(chǎn)業(yè)鏈全力以赴。



聲明:個(gè)人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
明早開打!美網(wǎng)女單半決賽出爐:薩巴vs佩古拉 大坂直美PK阿尼西莫娃

明早開打!美網(wǎng)女單半決賽出爐:薩巴vs佩古拉 大坂直美PK阿尼西莫娃

愛奇藝體育
2025-09-04 16:11:25
特朗普發(fā)表涉九三閱兵言論,中方回應(yīng)

特朗普發(fā)表涉九三閱兵言論,中方回應(yīng)

新京報(bào)
2025-09-04 17:03:03
破案了!九三閱兵解說員揭曉,原來是他們兩位,都是央視知名主持

破案了!九三閱兵解說員揭曉,原來是他們兩位,都是央視知名主持

小娛樂悠悠
2025-09-04 09:03:04
九三閱兵結(jié)束,第一個(gè)受害者出現(xiàn)了,網(wǎng)友安慰郭帆大膽一點(diǎn)。

九三閱兵結(jié)束,第一個(gè)受害者出現(xiàn)了,網(wǎng)友安慰郭帆大膽一點(diǎn)。

尋墨閣
2025-09-04 08:03:40
榮耀Magic7 Pro售價(jià)大跳水,16GB+1TB跌價(jià)1600元,5850mAh+IP69

榮耀Magic7 Pro售價(jià)大跳水,16GB+1TB跌價(jià)1600元,5850mAh+IP69

科技阿維
2025-09-04 18:34:43
我65歲才明白:一定不要在親生兒女眼前,輕易講出這3句話,切記

我65歲才明白:一定不要在親生兒女眼前,輕易講出這3句話,切記

紅豆講堂
2025-09-04 11:19:01
社保斷繳、未繳滿15年或20年,2025年新規(guī)下,全都這樣處理!

社保斷繳、未繳滿15年或20年,2025年新規(guī)下,全都這樣處理!

新浪財(cái)經(jīng)
2025-09-04 16:11:44
002167,開盤一度快速漲停!固態(tài)電池訂單激增

002167,開盤一度快速漲停!固態(tài)電池訂單激增

數(shù)據(jù)寶
2025-09-04 14:50:14
1945年日本戰(zhàn)敗,蔣介石放過岡村寧次,為何卻非殺酒井隆不可?

1945年日本戰(zhàn)敗,蔣介石放過岡村寧次,為何卻非殺酒井隆不可?

朝夕說史
2025-09-03 09:52:38
九旬日本退伍老兵還想打中國?被問為何執(zhí)著,他說了3個(gè)原因

九旬日本退伍老兵還想打中國?被問為何執(zhí)著,他說了3個(gè)原因

別人都叫我阿腈
2025-08-26 15:36:19
蔚來向邁凱倫輸出技術(shù) 二季度技術(shù)服務(wù)收入已達(dá)數(shù)億元

蔚來向邁凱倫輸出技術(shù) 二季度技術(shù)服務(wù)收入已達(dá)數(shù)億元

TechWeb
2025-09-04 17:20:05
俄軍3架圖160轟炸機(jī)接連出事!被迫徹底放棄空襲

俄軍3架圖160轟炸機(jī)接連出事!被迫徹底放棄空襲

項(xiàng)鵬飛
2025-09-04 18:07:34
官宣,鄭欽文迎喜訊,喜悅發(fā)聲,媽媽擔(dān)心難題解決,李娜祝福

官宣,鄭欽文迎喜訊,喜悅發(fā)聲,媽媽擔(dān)心難題解決,李娜祝福

東球弟
2025-09-04 11:05:22
分散性雷暴大風(fēng)來襲,武漢發(fā)布強(qiáng)對流黃色預(yù)警

分散性雷暴大風(fēng)來襲,武漢發(fā)布強(qiáng)對流黃色預(yù)警

極目新聞
2025-09-04 14:28:10
馬斯克長子自稱與父親斷絕關(guān)系后生活拮據(jù)

馬斯克長子自稱與父親斷絕關(guān)系后生活拮據(jù)

環(huán)球時(shí)報(bào)國際
2025-09-03 19:31:24
哈佛發(fā)聲:血糖高不用治?顛覆認(rèn)知的真相藏在這,別再盲目控糖了

哈佛發(fā)聲:血糖高不用治?顛覆認(rèn)知的真相藏在這,別再盲目控糖了

王二哥老搞笑
2025-09-03 10:49:12
不開心就去看吳京的評論區(qū),全是笑料,網(wǎng)友的嘴一個(gè)比一個(gè)毒辣

不開心就去看吳京的評論區(qū),全是笑料,網(wǎng)友的嘴一個(gè)比一個(gè)毒辣

探源歷史
2025-09-03 15:53:40
美國一夜沒睡,這回信號明確,英媒坦言中國已在多個(gè)領(lǐng)域趕超美國

美國一夜沒睡,這回信號明確,英媒坦言中國已在多個(gè)領(lǐng)域趕超美國

淡然小司
2025-09-04 12:46:18
斯洛伐克總理出席中國閱兵,臨行之前,說了句讓歐洲汗顏的話

斯洛伐克總理出席中國閱兵,臨行之前,說了句讓歐洲汗顏的話

通文知史
2025-09-03 18:00:03
時(shí)隔4年,華為史上最強(qiáng)麒麟9020芯片回歸!三折疊17999元開售,國產(chǎn)黑科技引爆全場

時(shí)隔4年,華為史上最強(qiáng)麒麟9020芯片回歸!三折疊17999元開售,國產(chǎn)黑科技引爆全場

智東西
2025-09-04 16:22:11
2025-09-04 20:07:00
腦極體 incentive-icons
腦極體
從智能密鑰到已知盡頭
3425文章數(shù) 167033關(guān)注度
往期回顧 全部

科技要聞

17999元起!華為發(fā)布三折疊屏手機(jī)新品

頭條要聞

特朗普稱九三閱兵應(yīng)突出美為止戰(zhàn)提供的幫助 中方回應(yīng)

頭條要聞

特朗普稱九三閱兵應(yīng)突出美為止戰(zhàn)提供的幫助 中方回應(yīng)

體育要聞

“他就像是身高2米的梅西”

娛樂要聞

墻倒眾人推!胡歌張譯的仇終于有人報(bào)

財(cái)經(jīng)要聞

A股久違的深跌出現(xiàn)了 下一步思路是什么

汽車要聞

對話仇雨菁:七年磨一劍,芯馳科技的破局之路

態(tài)度原創(chuàng)

旅游
房產(chǎn)
數(shù)碼
公開課
軍事航空

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

房產(chǎn)要聞

臨春、桶井、南丁…三亞開啟新一輪大征收!

數(shù)碼要聞

追覓T60 Ultra體驗(yàn):首發(fā)“雙刮洗”機(jī)械臂,洗地太好用

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

全網(wǎng)獨(dú)家!九三閱兵全圖鑒

無障礙瀏覽 進(jìn)入關(guān)懷版