成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

從DS這串“亂碼”到寒武紀(jì)爆發(fā),更大驚喜是……

0
分享至


DeepSeek V3.1提及的UE8M0 FP8引爆了輿論,但我們也要清醒看到,其意義并非在于技術(shù)上的原創(chuàng)性突破,而是標(biāo)志著國產(chǎn)AI產(chǎn)業(yè)鏈協(xié)同邁入新階段。它的核心意圖在于串聯(lián)起芯片廠商適配、大模型工具鏈優(yōu)化,打破“單點(diǎn)創(chuàng)新”困局。盡管國產(chǎn)算力仍有短板,但上下游企業(yè)從協(xié)同設(shè)計(jì)到生態(tài)聯(lián)盟的探索,正以“1+1>2”的合力,為中國AI全產(chǎn)業(yè)鏈突圍筑牢根基。

最近一周,半導(dǎo)體成為A股表現(xiàn)最強(qiáng)的板塊。上半年利潤僅10億的寒武紀(jì),以超過6000億的市值躍居科創(chuàng)板首位,滾動(dòng)市盈率高達(dá)500余倍,股價(jià)也一度超過茅臺(tái)成為A股“股王”。

引爆市場情緒的,是上周DeepSeek V3.1的發(fā)布——準(zhǔn)確來說,甚至不是這款模型的能力本身,而是短短不到20個(gè)字的一則官方留言:“UE8M0 FP8是針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計(jì)。”


UE8M0 FP8,立即成了國產(chǎn)AI技術(shù)突破的最新代名詞。

在一周高漲的情緒之后,今天的市場出現(xiàn)正;芈。而與之相伴的,是中芯國際冷暖參半的半年報(bào)——上半年?duì)I收增長22%,Q2產(chǎn)能利用率高達(dá)92.5%,中國區(qū)收入占比提升至84.2%;但單看二季度,凈利潤和毛利潤都出現(xiàn)下滑。

事實(shí)上,如果把DeepSeek、寒武紀(jì)、中芯國際們近期的一系列信息串聯(lián)起來,我們在欣喜于其進(jìn)步之余,也能夠看到國產(chǎn)AI生態(tài)仍受到嚴(yán)重限制,距離世界先進(jìn)水平仍有差距。

但更大的驚喜在于,中國產(chǎn)業(yè)鏈的協(xié)同程度正在迅速提升。

DeepSeek到底干了什么

UE8M0 FP8,這串如同亂碼一般的字符,究竟有什么魔力?

我們不妨先從FP8說起。

FP8是一種8位浮點(diǎn)數(shù),其基本原理是用較少的字符來表示更復(fù)雜的數(shù)字,這對于使用二進(jìn)制語言的計(jì)算機(jī)來說是非常重要的。

這是因?yàn),二進(jìn)制數(shù)字只有0和1兩個(gè)字符,一個(gè)較短的十進(jìn)制數(shù)字,寫成二進(jìn)制可能會(huì)變得很長。舉個(gè)例子,一個(gè)隨機(jī)的十進(jìn)制數(shù)字56.89,如果直接轉(zhuǎn)化計(jì)算機(jī)使用的二進(jìn)制數(shù)字,是111000.11100011,字符非常多,也就意味著會(huì)占用更多存儲(chǔ)空間。

那么為了節(jié)省字符,人們發(fā)明了浮點(diǎn)數(shù)。

具體來說,所謂浮點(diǎn)數(shù),是指一種特殊的數(shù)字表示格式,其基本格式是把數(shù)字a寫成m×b^e的形式。

例如,上述的111000.11100011,可以寫成1.1100011100011×2?。如果我們愿意損失一定的精度,規(guī)定小數(shù)點(diǎn)后只保留3位,就約等于1.110×2?。這樣一來,只需要記錄下小數(shù)點(diǎn)后的110和5次冪這兩個(gè)信息,就能還原出原來的數(shù)字了,存儲(chǔ)空間占用量大大減少。

FP8就是這樣一種記錄方式,規(guī)定用8位二進(jìn)制數(shù)來記錄上述信息。例如拿出4位數(shù)記錄冪值,另外3位數(shù)來記錄110,剩下1位數(shù)記錄正負(fù)。這種格式叫做E4M3 FP8。

但是這里面仍然有個(gè)問題:當(dāng)數(shù)字比較大時(shí),冪值會(huì)變大,而4位二進(jìn)制數(shù)最大僅相當(dāng)于十進(jìn)制的15,更大冪值就無法記錄。E4M3 FP8最大就只能記錄十進(jìn)制-480到+480之間的數(shù)字。

想要表示更大數(shù)字,就要增加用于記錄冪值的字符,減少記錄前面數(shù)字的字符,但這會(huì)導(dǎo)致精確度繼續(xù)變差。

而UE8M0 FP8,就意味著把全部8位數(shù)字都用來記錄冪值,而完全舍棄小數(shù)點(diǎn)后的信息,以及正負(fù)值。

換句話說,UE8M0 FP8只能記錄2,4,8,16……這樣2的整數(shù)次冪,其它數(shù)字都只能近似成這些數(shù)字,極大地犧牲了精度,以換取存儲(chǔ)范圍。

理解了這一點(diǎn),我們就可以來討論DeepSeek為什么要使用UE8M0 FP8。

大模型的基本原理,是把文字、圖像等信息,全部用數(shù)字來表示,并預(yù)測哪些數(shù)字的相關(guān)性更高。

這些數(shù)字,就是人們常說的參數(shù),而參數(shù)自然是范圍越大、越精確越好。

想要范圍和精度兩者兼得,就需要用更多的二進(jìn)制字符來記錄。因此,過去很多大模型會(huì)使用FP16、FP32等格式,這意味著更大的存儲(chǔ)量和算力消耗。

而DeepSeek V3和R1這樣的模型,之所以能夠降低算力成本,就是因?yàn)槭褂昧薋P8,以犧牲精度來換取速度。

但是,這種犧牲真的不可避免嗎?這就要說到UE8M0了。

事實(shí)上,DeepSeek并非所有數(shù)據(jù)都使用UE8M0格式。如前所述,UE8M0的極端取舍,導(dǎo)致精度極差,是難以滿足大模型訓(xùn)練需求的。

DeepSeek所做的,是引入U(xiǎn)E8M0作為“縮放因子”,使用了microscaling的方法。簡單理解,其參數(shù)仍然以E4M3 FP8等格式存儲(chǔ),以保證精度,并通過與另一個(gè)UE8M0 FP8數(shù)字相乘的方式,實(shí)現(xiàn)類似FP32的效果,并節(jié)省75%的存儲(chǔ)需求。

這種做法盡管增加了算法的復(fù)雜程度,但是僅僅在必要時(shí)才去做計(jì)算,仍然能夠大大節(jié)省算力和通信帶寬需求。

這對于算力受到嚴(yán)重限制的國內(nèi)大模型行業(yè)來說,自然是極為契合的思路。

國產(chǎn)芯片“補(bǔ)課”

但是,我們也無需過度拔高DeepSeek V3.1的獨(dú)創(chuàng)程度。

早在2023年,Meta、英特爾、谷歌等科技巨頭推動(dòng)的“開放計(jì)算項(xiàng)目(OCP)”就提出了MXFP8的microscaling數(shù)據(jù)格式標(biāo)準(zhǔn),以UE8M0作為縮放因子,而英偉達(dá)顯卡也早已支持UE8M0。國內(nèi)的阿里、騰訊、百度等頭部大廠,也都參與了這個(gè)項(xiàng)目。


2023年10月,OCP全球峰會(huì)在美國加州圣何塞舉辦

2023年,英偉達(dá)首席科學(xué)家比爾·戴利曾指出,驅(qū)動(dòng)英偉達(dá)芯片性能大幅提升的秘密,已經(jīng)不是芯片制程驅(qū)動(dòng)的“摩爾定律”,而是數(shù)據(jù)格式等因素共同驅(qū)動(dòng)的“黃氏定律”,即通過引入較低精度的數(shù)字表示法,來減少對存儲(chǔ)空間和計(jì)算資源的消耗,從而可以加快計(jì)算速度和效率。英偉達(dá)H100等顯卡,就已經(jīng)開始支持FP8格式。

如果把目光放到學(xué)術(shù)界,英偉達(dá)和加州理工的研究人員更是在2021年時(shí)就曾經(jīng)發(fā)表過一篇論文《LNS-Madam:在對數(shù)數(shù)值系統(tǒng)中采用乘法式權(quán)重更新的低精度訓(xùn)練》,提出了類似的數(shù)據(jù)轉(zhuǎn)換方法。

DeepSeek今年2月發(fā)布的高性能計(jì)算庫DeepGEMM中,也使用了UE8M0縮放因子。DeepGEMM正是針對英偉達(dá)顯卡所做的優(yōu)化,而國產(chǎn)顯卡當(dāng)時(shí)卻普遍并不支持這種格式。

以至于當(dāng)DeepSeek V3和R1問世時(shí),國產(chǎn)顯卡需要借助軟件優(yōu)化將FP8格式轉(zhuǎn)化成FP16,適配效果大打折扣。

因此,DeepSeek此次透露的信息,或許重點(diǎn)并不在前半部分的UE8M0,而是后半部分的“針對下一代國產(chǎn)芯片設(shè)計(jì)”。

近期,摩爾線程、芯原等國產(chǎn)芯片廠商也同步釋放了適配UE8M0 FP8的消息。

摩爾線程對觀察者網(wǎng)指出,其旗艦產(chǎn)品MTT S5000是國內(nèi)首批原生支持FP8并已大規(guī)模量產(chǎn)的GPU。摩爾線程的MUSA架構(gòu)原生支持硬件FP8張量加速計(jì)算,能夠完美支持UE8M0 FP8 Scale,利用硬件原生FP8,相對于傳統(tǒng)的FP16計(jì)算能夠?qū)崿F(xiàn)兩倍的浮點(diǎn)算力提升、訪存和通信帶寬效率提升和存儲(chǔ)容量利用率提升,同時(shí)最優(yōu)化張量表達(dá)精度。


摩爾線程在WAIC 2025上發(fā)布了MTT S5000

但需要注意的是,盡管國產(chǎn)芯片逐步開始支持FP8格式,由于不同品牌顯卡在底層硬件架構(gòu)上的差異,原本針對英偉達(dá)顯卡設(shè)計(jì)的算法也并非可以直接移植到國產(chǎn)芯片上。因此,大模型針對國產(chǎn)芯片的適配調(diào)整仍是一項(xiàng)重要工作。

“補(bǔ)課”,或許才是對現(xiàn)階段工作更合適的表述。

這或許也解釋了為什么DeepSeek R2延宕許久尚未問世。

因此,DeepSeek V3.1真正的意義,應(yīng)該不是對UE8M0 FP8這種數(shù)據(jù)格式本身的應(yīng)用,而是類似于DeepGEMM這樣針對國產(chǎn)芯片的工具鏈設(shè)計(jì)。

而且,DeepSeek特意提到是針對“下一代國產(chǎn)芯片”,這意味著國產(chǎn)大模型廠商與芯片廠商之間的協(xié)同配合達(dá)到了更高的層次,雙方可以在硬件開發(fā)階段就共同參與優(yōu)化。

摩爾線程對觀察者網(wǎng)表示,此舉能夠充分發(fā)揮出已量產(chǎn)的國產(chǎn)芯片架構(gòu)特性,通過國產(chǎn)大模型和國產(chǎn)芯片協(xié)同設(shè)計(jì)優(yōu)化,實(shí)現(xiàn)1+1>2。

生態(tài)協(xié)同新高度

事實(shí)上,談到國產(chǎn)大模型與芯片的協(xié)同開發(fā),DeepSeek也不是唯一的參與者。

一方面,頭部大廠往往已經(jīng)通過自建生態(tài)的方式,早早布局軟硬件協(xié)同,如華為昇騰、阿里平頭哥、百度昆侖芯等。

本周,百度發(fā)布了百舸AI計(jì)算平臺(tái)5.0,基于昆侖芯實(shí)現(xiàn)超節(jié)點(diǎn),并針對DeepSeek引領(lǐng)的強(qiáng)化學(xué)習(xí)風(fēng)潮,推出強(qiáng)化學(xué)習(xí)框架,極致壓榨算力資源。


2025百度云智大會(huì)上,百度智能云正式發(fā)布百度百舸AI計(jì)算平臺(tái)5.0全新版本。

而更多的大模型初創(chuàng)公司,則通過與芯片廠商聯(lián)合的方式來提升適配效率。

今年7月,階躍星辰聯(lián)合近10家芯片及基礎(chǔ)設(shè)施廠商發(fā)起“模芯生態(tài)創(chuàng)新聯(lián)盟”,首批成員包括華為昇騰、沐曦、壁仞科技、燧原科技、天數(shù)智芯、無問芯穹、寒武紀(jì)、摩爾線程、硅基流動(dòng)等。

階躍星辰聯(lián)合創(chuàng)始人、副總裁朱亦博對觀察者網(wǎng)指出,一款芯片的開發(fā)周期需要兩年以上,而如今模型迭代的速度只有半年到一年,如果讓芯片廠商去適配模型,必然是低效的。如今,階躍星辰希望在國產(chǎn)芯片的開發(fā)階段,就主動(dòng)去進(jìn)行適配,是一種更高效的方式。

但我們也要清醒地看到,國產(chǎn)算力生態(tài)仍然處于一種“帶著鐐銬跳舞”的狀態(tài)。

從中芯國際的財(cái)報(bào)可以看到,盡管國內(nèi)旺盛的需求推動(dòng)其產(chǎn)能利用率不斷攀升,并且還有大規(guī)模擴(kuò)產(chǎn)計(jì)劃,但是其主要業(yè)務(wù)仍來自成熟制程。因此,其業(yè)績并如臺(tái)積電那樣未充分受益于當(dāng)下的算力熱潮。

包括制程能力、HBM技術(shù)等限制,也讓國產(chǎn)AI產(chǎn)業(yè)往往采用極限創(chuàng)新的方式,在硬件受限的情況下用更高的成本、更復(fù)雜的算法來壓榨效率。

例如,華為不得不使用384個(gè)超多節(jié)點(diǎn)、昂貴的光通信等方式來對標(biāo)英偉達(dá)的NVLink72。其AI推理加速“黑科技”UCM,也是在HBM受限的情況下,主要針對“節(jié)流”進(jìn)行的創(chuàng)新;而原理類似的英偉達(dá)Dynamo,則更多聚焦于發(fā)揮高端算力集群的能力。

近期華為盤古大模型遭遇的爭議和收縮,也顯示出中國企業(yè)尚難以憑借單打獨(dú)斗去全方位贏得全球AI競爭。以開放和協(xié)同的方式匯聚國內(nèi)全部力量,才是更好的突圍之道。

因此,近期國產(chǎn)AI產(chǎn)業(yè)一系列突破固然令人欣喜,但仍然要看到,其真正意義并非在于單點(diǎn)的進(jìn)步,而是在于產(chǎn)業(yè)鏈上下游的信任和協(xié)作達(dá)到了一個(gè)新的高度,為未來中國全產(chǎn)業(yè)鏈的領(lǐng)先打下堅(jiān)實(shí)基礎(chǔ)。



本文系觀察者網(wǎng)獨(dú)家稿件,文章內(nèi)容純屬作者個(gè)人觀點(diǎn),不代表平臺(tái)觀點(diǎn),未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
安徽2位女副市長,擬任省轄市市委常委

安徽2位女副市長,擬任省轄市市委常委

鳳凰網(wǎng)安徽
2025-08-31 17:36:15
中美經(jīng)貿(mào)再掀波瀾?剛剛結(jié)束的最新會(huì)談透露了哪些關(guān)鍵信號(hào)

中美經(jīng)貿(mào)再掀波瀾?剛剛結(jié)束的最新會(huì)談透露了哪些關(guān)鍵信號(hào)

小宸說歷史
2025-08-31 10:16:16
中國歷史上“最接近神”的七個(gè)人,諸葛亮勉強(qiáng)登榜,第一無人能敵

中國歷史上“最接近神”的七個(gè)人,諸葛亮勉強(qiáng)登榜,第一無人能敵

老崔鏟史
2025-08-29 05:36:48
郭麒麟不接后媽王惠的招,用一招讓大眾閉了嘴郭汾陽的話成導(dǎo)火索

郭麒麟不接后媽王惠的招,用一招讓大眾閉了嘴郭汾陽的話成導(dǎo)火索

阿濤講情感
2025-08-31 11:20:07
東莞1號(hào)線通車倒計(jì)時(shí)!起步價(jià)2元、預(yù)計(jì)通車時(shí)間公布→

東莞1號(hào)線通車倒計(jì)時(shí)!起步價(jià)2元、預(yù)計(jì)通車時(shí)間公布→

東莞紀(jì)實(shí)
2025-08-31 17:54:55
馮唐:只有窮人才會(huì)癡迷技術(shù),只有笨人才會(huì)想著先把事做好

馮唐:只有窮人才會(huì)癡迷技術(shù),只有笨人才會(huì)想著先把事做好

清風(fēng)拂心
2025-08-28 16:15:03
藏不住了!俄烏打了三年多,大家才發(fā)現(xiàn)紹伊古真正的身份

藏不住了!俄烏打了三年多,大家才發(fā)現(xiàn)紹伊古真正的身份

一個(gè)有靈魂的作者
2025-08-29 14:33:22
這回得排隊(duì)買豐田了!新SUV比奧迪Q5L還漂亮,油耗僅4.2L!

這回得排隊(duì)買豐田了!新SUV比奧迪Q5L還漂亮,油耗僅4.2L!

沙雕小琳琳
2025-08-31 05:00:03
最后一支紅軍:拒絕改編為八路軍,殺害省委書記,最終走向覆滅

最后一支紅軍:拒絕改編為八路軍,殺害省委書記,最終走向覆滅

諾言卿史錄
2025-08-13 09:17:57
秋天別總盯著牛羊肉!多吃它,一吃健脾,二吃祛脂,三吃強(qiáng)免疫

秋天別總盯著牛羊肉!多吃它,一吃健脾,二吃祛脂,三吃強(qiáng)免疫

江江食研社
2025-08-30 18:30:06
1995年,27歲洛桑去世,被疑趙本山所為,20年后博林揭開車禍真相

1995年,27歲洛桑去世,被疑趙本山所為,20年后博林揭開車禍真相

墨印齋
2025-08-26 17:14:36
1973年,紀(jì)登奎提議不要開除北京市委原書記的黨籍,被毛主席駁回

1973年,紀(jì)登奎提議不要開除北京市委原書記的黨籍,被毛主席駁回

大運(yùn)河時(shí)空
2025-08-24 15:25:02
隔壁女鄰居總找我借火,有天她盯著我說:今晚可以幫我生個(gè)火嗎?

隔壁女鄰居總找我借火,有天她盯著我說:今晚可以幫我生個(gè)火嗎?

曉艾故事匯
2025-08-25 17:11:11
離譜!杰克遜抵達(dá)拜仁后被告知交易取消 本人拒絕歸隊(duì)將繼續(xù)體檢

離譜!杰克遜抵達(dá)拜仁后被告知交易取消 本人拒絕歸隊(duì)將繼續(xù)體檢

新英體育
2025-08-31 14:07:20
德里赫特:我們當(dāng)然支持阿莫林,球員應(yīng)對比賽負(fù)責(zé)而不是主教練

德里赫特:我們當(dāng)然支持阿莫林,球員應(yīng)對比賽負(fù)責(zé)而不是主教練

直播吧
2025-08-31 19:36:46
A股:周末全是利好,2.5億股民沸騰了,明天做好迎接普漲的準(zhǔn)備?

A股:周末全是利好,2.5億股民沸騰了,明天做好迎接普漲的準(zhǔn)備?

虎哥閑聊
2025-08-31 10:05:05
“去中國化”最徹底的4個(gè)國家,有一個(gè)已經(jīng)完全西化了

“去中國化”最徹底的4個(gè)國家,有一個(gè)已經(jīng)完全西化了

南宗歷史
2025-08-27 17:27:25
惡人自有惡人治8:加代落入了圈套

惡人自有惡人治8:加代落入了圈套

金昔說故事
2025-08-31 15:13:00
廣廈注冊18名球員:趙巖昊頂薪還剩1年 胡金秋剩兩年 孫銘徽剩3年

廣廈注冊18名球員:趙巖昊頂薪還剩1年 胡金秋剩兩年 孫銘徽剩3年

直播吧
2025-08-31 19:15:13
慶功宴上總經(jīng)理把十萬獎(jiǎng)金扔門外叫我滾,我淡然掏出電話:別后悔

慶功宴上總經(jīng)理把十萬獎(jiǎng)金扔門外叫我滾,我淡然掏出電話:別后悔

今天說故事
2025-08-28 18:06:15
2025-08-31 20:24:49
觀察者網(wǎng) incentive-icons
觀察者網(wǎng)
全球視野,中國關(guān)懷
123510文章數(shù) 1848851關(guān)注度
往期回顧 全部

科技要聞

入手iPhone 16還是等17?兩款手機(jī)全面對比

頭條要聞

烏克蘭前議長街頭被人連開約8槍身亡 俄方:另有內(nèi)情

頭條要聞

烏克蘭前議長街頭被人連開約8槍身亡 俄方:另有內(nèi)情

體育要聞

破2億身家!莎拉波娃的"勝負(fù)腦"

娛樂要聞

胡歌是永遠(yuǎn)都不會(huì)離婚的,原因很簡單

財(cái)經(jīng)要聞

罕見熱鬧的8月之后,A股將迎怎樣的9月

汽車要聞

家庭泛越野 大狗PLUS預(yù)售煥新11.28萬起

態(tài)度原創(chuàng)

手機(jī)
本地
游戲
藝術(shù)
公開課

手機(jī)要聞

拯救手機(jī)存儲(chǔ)空間 榮耀宣布超50款新老機(jī)型升級支持圖庫清理建議

本地新聞

換個(gè)城市過夏天 | 夏末狂歡,浪在阜新黃家溝!

暴雪現(xiàn)已正式對《魔獸世界》“烏龜服”發(fā)起侵權(quán)訴訟

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版