出品 | 虎嗅科技組
作者 | 丸都山
編輯 | 苗正卿
頭圖 | 視覺中國(guó)
8月22日,據(jù)《The Information》報(bào)道,英偉達(dá)已通知安靠科技和三星電子等關(guān)鍵供應(yīng)商暫停與H20芯片相關(guān)的生產(chǎn)。
而就在上周,美國(guó)白宮方面表示,英偉達(dá)已經(jīng)同意將其在華銷售芯片收入的15%上繳美國(guó)政府,以換取相關(guān)產(chǎn)品出口許可。
如果把這兩條消息放在一起看,或許會(huì)得出一條結(jié)論:英偉達(dá)會(huì)再次終止H20芯片的對(duì)華銷售。
但果真如此嗎?需要說明的是,以目前AI算力芯片的產(chǎn)業(yè)格局來看,英偉達(dá)完全有能力將這部分上繳的收入轉(zhuǎn)移到中國(guó)客戶身上,且即便價(jià)格上漲18%(此漲幅下,收入端不變),在中國(guó)市場(chǎng)仍有較強(qiáng)的競(jìng)爭(zhēng)力。
既然這樣,英偉達(dá)為什么選擇這個(gè)時(shí)間點(diǎn)通知供應(yīng)鏈暫停生產(chǎn)?
H20,越來越不掙錢了
雖然中國(guó)市場(chǎng)對(duì)于H20芯片的需求一貫強(qiáng)勁,但對(duì)于英偉達(dá)來說,這個(gè)產(chǎn)品可能并不算一門好生意。
準(zhǔn)確地來說,在上代Hopper架構(gòu)的GPU產(chǎn)品中,H20長(zhǎng)期都是毛利率墊底的存在。
之所以會(huì)造成這個(gè)問題,是因?yàn)樵贐IS(美國(guó)商務(wù)部工業(yè)與安全局)規(guī)定下,英偉達(dá)H20本就是一枚“設(shè)計(jì)畸形”的芯片。比如在去年5月發(fā)布的BIS新規(guī)下,對(duì)“性能密度”做出限制,因此英偉達(dá)在設(shè)計(jì)H20時(shí)對(duì)算力規(guī)格大砍一刀,使其理論性能僅為296TFLOP,相當(dāng)于H100芯片的15%。
又比如新規(guī)中取消了將“互聯(lián)帶寬”作為限制芯片的識(shí)別參數(shù),英偉達(dá)就將H20的HBM3顯存容量拉高到96Gb,使顯存帶寬提高到4.0Tb/s。
而這些特征組合在一起,卻形成了一個(gè)很尷尬的事實(shí):在算力大幅削減的情況下,H20的BOM(綜合硬件成本)很可能跟H100齊平,甚至高于后者。
原因在于,存儲(chǔ)顆粒一直是高性能計(jì)算卡成本的“大頭”,比如H100芯片中,HBM3顆粒的采購(gòu)就要占到60%左右,而在H20芯片上,英偉達(dá)又不得不為其配備更高規(guī)格的顯存容量,以彌補(bǔ)算力不足的缺陷。
在今年4月,美國(guó)白宮又宣布,在未經(jīng)許可的情況下,英偉達(dá)禁止向中國(guó)出售H20芯片,這直接導(dǎo)致英偉達(dá)在今年一季度積壓的25億美元訂單無法交付,所有的H20庫存積壓和原材料采購(gòu)承諾共計(jì)產(chǎn)生了45億美元的費(fèi)用。
后續(xù)黃仁勛在參加鏈博會(huì)時(shí),又表示美國(guó)政府已經(jīng)取消了針對(duì)H20的禁令,不過伴隨這一連串的“反復(fù)橫跳”,可以推導(dǎo)出兩個(gè)基本事實(shí):
首先,迄今為止,英偉達(dá)H20芯片的庫存及原材料仍未被消耗掉,因此近期通知供應(yīng)商停產(chǎn)很可能是一次正常的供應(yīng)鏈調(diào)整,不能說明英偉達(dá)不打算在國(guó)內(nèi)停售H20芯片。
其次,無論是H20最初設(shè)計(jì)構(gòu)想,還是后續(xù)的庫存積壓,亦或是被強(qiáng)行征收了15%的所得稅,都導(dǎo)致H20這枚芯片所帶來的盈利能力愈發(fā)降低。
更重要的是,基于新架構(gòu)Blackwell設(shè)計(jì)的B30A芯片即將在中國(guó)市場(chǎng)開售。
B30A,有多大競(jìng)爭(zhēng)力?
在Blackwell架構(gòu)的首款產(chǎn)品芯片發(fā)布后,關(guān)于下一代“中國(guó)特供版”的消息便不脛而走。
目前,得到業(yè)界公認(rèn)的一個(gè)說法是,這枚芯片被命名為B30A的芯片,采用與B300芯片同樣的Blackwell Ultra微架構(gòu),但僅使用一個(gè)計(jì)算芯片(B300使用的是雙芯片),提供約為B300性能和內(nèi)存容量的一半。
同樣在8月22日,黃仁勛造訪臺(tái)積電時(shí)透露,英偉達(dá)正在與美國(guó)政府磋商,討論對(duì)中國(guó)出口一款新型人工智能芯片,這大概率就是坊間傳言的B30A芯片。
不過,從二級(jí)市場(chǎng)的情緒來看,這款芯片在國(guó)內(nèi)的前景可能并不完全明朗。在22日當(dāng)天,寒武紀(jì)、海光信息兩大國(guó)產(chǎn)GPU巨頭雙雙20%漲停,直接強(qiáng)勢(shì)帶動(dòng)整個(gè)“算力股”板塊上漲。
這與去年年初H20開始供貨時(shí),A股算力股集體下跌形成截然不同的對(duì)比。
究其原因,或許有二。
一方面,從目前流傳出的B30A規(guī)格來看,即便只使用一個(gè)die,其算力也很可能超過上代旗艦產(chǎn)品H100,未來這款產(chǎn)品能否順利出口到中國(guó),還充滿著不確定性。
另外,本周DeepSeek-V3.1的發(fā)布為國(guó)產(chǎn)GPU帶來了一大利好,即該版本模型使用了UE8M0 FP8 Scale的參數(shù)精度。在使用英偉達(dá)算力芯片時(shí),由于需要兼容傳統(tǒng)通FP8格式,硬件設(shè)計(jì)仍保留符號(hào)位邏輯,導(dǎo)致UE8M0的加速潛力無法完全釋放。
但在國(guó)產(chǎn)芯片上,由于主流的GPU早已完成FlashMLA和DeepGEMM的適配,因此在DeepSeek-V3.1版本上可以實(shí)現(xiàn)無縫接入。
因此,至少在DeeSeek的模型訓(xùn)練上,國(guó)產(chǎn)GPU眼下仍具備一定的優(yōu)勢(shì)。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4731022.html?f=wyxwapp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.