記者丨趙云帆
編輯丨黃劍
8月22日,A股算力板塊再度成為“執(zhí)牛耳者”。截至收盤,本輪行情的“股王”寒武紀以20%漲停報收,總市值來到驚人的5200億人民幣;晶圓龍頭中芯國際A/H股分別上漲14.19%和10.06%,其中A股創(chuàng)下去年10月以來單日漲幅之最。光模塊“雙雄”新易盛、中際旭創(chuàng)續(xù)創(chuàng)新高,并分別上漲6.19%和5.16%;國產(chǎn)IDC龍頭中科曙光亦以漲停報收,市值接近去年11月高點。
引爆日內算力行情的源點,來自兩則消息。
8月21日晚間,杭州深度求索公司(DeepSeek)悄然于大模型資源網(wǎng)站HuggingFace上線 “DeepSeekV3.1” 版本。同時,該公司宣稱其模型版本使用適配國產(chǎn)芯片結構的參數(shù)精度,暗示國產(chǎn)芯片未來有望得到大規(guī)模使用。
分析人士認為,在國際貿易保護主義背景下,國際芯片產(chǎn)業(yè)鏈供應鏈的不確定性猶存。DeepSeek-V3.1發(fā)布,以及騰訊業(yè)績會透露GPU數(shù)量足夠等信息,均利好AI算力國產(chǎn)化和本土AI芯片發(fā)展,國產(chǎn)算力板塊再度迎來催化。
國產(chǎn)芯片+模型的“彎道超車”
8月21日晚間,深度求索在官方訂閱號發(fā)布文章《DeepSeek-V3.1 發(fā)布,邁向 Agent 時代的第一步》,明確指出“DeepSeek-V3.1使用了UE8M0 FP8 Scale 的參數(shù)精度”。同時,在推文下置頂留言解釋:“UE8M0 FP8是針對即將發(fā)布的下一代國產(chǎn)芯片設計”,引發(fā)DeepSeek新版本帶來“國產(chǎn)AI芯片”量產(chǎn)的預期。
國產(chǎn)半導體的市場投機熱情高漲。截至8月22日收盤,Wind半導體指數(shù)收漲7.31%,創(chuàng)下2022年4月以來新高。
而日內半導體的熱度泛化擴散,Wind科技大類指數(shù)日內上漲3.07%,續(xù)創(chuàng)歷史新高。
值得注意的是,市場此前廣泛期待深度求索公司釋放推理模型更新版本“DeepSeek-R2”。然而此次發(fā)布的DeepSeek-V3.1主要焦點在于實現(xiàn)深度思考和快思考融合,迎合了此前OpenAI、Qwen等新釋出模型產(chǎn)品結構的特征。因此部分分析人士甚至認為,DeepSeek“R系列”可能會融合在通用“V系列”版本中,不再獨立迭代。
“思考與非思考模式的融合可以說是必然的趨勢,也是大模型發(fā)展史上的一個小迭代,可以看到V3.1不是大版本,其更新值得期待,但不知道何時。 ”IDC中國研究總監(jiān)盧言霞告訴記者。
而更令人關注的則是深度求索公司釋出的信息,即“UE8M0 FP8 針對即將發(fā)布的下一代國產(chǎn)芯片設計”。
21世紀經(jīng)濟報道記者采訪并綜合各類觀點發(fā)現(xiàn),“UE8M0 FP8”目標或許是建立在國產(chǎn)算力芯片能力略遜于英偉達GPU,但能最大限度發(fā)揮國產(chǎn)芯片的理論算力和能效比,并在犧牲通用性的基礎上,極大提升推理性能的一種參數(shù)精度模式。
而在此基礎上,新的專用于國產(chǎn)芯片的國產(chǎn)模型,有望在定義明確的特定場景之中發(fā)揮更高效的推理能力,實現(xiàn)挑戰(zhàn)甚至超越海外頭部大模型在特定領域性能的可能。
“下一代國產(chǎn)芯片”引關注
對于此番DeepSeek發(fā)布新版大模型和使用新的計算精度,部分券商也發(fā)表了看法。
中信建投指出,DeepSeek模型更新至V3.1版,新增支持FP8精度和國產(chǎn)芯片,此舉有望推動國產(chǎn)算力生態(tài)加速落地。騰訊不久前的業(yè)績會上也透露,其推理芯片供應渠道多元化,在國際供應鏈波動下,國產(chǎn)推理算力芯片或成助力。華為昇騰芯片近期在政府、金融等行業(yè)的應用逐步擴大,進一步體現(xiàn)國產(chǎn)芯片的市場競爭力正在提升。
值得注意的是,21世紀經(jīng)濟報道記者從產(chǎn)業(yè)鏈人士處獲悉,“UE8M0 FP8”是針對特定國產(chǎn)芯片的,因此很可能是針對某一種架構,或某家Fabless(無晶圓)芯片企業(yè)的。
不過,究竟是哪家,深度求索公司并未透露更多。
從國產(chǎn)芯片研發(fā)進度來說,去年年底,寒武紀推出了思元590芯片,應用ASIC架構,支持7nm工藝、512TOPS的算力,在推理場景能效比上已超越國際巨頭,幾乎支持所有國內主流大模型 。百度內部測試結果顯示,思元590在某些大模型訓練任務上的表現(xiàn)已非常接近英偉達A100芯片;即便在相對弱勢的場景,其性能也能達到A100的一半左右;整體性能大致可達到A100的80%水平 。
據(jù)悉,思元590芯片已經(jīng)被應用于字節(jié)跳動、百度、阿里云等企業(yè)的云端大模型訓練,以及省級智算中心項目等。
另一個“熱門選手”則是華為昇騰芯片Ascend 910D。資料顯示,Ascend 910D為從芯片設計、先進封裝到軟件生態(tài)的原生國產(chǎn)算力芯片,采用了原生達芬奇架構3.0、自研HBM3e存算一體技術和硅光模塊信息互聯(lián)技術,其理論算力峰值有望超越英偉達H100。未來該芯片的一大賣點是在中文NLP(自然語言處理)、智能駕駛、智慧城市等本土化場景中進行了專門優(yōu)化。
無論如何,DeepSeekV3.1的出現(xiàn),成為了國產(chǎn)芯片在國內算力市場開始征程的“先兆”。但分析人士仍然指出,由于大模型適配國產(chǎn)芯片廠商的最終歸屬不清,加上研發(fā)進度,芯片良率等各種問題均可能存在,因此投資者也應提高風險意識,警惕市場過度炒作的風險。
SFC
出品丨21財經(jīng)客戶端 21世紀經(jīng)濟報道
編輯丨黎雨桐 實習生林芷儀
21君薦讀
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.