HBM 只負責“快”,可模型越來越“能吃”,總得有人把“多”補上——華為把答案押在一塊即將亮相的 AI SSD 上,時間定在 8 月 27 日。
先把背景攤開。
近兩年算力卡一路狂飆,GPU 邊上的 HBM 通過 3D 堆疊和超寬總線把帶寬拉滿,但代價是容量受限:顯存夠快卻不夠裝。
大模型訓(xùn)練要囤參數(shù)、樣本與檢查點(checkpoint),推理要緩存 KV、調(diào)用向量庫;“內(nèi)存/顯存放不下”成為常態(tài)。結(jié)果是數(shù)據(jù)反復(fù)在慢介質(zhì)里搬家,帶寬再高也被往返時延稀釋。
這回華為要做的,是在 HBM/DRAM 之下鋪一層高性能容量層:AI SSD。它不跟 HBM 搶“第一毫秒”,而是把訓(xùn)練喂數(shù)、參數(shù)快照、推理向量檢索這類“又多又勤”的活接住——容量大、并發(fā)強、延遲可控、總擁有成本(TCO)更友好。分層協(xié)同后,快的繼續(xù)快,多的更能裝,數(shù)據(jù)流不再被單點掐脖子。
圖源:財聯(lián)社
發(fā)布會上我會盯七個點:
第一,看 總線與協(xié)議,是 PCIe 5 還是更激進的 6,NVMe 2.x 是否就緒,是否給出面向 CXL 生態(tài)的對接思路;
第二,看 性能曲線,順序/隨機吞吐與 IOPS 之外,更關(guān)鍵是時延抖動與 QoS 穩(wěn)定性;
第三,看 容量檔位與陣列擴展,單盤 TB 級到多盤的線性放大做得如何;
第四,看 耐久與功耗,DWPD 指標和實時功耗曲線是否對 AI 負載做過優(yōu)化;
第五,數(shù)據(jù)可靠性,端到端保護、掉電保護、糾刪碼/RAID 的落地細節(jié);
第六,軟件棧,有沒有分層存儲中間件、數(shù)據(jù)管道加速、向量檢索插件這類“能即插即用的工具”;
第七,安全與合規(guī),國密、全盤加密、可信啟動該給的別少。只有“盤+?!币黄鸾桓叮珹I SSD 才不是換個名字的企業(yè)盤。
更現(xiàn)實的一環(huán),是和整機/一體機廠商的聯(lián)動。
單賣硬件解決不了數(shù)據(jù)路徑,得把“GPU 算力 + 存儲容量 + 數(shù)據(jù)軟件”綁成一套。國內(nèi)產(chǎn)業(yè)鏈已經(jīng)有 NAND、控制器、固件、OS 的土壤,華為入場的意義,不只是“有盤可用”,而是把“有卡無盤、有盤無棧”的斷點補齊,讓交付回到工程可控。
海外對手也沒閑著。鎧俠已經(jīng)把“AI 驅(qū)動的存儲創(chuàng)新”寫進中長期策略,美光面向 AI 推出多款 SSD,明確標注“推理與混合負載”。
這說明行業(yè)共識很清晰:AI 不是靠一塊通用企業(yè)盤打天下,工作負載感知才是門檻。華為切進來,國內(nèi)玩家在性能—容量—成本這只三角里,終于多了一種組合。
把鏡頭再拉遠些。中國算力大會上,華為存儲線提到的三件事——城市層面的全域數(shù)據(jù)匯聚、行業(yè)層面的高質(zhì)量語料、企業(yè)層面的 AI 數(shù)據(jù)湖——其實是同一條主線:從“堆算力”轉(zhuǎn)向“強數(shù)據(jù)”。
AI SSD 是這條路的地基之一:數(shù)據(jù)匯聚、清洗、標注、訓(xùn)練、推理、歸檔,每一段都離不開穩(wěn)定的大容量與確定的時延。
在“動輒幾個小時的數(shù)據(jù)預(yù)熱變成幾十分鐘”,在“半夜盯 checkpoint 不再心驚膽戰(zhàn)”,在“向量庫回查穩(wěn)定到你敢在線上開新特性”。
工具的意義,從來不是規(guī)格華麗,而是讓工程師少熬一杯咖啡、讓業(yè)務(wù)敢壓一條時間線。
最后,給準備觀望的朋友一張小抄:關(guān)心訓(xùn)練的,盯 順序吞吐、checkpoint 寫入穩(wěn)定性;
做推理服務(wù)的,看 隨機讀時延、向量檢索插件與 QoS;
算力規(guī)劃的,算一算 “HBM + AI SSD” 的 TCO 曲線,是否比“無腦加卡”更劃算。
等到 8 月 27 日現(xiàn)場把曲線與軟件清單攤開,我們再來對賬:HBM 管“快”、AI SSD 管“多”的分工,是否真的把大模型的“胃口”喂飽了。
文章參考:
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.