智東西
作者 程茜
編輯 心緣
智東西8月26日?qǐng)?bào)道,近日,谷歌母公司Alphabet風(fēng)投部門CapitalG、英偉達(dá)正在洽談投資以色列AI基礎(chǔ)設(shè)施提供商VAST Data,融資金額或達(dá)到數(shù)十億美元,或?qū)⒊蔀橐陨锌萍脊臼飞献畲笠?guī)模融資。這家創(chuàng)企的估值將躍升至300億美元(折合人民幣約2148億元)。
這家被谷歌、英偉達(dá)爭(zhēng)著送錢的創(chuàng)企,到底什么來(lái)頭?
2016年成立的VAST Data已成為眾多大模型企業(yè)青睞的香餑餑,核心原因是傳統(tǒng)數(shù)據(jù)存儲(chǔ)架構(gòu)無(wú)法滿足大模型訓(xùn)練、推理的新需求,VAST Data面向AI時(shí)代推出了統(tǒng)一數(shù)據(jù)平臺(tái),將結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)集成在一起,讓AI處理數(shù)據(jù)能更高效、更便宜。
馬斯克旗下大模型創(chuàng)企xAI、獲英偉達(dá)39.6億美元投資的CoreWeave、全球頭部動(dòng)畫公司迪士尼及其子公司皮克斯、美國(guó)電信巨頭威瑞森通信公司、視頻通話平臺(tái)Zoom等諸多全球知名企業(yè)都被這家創(chuàng)企列入客戶名單。
值得一提的是,其與諸多客戶簽訂的都是5~7年的長(zhǎng)期合同, 隨之而來(lái)的就是年收入的爆炸式上漲。根據(jù)VAST Data官網(wǎng)的公開數(shù)據(jù),截至2025年1月31日年度,VAST Data營(yíng)收同比增長(zhǎng)3.6倍。這一營(yíng)收增速甚至超過了英偉達(dá)和OpenAI。2025財(cái)年英偉達(dá)營(yíng)收同比增長(zhǎng)114%,此前據(jù)彭博社報(bào)道,OpenAI預(yù)計(jì)2025年收入將同比增長(zhǎng)三倍至127億美元(折合人民幣約909億元)。
據(jù)路透社援引熟悉財(cái)務(wù)狀況的匿名消息人士報(bào)道,VAST Data聯(lián)合創(chuàng)始人、CEO雷寧·哈拉克(Renen Hallak)曾提到,該公司已經(jīng)實(shí)現(xiàn)連續(xù)五年自由現(xiàn)金流為正。截至2025年1月,該公司ARR(年度經(jīng)常性收入)達(dá)到2億美元(折合人民幣約14.3億元),預(yù)計(jì)明年ARR將增長(zhǎng)至6億美元(折合人民幣約43億元)。
與此同時(shí),這家創(chuàng)企還與被曝新融資的兩家“金主”關(guān)系匪淺,VAST Data將自家軟件平臺(tái)集成到了谷歌云上,英偉達(dá)創(chuàng)始人、CEO黃仁勛曾在GTC大會(huì)、臺(tái)北國(guó)際電腦展COMPUTEX等國(guó)際大會(huì)上多次為VAST Data送好評(píng),稱其是大規(guī)模AI模型部署的關(guān)鍵推動(dòng)者。
在創(chuàng)投圈,這家創(chuàng)企也早已站到投資人的聚光燈下,此前共拿下5輪融資,融資總額達(dá)到3.81億美元(折合人民幣約27.3億元),彼時(shí)估值達(dá)到91億美元(折合人民幣約652億元),其中戴爾和英偉達(dá)連續(xù)多輪注資。
▲VAST Data融資情況
AI驅(qū)動(dòng)數(shù)據(jù)以前所未有的規(guī)模增長(zhǎng),這對(duì)數(shù)據(jù)處理的基礎(chǔ)設(shè)施提出了更高要求,使得構(gòu)建數(shù)據(jù)處理AI基礎(chǔ)設(shè)施的VAST Data迎來(lái)發(fā)展機(jī)遇。
一、手握10億美金訂單,xAI、CoreWeave、迪士尼都是客戶
VAST Data的四位創(chuàng)始人都在存儲(chǔ)領(lǐng)域積累深厚。
CEO雷寧·哈拉克(Renen Hallak)、CTO沙查爾·芬布利特(Shachar Finblit)、營(yíng)銷副總裁杰夫·登沃思(Jeff Denworth)和CTO阿隆·霍列夫(Alon Horev)共同于2016年創(chuàng)立了這家公司。
▲VAST Data聯(lián)合創(chuàng)始人杰夫·登沃思(Jeff Denworth)(左一)、沙查爾·芬布利特(Shachar Finblit)(中)、CEO雷寧·哈拉克(Renen Hallak)(右二)
哈拉克曾在戴爾EMC推出的全閃存企業(yè)級(jí)存儲(chǔ)陣列XtremIO部門擔(dān)任研發(fā)副總裁,從項(xiàng)目啟動(dòng)到實(shí)現(xiàn)超過10億美元的營(yíng)收;芬布利特和霍列夫均曾在IBM等公司任職,登沃思在先進(jìn)計(jì)算和大規(guī)??蓴U(kuò)展的大數(shù)據(jù)和云存儲(chǔ)方面擁有超20年的技術(shù)經(jīng)驗(yàn)。
彼時(shí),哈拉克在XtremIO感受到了AI用于大規(guī)模分析的數(shù)據(jù)存儲(chǔ)挑戰(zhàn),但在戴爾的部門沒有施展拳腳的空間,因此他決定離開從0開始打造一種新架構(gòu)。后續(xù),他與另外三位聯(lián)合創(chuàng)始人一拍即合。
用一句話概括VAST Data的業(yè)務(wù)體系,就是將存儲(chǔ)、數(shù)據(jù)庫(kù)和容器化計(jì)算引擎服務(wù)統(tǒng)一為一個(gè)單一的、可擴(kuò)展的VAST Data軟件平臺(tái),并且該平臺(tái)從底層架構(gòu)設(shè)計(jì)之初就專為現(xiàn)代數(shù)據(jù)中心和云中的AI、GPU加速工具而構(gòu)建。
具體來(lái)看,其能實(shí)現(xiàn)對(duì)電子郵件、日志、PDF文件和多媒體內(nèi)容等非結(jié)構(gòu)化數(shù)據(jù)的實(shí)時(shí)訪問,通過將非關(guān)鍵數(shù)據(jù)轉(zhuǎn)移到成本更低的閃存中存儲(chǔ),然后使用速度更快、價(jià)格更高的閃存,讓GPU在模型訓(xùn)練過程中能夠快速訪問大量數(shù)據(jù)。
得益于AI相關(guān)需求的日益增長(zhǎng),眾多大模型相關(guān)企業(yè)、其他賽道頭部企業(yè)等紛紛向VAST Data拋來(lái)橄欖枝,除了開篇提到的大模型領(lǐng)域炙手可熱的xAI、CoreWeave等,還有英偉達(dá)投資的云計(jì)算基礎(chǔ)設(shè)施公司Lambda和阿聯(lián)酋AI公司G42子公司Core42,以及NASA、美國(guó)能源部、波士頓兒童醫(yī)院、旅游公司Booking Holdings等其他賽道企業(yè),均是VAST Data的客戶。
▲VAST Data部分客戶名單
且與許多依賴短期合同的軟件公司不同,VAST Data會(huì)與客戶簽訂5至7年的長(zhǎng)期合同,這使得公司的客戶流失率極低,累計(jì)軟件預(yù)訂量已超過10億美元(折合人民幣約716億元)。
從融資層面看,VAST Data此前累計(jì)融資金額已經(jīng)超過3.81億美元,估值為90億美元,老虎環(huán)球、高盛等頂級(jí)投資機(jī)構(gòu),英偉達(dá)、戴爾等頭部公司均在其投資人之列。值得一提的是,此次曝出參與此輪融資的是Alphabet的獨(dú)立增長(zhǎng)基金CapitalG,該基金的投資目的是盈利,而不是戰(zhàn)略投資,這也在一定程度上說(shuō)明投資者對(duì)VAST Data盈利能力的認(rèn)可。
那么,VAST Data的產(chǎn)品到底有什么過人之處?
二、專為AI需求構(gòu)建,自研分布式系統(tǒng)架構(gòu)
能夠低成本高效處理數(shù)據(jù),一直是AI發(fā)展的命門之一。
傳統(tǒng)的數(shù)據(jù)存儲(chǔ)依賴于分層,用低成本存儲(chǔ)方案處理長(zhǎng)期存儲(chǔ)的數(shù)據(jù),用高端方案存儲(chǔ)更常使用的數(shù)據(jù)。
但數(shù)據(jù)管理的難點(diǎn)在于,傳統(tǒng)架構(gòu)下,跨全球數(shù)據(jù)中心傳輸PB乃至EB規(guī)模的數(shù)據(jù)已變得愈發(fā)難以處理;傳統(tǒng)數(shù)據(jù)架構(gòu)并非為滿足當(dāng)今AI對(duì)海量、多樣化數(shù)據(jù)集和高性能隨機(jī)I/O的需求而設(shè)計(jì);當(dāng)下的解決方案成本過高,在管理和激活數(shù)據(jù)時(shí),迫使企業(yè)需要在性能、規(guī)模、彈性和成本之間做取舍。
因此需要構(gòu)建為AI專門設(shè)計(jì)的數(shù)據(jù)處理架構(gòu)。
VAST Data的做法是消除傳統(tǒng)存儲(chǔ)的分層模式,將結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)在一個(gè)地方加速數(shù)據(jù)檢索、降低模型訓(xùn)練和推理成本,其最大的優(yōu)勢(shì)就是能讓xAI、CoreWeave部署的數(shù)萬(wàn)塊甚至數(shù)十萬(wàn)塊GPU不會(huì)因等待存儲(chǔ)而閑置。
他們是如何做到的?
該公司提出了首個(gè)分布式系統(tǒng)架構(gòu)DASE(Disaggregated Shared-Everything),作為專為AI需求設(shè)計(jì)的專有框架,其將存儲(chǔ)、計(jì)算和數(shù)據(jù)庫(kù)層統(tǒng)一為一個(gè)單一的、全球一致的系統(tǒng),且與堆疊不同工具的公有云提供商不同,VAST的AI操作系統(tǒng)消除了性能折衷,支持實(shí)時(shí)分析、遞歸計(jì)算和無(wú)縫混合云操作。
具體來(lái)看,DASE的解耦(Disaggregated)支持將數(shù)據(jù)存儲(chǔ)和計(jì)算資源分離,可獨(dú)立靈活地?cái)U(kuò)展每個(gè)組件;共享一切(Shared-Everything)意味著數(shù)據(jù)可以在所有存儲(chǔ)節(jié)點(diǎn)之間訪問,同時(shí)為所有節(jié)點(diǎn)提供統(tǒng)一數(shù)據(jù)視圖。
而依托這一架構(gòu)構(gòu)建的VAST Data Platform,可以支持1萬(wàn)個(gè)GPU集群,每秒處理量達(dá)TB級(jí)別。
VAST Data Platform這一操作系統(tǒng)由諸多組件構(gòu)成:
VAST DataSpace允許從邊緣到云、跨越數(shù)百個(gè)地點(diǎn)的數(shù)據(jù)訪問、交易和保護(hù),類似于操作系統(tǒng)的全局資源管理器;VAST DataStore就是通用存儲(chǔ)平臺(tái),堪比操作系統(tǒng)中的文件系統(tǒng);VAST DataBase負(fù)責(zé)索引功能,可提供實(shí)時(shí)查詢、分析數(shù)據(jù)的多項(xiàng)功能。VAST DataEngine則扮演著動(dòng)態(tài)計(jì)算和執(zhí)行層的角色,VAST InsightEngine是其內(nèi)部的數(shù)據(jù)精煉工具,利用AI嵌入模型將原始非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為具有上下文的數(shù)據(jù),并將其作為RAG(檢索增強(qiáng)生成)工具。
▲VAST Data AI操作系統(tǒng)架構(gòu)
今年下半年,VAST Data將補(bǔ)上數(shù)據(jù)處理AI操作系統(tǒng)核心服務(wù)的最后一塊拼圖,AI Agent部署和編排系統(tǒng)VAST AgentEngine。這意味著VAST Data的平臺(tái)已經(jīng)集成了接收數(shù)據(jù)、實(shí)時(shí)存入存儲(chǔ)以及向?qū)ふ倚畔⒌腁gent提供數(shù)據(jù)的全流程能力。
從具體的合作客戶來(lái)看,今年2月,xAI官宣的搭載超過20萬(wàn)塊英偉達(dá)GPU的超級(jí)計(jì)算集群Colossus,其背后的數(shù)據(jù)平臺(tái)就由VAST Data打造,使得Colossus的AI工作負(fù)載的總擁有成本(TCO)降低了50%;2023年9月,VAST Data與CoreWeave宣布達(dá)成戰(zhàn)略合作,CoreWeave基于VAST Data的平臺(tái)構(gòu)建了全球英偉達(dá)加速計(jì)算云,能夠管理和保護(hù)為生成式AI、高性能計(jì)算(HPC)和視覺特效(VFX)任務(wù)所需的大量數(shù)據(jù)。
VAST Data從0開始為AI構(gòu)建的系統(tǒng),將存儲(chǔ)、數(shù)據(jù)庫(kù)和虛擬化計(jì)算引擎服務(wù)統(tǒng)一其中。這也說(shuō)明,面對(duì)AI行業(yè)的新發(fā)展機(jī)遇,VAST Data已經(jīng)從最初的存儲(chǔ)公司定位,向著更廣泛的應(yīng)用空間擴(kuò)展。
三、深度綁定谷歌、英偉達(dá),新融資或?yàn)镮PO信號(hào)
此次被曝注資的兩家巨頭,都與VAST Data進(jìn)行了深度綁定。
首先是英偉達(dá),今年3月,VAST Data獲得英偉達(dá)認(rèn)證存儲(chǔ)資質(zhì)。黃仁勛曾在GTC大會(huì)、臺(tái)北國(guó)際電腦展COMPUTEX的主題演講中提到VAST Data。他認(rèn)為,AI時(shí)代數(shù)據(jù)是驅(qū)動(dòng)行業(yè)的原材料,英偉達(dá)正與全球存儲(chǔ)頭部一起,構(gòu)建新一代的企業(yè)基礎(chǔ)設(shè)施,企業(yè)需要其在混合數(shù)據(jù)中心中部署和擴(kuò)展AI Agent。VAST Data就是與英偉達(dá)合作的企業(yè)之一。
2024年底,黃仁勛與哈拉克一起錄制了一段關(guān)于AI未來(lái)的十分鐘播客,黃仁勛談到他曾在法國(guó)巴黎的VivaTech大會(huì)上提到的實(shí)現(xiàn)模型持續(xù)改進(jìn)的數(shù)據(jù)飛輪(data flywheel),當(dāng)下擴(kuò)展企業(yè)AI、從訓(xùn)練轉(zhuǎn)向?qū)崟r(shí)推理的轉(zhuǎn)變,對(duì)VAST Data來(lái)說(shuō)是一個(gè)絕佳的機(jī)會(huì)。他對(duì)于此前和VAST Data的合作感到非常自豪。
▲黃仁勛與哈拉克錄制AI播客
去年9月,VAST Data還與英偉達(dá)合作構(gòu)建了實(shí)時(shí)RAG工具InsightEngine,可以利用NIM微服務(wù)實(shí)現(xiàn)實(shí)時(shí)數(shù)據(jù)檢索,已經(jīng)在金融交易、自動(dòng)駕駛、物流等領(lǐng)域?qū)崿F(xiàn)了企業(yè)級(jí)應(yīng)用。
其次是谷歌,今年4月,VAST Data平臺(tái)已全面集成到谷歌云中,企業(yè)可以在單個(gè)高性能平臺(tái)上統(tǒng)一AI訓(xùn)練、RAG管道、高通量數(shù)據(jù)處理和非結(jié)構(gòu)化數(shù)據(jù)湖,這實(shí)現(xiàn)了跨混合環(huán)境的AI訓(xùn)練、RAG和推理,可以繞過公有云提供商的壁壘。
值得一提的是,除了與頭部客戶深度綁定外,這家創(chuàng)企與思科、超微和HPE的OEM合作使其能獲得較低的硬件成本,同時(shí)保持軟件溢價(jià),達(dá)到高毛利和快速客戶獲取的優(yōu)勢(shì)。
在現(xiàn)金流充足的情況下,外媒也認(rèn)為VAST Data獲得新融資或證明了其進(jìn)行IPO前準(zhǔn)備工作的進(jìn)程加快,去年這家創(chuàng)企還聘請(qǐng)了全球電商平臺(tái)Shopify前CFO艾米·沙佩羅(Amy Shapero)。
結(jié)語(yǔ):乘AI東風(fēng),VAST Data營(yíng)收激增
數(shù)據(jù)、算力等AI基礎(chǔ)設(shè)施平臺(tái)構(gòu)建的重要性與日俱增,盡管英偉達(dá)、微軟和谷歌等科技巨頭憑借GPU、云平臺(tái)占據(jù)了這一賽道的頭部市場(chǎng),但以VAST Data為代表的AI創(chuàng)企業(yè)務(wù)增長(zhǎng)、估值飆升也證明了這不僅是一場(chǎng)巨頭游戲。
而在巨頭環(huán)伺的AI競(jìng)賽下,VAST Data這類專注于某一垂直賽道的企業(yè),能夠針對(duì)數(shù)據(jù)存儲(chǔ)需求的變化,在大模型發(fā)展瞬息萬(wàn)變的當(dāng)下,打造完全面向AI時(shí)代企業(yè)核心需求的數(shù)據(jù)處理平臺(tái),從而收獲大批客戶以及收益。
來(lái)源:路透社、VAST Data官網(wǎng)、CTech
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.