「奔向AGI」欄目聚焦AI大模型、AI agent、AI應(yīng)用、芯片、機(jī)器人等前沿、熱門的AI技術(shù)和商業(yè)創(chuàng)新。
作者丨巴里
編輯丨關(guān)雎
圖源丨Fireworks AI官網(wǎng)
又一位華人女性即將在美國(guó)科技領(lǐng)域書寫新傳奇。
據(jù)科技媒體The Information消息,人工智能云服務(wù)初創(chuàng)公司Fireworks AI,正計(jì)劃啟動(dòng)新一輪融資,目標(biāo)估值達(dá)40億美元(約合288億元人民幣,該估值已包含本輪融資金額)。
目前,知名風(fēng)投機(jī)構(gòu)Lightspeed Venture Partners(美國(guó)光速創(chuàng)投)與Index Ventures等正就領(lǐng)投事宜展開深入磋商。
若此次融資順利達(dá)成,F(xiàn)ireworks AI的估值將在短短一年內(nèi)實(shí)現(xiàn)超7倍的飛躍。這也再次凸顯了投資機(jī)構(gòu)對(duì)AI基礎(chǔ)設(shè)施領(lǐng)域,特別是推理服務(wù)賽道的濃厚興趣。
值得一提的是,這家公司已獲得多家頂級(jí)投資機(jī)構(gòu)的青睞。此前,紅杉資本、Benchmark等硅谷老牌風(fēng)投,以及英偉達(dá)、AMD、Databricks Ventures和MongoDB Ventures等產(chǎn)業(yè)資本均已參與其早期融資。
復(fù)旦才女創(chuàng)業(yè)
幫企業(yè)低成本、高效定制開源大模型
這位復(fù)旦計(jì)算機(jī)系校友正悄然改寫AI基礎(chǔ)設(shè)施的競(jìng)爭(zhēng)規(guī)則。
喬琳(Lin Qiao)在復(fù)旦大學(xué)計(jì)算機(jī)本碩連讀畢業(yè)后,便遠(yuǎn)赴加州大學(xué)圣巴巴拉分校(UC Santa Barbara)攻讀計(jì)算機(jī)博士學(xué)位。
她的職業(yè)生涯始于IBM擔(dān)任研究職位,專注于數(shù)據(jù)基礎(chǔ)設(shè)施和數(shù)據(jù)庫(kù)技術(shù),隨后在LinkedIn擔(dān)任技術(shù)主管,最終在Meta(原Facebook)擔(dān)任AI平臺(tái)架構(gòu)關(guān)鍵負(fù)責(zé)人,曾領(lǐng)導(dǎo)超過300人的工程師團(tuán)隊(duì),主導(dǎo)全球PyTorch框架的基礎(chǔ)設(shè)施研發(fā)及大規(guī)模部署。
此后,她帶領(lǐng)團(tuán)隊(duì)成功推動(dòng)PyTorch成為行業(yè)標(biāo)桿的開源框架,并將其部署至Meta的全球數(shù)據(jù)中心、移動(dòng)設(shè)備和AR/VR平臺(tái)。
Fireworks AI聯(lián)合創(chuàng)始人兼首席執(zhí)行官喬琳(Lin Qiao),圖源:The Information
這段在科技巨頭打磨的經(jīng)歷,為喬琳積累了深厚的AI底層架構(gòu)研發(fā)經(jīng)驗(yàn)。
作為全球主流開源機(jī)器學(xué)習(xí)框架PyTorch的關(guān)鍵建設(shè)者,她帶領(lǐng)團(tuán)隊(duì)攻克的技術(shù)難題,如今正轉(zhuǎn)化為Fireworks AI的核心競(jìng)爭(zhēng)力。
當(dāng)年在Meta,喬琳見證了一個(gè)重要規(guī)律:PyTorch之所以能在數(shù)十個(gè)同類框架競(jìng)爭(zhēng)中勝出,關(guān)鍵在于"把復(fù)雜留給團(tuán)隊(duì),把簡(jiǎn)單帶給用戶"的設(shè)計(jì)哲學(xué)。
盡管背后是數(shù)百名工程師構(gòu)建的復(fù)雜技術(shù)體系,但開發(fā)者只需簡(jiǎn)單調(diào)用即可獲得強(qiáng)大功能——這種用戶體驗(yàn)至上的理念,成為她創(chuàng)立Fireworks AI的初心。
"真正的創(chuàng)新不在于功能堆砌,而在于讓技術(shù)回歸本質(zhì)。"喬琳將這種思考注入創(chuàng)業(yè)實(shí)踐。
2022年,F(xiàn)ireworks AI在美國(guó)加州雷德伍德市創(chuàng)立。Fireworks AI的創(chuàng)始團(tuán)隊(duì)堪稱"夢(mèng)之隊(duì)":六位參與過Meta PyTorch項(xiàng)目的資深工程師與一位前谷歌AI專家組成核心技術(shù)班底,他們延續(xù)著喬琳在PyTorch時(shí)期沉淀的方法論——前端保持極致簡(jiǎn)潔,后端承載海量?jī)?yōu)化。
Fireworks AI創(chuàng)始團(tuán)隊(duì),圖源:Fireworks AI官網(wǎng)
就像當(dāng)年Meta投入數(shù)百名工程師構(gòu)建PyTorch生態(tài)卻讓開發(fā)者感受不到復(fù)雜度那樣,F(xiàn)ireworks AI團(tuán)隊(duì)默默攻克著分布式推理引擎等8萬(wàn)多種配置組合的技術(shù)難關(guān),卻將流暢體驗(yàn)留給終端用戶。
在喬琳看來,當(dāng)前AI領(lǐng)域的變革深度遠(yuǎn)超以往任何技術(shù)革命。"這不僅是簡(jiǎn)單的產(chǎn)業(yè)升級(jí),而是整個(gè)技術(shù)底座的地殼重構(gòu)。"
她敏銳洞察到生成式AI帶來的范式轉(zhuǎn)移:傳統(tǒng)機(jī)器學(xué)習(xí)時(shí)代,企業(yè)需要從零搭建模型;而通用人工智能(GenAI)的出現(xiàn),讓創(chuàng)新焦點(diǎn)從"構(gòu)建"轉(zhuǎn)向"應(yīng)用"。
這種轉(zhuǎn)變催生了爆炸式的市場(chǎng)機(jī)遇——全球AI初創(chuàng)企業(yè)如雨后春筍般涌現(xiàn),傳統(tǒng)企業(yè)與數(shù)字原生勢(shì)力也爭(zhēng)相涌入,試圖通過AI重構(gòu)產(chǎn)品體驗(yàn)與服務(wù)流程。
市場(chǎng)調(diào)研顯示,盡管生成式AI技術(shù)門檻大幅降低,但企業(yè)仍面臨基礎(chǔ)設(shè)施、專業(yè)人才與算力資源的三大瓶頸。
正是瞄準(zhǔn)這個(gè)廣闊的市場(chǎng),F(xiàn)ireworks AI開創(chuàng)了獨(dú)特的商業(yè)模式——“推理服務(wù)提供商”(inference provider)。
Fireworks AI核心在于幫助企業(yè)用更低的成本、更高的效率運(yùn)行和定制開源大模型,比如深度求索的 DeepSeek、阿里云的 Qwen,還有 Meta 的 Llama。
這些模型原本可能需要企業(yè)自己購(gòu)買 GPU 服務(wù)器來運(yùn)行,但 Fireworks 換了個(gè)更靈活的方式——他們租用第三方的英偉達(dá)服務(wù)器,然后通過 API 接口直接給開發(fā)者提供這些開源模型的推理能力。開發(fā)者用起來就像調(diào)用 OpenAI 的 GPT-4o 一樣方便,不用操心底層服務(wù)器的事情。
他們的核心優(yōu)勢(shì)還在于對(duì) GPU 資源做了深度優(yōu)化:通過自研的 Fire Attention 推理引擎等技術(shù),能讓模型推理更快、更省資源,最終幫助客戶降低使用成本。
在這背后,是喬琳對(duì)行業(yè)趨勢(shì)的深刻判斷。
"當(dāng)基礎(chǔ)模型的質(zhì)量與規(guī)模逐漸趨同時(shí),企業(yè)級(jí)差異化競(jìng)爭(zhēng)的關(guān)鍵,在于如何用專有數(shù)據(jù)鍛造獨(dú)特價(jià)值。"
她指出,無(wú)論是開源還是閉源的大語(yǔ)言模型,其底層架構(gòu)與數(shù)據(jù)邊界終將收斂,而真正構(gòu)筑護(hù)城河的,是如何通過模型微調(diào)將企業(yè)的商業(yè)模式、運(yùn)營(yíng)邏輯與AI能力深度融合。
這正是Fireworks AI致力解決的核心命題——讓每家企業(yè)都能基于自身數(shù)據(jù)土壤,培育出獨(dú)具競(jìng)爭(zhēng)力的AI應(yīng)用之花。
讓AI編程工具效率起飛
說句話就能讓AI改好代碼
具體來說,F(xiàn)ireworks AI的產(chǎn)品體系分為多個(gè)技術(shù)層級(jí),最底層是自研的分布式推理引擎,這個(gè)引擎是專門為生成式AI打造的,就像是為PyTorch量身定做的推理基礎(chǔ)設(shè)施。
這個(gè)引擎設(shè)計(jì)得非常靈活,像搭積木一樣可以自由組合,這樣Fireworks AI就能在新開源模型發(fā)布的當(dāng)天就快速上線。
之所以能做到這么快,是因?yàn)镕ireworks AI借鑒了PyTorch的設(shè)計(jì)理念,把系統(tǒng)做得模塊化且可靈活配置。
在服務(wù)模式上,F(xiàn)ireworks AI不會(huì)用"一刀切"的方案——不存在一個(gè)能解決所有問題的萬(wàn)能模型,也不會(huì)有適合所有使用場(chǎng)景的最佳配置。
每個(gè)用戶的需求都不一樣,就像買衣服要選合適的尺碼一樣,F(xiàn)ireworks AI為用戶提供的是可以根據(jù)質(zhì)量、速度和成本這三個(gè)維度來定制的解決方案。
比如有的用戶更看重回答質(zhì)量,有的需要更快的響應(yīng)速度,還有的要考慮成本控制,系統(tǒng)會(huì)幫他們找到最適合自己需求的平衡點(diǎn)。
為了實(shí)現(xiàn)這個(gè)目標(biāo),F(xiàn)ireworks AI開發(fā)了一個(gè)叫Fire Optimizer的工具。這個(gè)工具就像是個(gè)智能助手,能根據(jù)用戶的具體需求(比如想要更快的響應(yīng)還是更高的質(zhì)量),自動(dòng)調(diào)整模型的配置和部署方案。
這個(gè)工具通常會(huì)在現(xiàn)有的數(shù)百個(gè)模型中選擇一個(gè)合適的,然后通過各種方法來優(yōu)化,比如:
1. 量化技術(shù):用更低的精度運(yùn)行模型(比如用8位甚至4位數(shù)字代替原來的16位),這樣能大幅提升計(jì)算效率,就像把高清視頻壓縮成流暢的短視頻一樣;
2. 推測(cè)執(zhí)行:讓模型一次預(yù)測(cè)多個(gè)答案(比如一次猜4個(gè)詞而不是1個(gè)),使推理速度成倍提升;
3. 模型組合:用小模型先快速給出答案,如果不確定再讓大模型來確認(rèn),兼顧效率與準(zhǔn)確性。
這些優(yōu)化方法有很多細(xì)節(jié)和技巧,比如量化可以應(yīng)用在模型的不同部分(權(quán)重、激活值等),每種方法對(duì)最終結(jié)果的影響都不一樣,需要根據(jù)用戶的具體需求來選擇。
雖然這些選項(xiàng)聽起來有點(diǎn)復(fù)雜,但Fireworks AI的目標(biāo)就是讓用戶不必操心這些技術(shù)細(xì)節(jié),系統(tǒng)會(huì)自動(dòng)幫他們找到最好的解決方案。
商業(yè)化上,F(xiàn)ireworks AI 近期的年化收入已經(jīng)突破 2 億美元(約合14億元人民幣),即每月近 1,700 萬(wàn)美元(約合1.22億元人民幣),公司預(yù)計(jì)年底將增至3億美元(約合22億元人民幣)。
其業(yè)務(wù)擴(kuò)張離不開本身就在快速增長(zhǎng)的 AI 原生應(yīng)用公司,例如AI編程獨(dú)角獸Cursor、AI搜索獨(dú)角獸Perplexity等快速崛起的客戶支持。
那么,AI編程工具Cursor是怎么借助Fireworks AI的技術(shù),讓寫代碼比普通方法快好幾倍呢?
Cursor是個(gè)專門給程序員用的智能編程工具,能預(yù)測(cè)你的操作(比如剛改幾行代碼,它就能猜到你下一步想干啥)、用自然語(yǔ)言改代碼(比如跟它說“把這部分改成xxx”)、一鍵把生成的代碼丟進(jìn)文件里用,還能“看懂”整個(gè)項(xiàng)目的代碼并直接幫你改好。
但程序員用這類工具時(shí)有個(gè)大麻煩:想讓AI改一大段代碼(比如幾百行),現(xiàn)有的AI模型(像GPT-4、GPT-4o)經(jīng)常改得慢、不準(zhǔn),甚至越改越亂,特別影響效率。
為了解決這個(gè)難題,Cursor專門訓(xùn)練了一個(gè)新模型,專門處理“快速改代碼”的任務(wù)(稱作“Fast Apply”),在700億參數(shù)的大模型上每秒能生成約1000個(gè)token(大概3500個(gè)字符),比GPT-4和GPT-4o快多了,訓(xùn)練數(shù)據(jù)用的是程序員平時(shí)用指令改代碼的輸入和真實(shí)操作數(shù)據(jù),針對(duì)性很強(qiáng)。
不過光有厲害的模型還不夠,還得讓它跑得更快。Fireworks給Cursor提供了底層支持,用了兩個(gè)關(guān)鍵技術(shù):
一是把Cursor的模型部署到自己的推理引擎上,還針對(duì)“改代碼”任務(wù)做了性能優(yōu)化;
二是用了推測(cè)解碼技術(shù)——普通AI生成代碼得一個(gè)token一個(gè)token慢慢算,但推測(cè)解碼能“猜”接下來可能出現(xiàn)的多個(gè)token(比如一次猜好幾個(gè)詞),然后一次性驗(yàn)證這些猜測(cè)對(duì)不對(duì),對(duì)的就直接用,錯(cuò)的再調(diào)整,這樣就能同時(shí)處理好多token,速度直接起飛。
Cursor還搞了個(gè)升級(jí)版“推測(cè)編輯”,專門針對(duì)改代碼的場(chǎng)景,比如改一大段文字時(shí),AI能根據(jù)你之前的操作大膽猜“你可能想把這幾行改成xxx”,然后一次性生成好長(zhǎng)一段再快速驗(yàn)證,F(xiàn)ireworks用這個(gè)技術(shù)讓Cursor的模型速度飆到每秒1000個(gè)token,比普通推理快13倍,比之前用GPT-4的版本也快了9倍。
效果就是程序員改幾百行代碼幾秒鐘就能出結(jié)果,不用等半天,而且雖然猜得快,但最后還會(huì)用“嚴(yán)格模式”檢查一遍,確保代碼是對(duì)的。
可以說,如今程序員點(diǎn)個(gè)按鈕就能把AI生成的代碼直接丟進(jìn)項(xiàng)目里,或者一句話讓AI改好代碼,效率直接拉滿。
英偉達(dá)投資Fireworks AI后
親自殺入推理服務(wù)
當(dāng)前競(jìng)爭(zhēng)格局中,F(xiàn)ireworks AI的直接對(duì)手包括Together AI和Baseten。
以Together為例,其今年3月年化營(yíng)收達(dá)1.5億美元(約合11億元人民幣),即每月約 1250萬(wàn)美元(約合9000萬(wàn)元人民幣),估值30億美元(約合216億元人民幣)。
但整個(gè)賽道面臨更強(qiáng)勁的對(duì)手——英偉達(dá)今年3月收購(gòu)?fù)评矸?wù)商Lepton后,強(qiáng)勢(shì)推出GPU云服務(wù)市場(chǎng),直接切入了Fireworks AI的核心業(yè)務(wù)領(lǐng)域。
投行分析指出,若大型云服務(wù)商為降低AI訓(xùn)練推理成本、提供定制化服務(wù)而整合產(chǎn)業(yè)鏈,這類初創(chuàng)企業(yè)很有可能成為潛在收購(gòu)目標(biāo)。
同時(shí),F(xiàn)ireworks也面臨盈利挑戰(zhàn):雖毛利率約50%(與同行相當(dāng)),但低于訂閱制軟件常見的70%水平。
這主要因?yàn)樾桀A(yù)留大量服務(wù)器應(yīng)對(duì)需求峰值,同時(shí)承受來自CoreWeave等GPU云商家的低價(jià)競(jìng)爭(zhēng)。為此,公司正通過持續(xù)優(yōu)化GPU資源效率提升毛利率至60%,并將此列為重點(diǎn)戰(zhàn)略方向。
盡管如此,投資機(jī)構(gòu)仍然看好Fireworks AI的潛力。
睿獸分析顯示,F(xiàn)ireworks AI成立至今已經(jīng)完成共計(jì)7,700 萬(wàn)美元的兩輪融資。B輪融資過后,公司估值達(dá)到5.52億美元(約合40億元人民幣),投資方包括紅杉資本、Benchmark等頂級(jí)風(fēng)投,以及英偉達(dá)、AMD、Databricks Ventures和MongoDB Ventures等產(chǎn)業(yè)資本。
可以說,喬琳是被英偉達(dá)創(chuàng)始人兼CEO黃仁勛和“芯片女王”AMD董事長(zhǎng)兼CEO蘇姿豐同時(shí)看中的創(chuàng)業(yè)者。
喬琳透露,F(xiàn)ireworksAI未來一年的核心戰(zhàn)略是強(qiáng)化Fire Optimizer系統(tǒng)——該智能優(yōu)化工具能在模型質(zhì)量、響應(yīng)速度、成本之間自動(dòng)尋找最優(yōu)解。
目前,F(xiàn)ire Optimizer已經(jīng)在響應(yīng)速度和成本控制上做的足夠好,接下來會(huì)特別強(qiáng)化在推理質(zhì)量上的能力。通過個(gè)性化定制,能夠讓模型效果比通用模型或普通API強(qiáng)得多,特別是當(dāng)加入客戶自己的業(yè)務(wù)數(shù)據(jù)后,效果會(huì)更為出色。
盡管用戶體驗(yàn)容易被復(fù)制,但真正拉開差距的護(hù)城河是企業(yè)自己積累的數(shù)據(jù)和用戶使用習(xí)慣——這些數(shù)據(jù)形成的反饋循環(huán)特別重要,會(huì)直接反哺到他們使用的AI模型里。
喬琳預(yù)測(cè),2025年將成為"Agent年"和"開源模型年"。
各行業(yè)將涌現(xiàn)大量解決垂直問題的AI智能體,同時(shí)開源模型將迎來井噴式發(fā)展——就像DeepSeek當(dāng)時(shí)發(fā)布僅一個(gè)月,Hugging Face上就出現(xiàn)了500多個(gè)優(yōu)化版本,還成功將其適配到各種設(shè)備和云平臺(tái)上,Perplexity和她的客戶Linnk還開發(fā)了針對(duì)金融服務(wù)的定制版本。
不過,她也指出,未來最大的挑戰(zhàn)在于:
如何讓快速發(fā)展的AI智能體和開源模型更好地結(jié)合,在最后一公里實(shí)現(xiàn)質(zhì)量?jī)?yōu)化,為用戶提供更好的實(shí)時(shí)體驗(yàn)。這也是FireworksAI公司今年要重點(diǎn)解決的問題——簡(jiǎn)化開發(fā)者在這方面的工作流程。
在4月紐約舉辦的行業(yè)峰會(huì)上,喬琳展示了團(tuán)隊(duì)的終極愿景:"我們賭定那些真正懂產(chǎn)品的開發(fā)者。誰(shuí)能玩轉(zhuǎn)自己的數(shù)據(jù)、調(diào)教出更聰明的模型,誰(shuí)就能贏到最后。"
FireworksAI要做的,就是提供工具與基礎(chǔ)設(shè)施,幫助開發(fā)者定制模型、注入數(shù)據(jù),全面提升推理質(zhì)量、速度與并發(fā)能力——讓每個(gè)用心打磨產(chǎn)品的團(tuán)隊(duì),都能站上AI時(shí)代的聚光燈下。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.