2019 年,在自己和其他兩位合作者的論文發(fā)表之后,西班牙物理學(xué)家羅曼·奧魯斯(Román Orús)的電話開始響個不停。電話那頭是摩根大通等大型機(jī)構(gòu)的工作人員,他們對論文結(jié)果表現(xiàn)出濃厚興趣。這讓奧魯斯和其他論文作者意識到,他們掌握了一項強(qiáng)大且獨特的技術(shù),于是決定成立一家公司,并由奧魯斯擔(dān)任聯(lián)合創(chuàng)始人和首席科學(xué)家。
圖 | 羅曼·奧魯斯(Román Orús)(來源:資料圖)
如今這家名為 Multiverse Computing 的西班牙公司已經(jīng) 6 歲了,它被西班牙發(fā)行量最大的日報之一《國家報》(EL PAíS)稱之為西班牙在量子計算領(lǐng)域的巨大希望 [1]。
近日,該公司發(fā)布了兩款極為小巧的 AI 模型,它們的命名靈感源自于雞腦和蒼蠅腦,并采用了量子壓縮技術(shù)。該公司稱這兩款模型是全球體積最小卻仍保持高性能的模型,其中一款甚至能同時處理聊天、語音及推理任務(wù)。這些微型模型旨在嵌入物聯(lián)網(wǎng)設(shè)備,同時支持在智能手機(jī)、平板電腦和個人電腦等設(shè)備上本地運行。據(jù)了解,該公司能將模型壓縮到足以適配各類設(shè)備的程度,用戶可以在本地運行它們,也可以直接在 iPhone 或 Apple Watch 上使用。
其中:
第一款模型的名字叫做“超級蒼蠅(SuperFly)”,是該公司基于 Hugging Face 開源模型 SmolLM 2-135 打造的壓縮版。原版模型擁有 1.35 億參數(shù),專為設(shè)備端使用開發(fā)。而 SuperFly 的參數(shù)縮減至 9400 萬,奧魯斯將其大小比作蒼蠅的大腦。他表示,SuperFly 可用于在受限數(shù)據(jù)上接受訓(xùn)練。該公司設(shè)想將其嵌入家用電器,讓用戶能通過語音指令操作設(shè)備,比如對洗衣機(jī)說“啟動快速洗滌”,或提出故障排查問題。在相關(guān)演示中,該公司還展示了該模型可以借助小型處理器來支持語音交互的能力。
第二款模型的名字叫“雞腦(ChickBrain)”,參數(shù)規(guī)模更大達(dá)到了 32 億,但是功能也更強(qiáng)大,具備一定的推理能力。它是該公司基于 Meta Llama 3.1 8B 模型打造的壓縮版,但卻小巧到能在 MacBook 上運行,并且無需聯(lián)網(wǎng)。更重要的是,在多項標(biāo)準(zhǔn)基準(zhǔn)測試中,ChickBrain 的表現(xiàn)甚至略優(yōu)于原版模型。
這兩款新模型的體積非常小,幾乎能為所有物聯(lián)網(wǎng)設(shè)備賦予聊天 AI 功能。目前,該公司尚未公開 SuperFly 的基準(zhǔn)數(shù)據(jù),不過該模型的目標(biāo)場景本身就不涉及到推理需求?;诖?,其僅僅公布了針對 ChickBrain 的內(nèi)部基準(zhǔn)測試結(jié)果。
(來源:資料圖)
總的來說,此次推出的全球最小的高性能 AI 模型,挑戰(zhàn)了 AI 系統(tǒng)日趨龐大復(fù)雜的傳統(tǒng)趨勢。其能在不降低性能的前提下大幅縮減現(xiàn)有 AI 模型的規(guī)模,這一突破有望改變 AI 的部署格局,推動設(shè)備端處理成為可能,并能帶來離線功能、增強(qiáng)隱私保護(hù)、降低延遲及減少運營成本等優(yōu)勢。
據(jù)了解,Multiverse Computing 公司總部位于西班牙多諾斯蒂亞,目前在全球擁有約 100 名員工。如前所述,一切要始于 2019 年。當(dāng)時奧魯斯與目前在該公司擔(dān)任 CTO 的塞繆爾·穆格爾(Samuel Mugel)、以及目前在該公司擔(dān)任 CEO 的恩里克·利薩索·奧爾莫斯(Enrique Lizaso Olmos)共同發(fā)表了一篇關(guān)于量子計算在金融領(lǐng)域應(yīng)用的論文。
(來源:https://www.sciencedirect.com/science/article/pii/S)
這篇論文指出盡管機(jī)器學(xué)習(xí)算法通常效率極高,但其訓(xùn)練過程的計算成本可能很高。通過使用量子退火器訓(xùn)練神經(jīng)網(wǎng)絡(luò),這種開銷可大幅降低。一旦完成訓(xùn)練,該算法即可在任何經(jīng)典計算機(jī)上運行。這篇論文在當(dāng)時給出了如下推測:與標(biāo)準(zhǔn)訓(xùn)練方法相比,這種方法更不易陷入局部最小值。在相關(guān)理念的早期實現(xiàn)中,已有研究團(tuán)隊利用 D-Wave 量子計算機(jī)高效訓(xùn)練玻爾茲曼機(jī)。這一成果得以實現(xiàn)的原因在于,神經(jīng)網(wǎng)絡(luò)的運行并不需要通用量子計算機(jī)。玻爾茲曼機(jī)在物理上可理解為經(jīng)典伊辛模型,其中自旋間耦合和局部磁場經(jīng)過精細(xì)調(diào)節(jié),使得部分自旋的熱殘余概率分布能模擬輸入的訓(xùn)練概率。盡管玻爾茲曼機(jī)并非深度學(xué)習(xí)網(wǎng)絡(luò),但是這篇論文預(yù)計當(dāng)時這些原理性研究將成為后續(xù)實現(xiàn)突破性進(jìn)展的第一步。
與傳統(tǒng)計算使用 0 和 1 的經(jīng)典比特不同,量子計算采用一種名為“量子比特(qubit)”的單位。這使得單個量子比特能承載比普通比特更多的信息,從而能夠開啟新的計算可能。奧魯斯告訴媒體,與 Multiverse Computing 公司簽訂首份合同的機(jī)構(gòu)是西班牙對外銀行。該銀行希望解決金融領(lǐng)域最棘手的難題之一:投資組合優(yōu)化,即確定精準(zhǔn)的買賣時點,以實現(xiàn)收益最大化和風(fēng)險最小化。這是金融領(lǐng)域的一個“硬骨頭”問題,因為要得出最優(yōu)解“需要調(diào)動全部的計算能力”。
2022 年 11 月 30 日對于奧魯斯來說是一個激動人心的日子。當(dāng)天,ChatGPT 的商業(yè)版本正式上市。奧魯斯認(rèn)為這是測試量子計算潛力的最佳案例,但他發(fā)現(xiàn) OpenAI 的這款明星產(chǎn)品效率低下,因為其訓(xùn)練過程耗費了大量能源和資源。因此他和同事意識到,他們可以運用自身經(jīng)驗來壓縮語言模型,同時無需犧牲精度。壓縮之后不僅能大幅節(jié)省能源,還能讓這項技術(shù)在無需聯(lián)網(wǎng)的便攜式設(shè)備上運行。此外,用戶無需將信息分享給第三方,同時也解決了隱私問題。他們將這款模型壓縮技術(shù)命名為 CompactifAI。CompactifAI 是一種受量子技術(shù)啟發(fā)的壓縮算法,能夠在不犧牲模型性能的前提下減小現(xiàn)有 AI 模型的體積。與此同時,這一壓縮技術(shù)不同于計算機(jī)科學(xué)或機(jī)器學(xué)習(xí)領(lǐng)域常用的傳統(tǒng)壓縮技術(shù),因為這一技術(shù)源自量子物理學(xué),所以是一種更精妙、更精細(xì)化的壓縮算法。
圖 | CompactifAI(來源:https://multiversecomputing.com/com)
后來,這項技術(shù)為該公司打開了在衛(wèi)星、無人機(jī)、潛艇乃至汽車上部署技術(shù)的大門。與此同時,也吸引到了相關(guān)政府的關(guān)注,比如西班牙政府通過西班牙技術(shù)轉(zhuǎn)型公司于 2025 年 3 月向這家企業(yè)投資 6700 萬歐元。2025 年 6 月,憑借 CompactifAI 這一模型壓縮技術(shù)其完成了 1.89 億歐元(約合 2.15 億美元)的融資,這也是西班牙本年度規(guī)模最大的融資交易之一。
除了上述兩款模型之外,該公司在更早之前已經(jīng)發(fā)布了多個開源模型的壓縮版本,比如 Llama 4 Scout、Mistral Small 3.1 等熱門小型模型。此外,它還推出了基于 OpenAI 兩款新開源模型的壓縮版,同時也對部分超大型模型進(jìn)行了壓縮,例如它研發(fā)了 DeepSeek R1 Slim 版本。由于該公司的核心業(yè)務(wù)是縮小模型體積,因此它格外專注于研發(fā)體積最小卻性能最強(qiáng)的模型。該公司將這一系列模型命名為“模型動物園(Model Zoo)”,因為所有產(chǎn)品的名稱均以動物大腦尺寸為靈感命名。需要注意的是,該公司并未宣稱“模型動物園(Model Zoo)”能在這類基準(zhǔn)測試中擊敗最先進(jìn)的大型模型,甚至這一模型庫的性能可能還無法躋身排行榜。但是,該公司表示關(guān)鍵在于其技術(shù)能夠在不損失性能的前提下縮小模型規(guī)模,在增強(qiáng)隱私保護(hù)的同時還能降低成本,這將讓 AI 從對云端的依賴轉(zhuǎn)向消費設(shè)備中的本地化處理。
奧魯斯稱,公司目前正在和家電制造商洽談合作。比如,其曾和蘋果、三星、索尼、惠普等公司洽談。惠普公司在最近一輪融資中還成為了投資方。與此同時,在最近一輪融資中東芝公司也是投資方之一。另據(jù)悉,這家公司還為圖像識別等其他機(jī)器學(xué)習(xí)形式提供技術(shù)支持,自創(chuàng)立以來已經(jīng)獲得巴斯夫、博世等客戶。除了直接向大型設(shè)備制造商銷售模型外,該公司還通過亞馬遜云科技上托管的 API 提供其壓縮模型,不僅任何開發(fā)者都可以使用,而且其表示 token 費用低于競爭對手。總的來說,該公司已經(jīng)成為全球最大的量子計算與 AI 軟件公司之一,并被 CB Insights 評為全球最具潛力的 AI 公司之一,以及被歐洲媒體 Sifted 評為南歐增長最快的 100 家初創(chuàng)企業(yè)之一。
(來源:資料圖)
另據(jù)悉,擔(dān)任該公司聯(lián)合創(chuàng)始人兼首席科學(xué)家的奧魯斯是一名西班牙理論物理學(xué)家,他同時也在西班牙多諾斯蒂亞國際物理中心(DIPC,Donostia International Physics Center)擔(dān)任教授,專攻量子信息科學(xué)和量子張量網(wǎng)絡(luò)領(lǐng)域。早年,他在西班牙巴塞羅那大學(xué)取得博士學(xué)位。之后,他先后工作于澳大利亞昆士蘭大學(xué)、德國馬克斯·普朗克量子光學(xué)研究所、德國美因茨約翰內(nèi)斯·古騰堡大學(xué)擔(dān)任初級教授。此前,他曾撰寫大量關(guān)于量子研究的論文,累計被引用數(shù)千次,在復(fù)雜量子系統(tǒng)和應(yīng)用量子計算領(lǐng)域做出了一定貢獻(xiàn)。
該公司的創(chuàng)始人兼 CEO 恩里克·利薩索·奧爾莫斯(Enrique Lizaso Olmos),則擁有西班牙巴塞羅那大學(xué)生物統(tǒng)計學(xué)博士學(xué)位,并擁有一定的銀行業(yè)從業(yè)經(jīng)驗。
該公司的 CTO 塞繆爾·穆格爾(Samuel Mugel)博士畢業(yè)于英國南安普頓大學(xué)。目前,主要致力于將公司的量子技術(shù)用于賦能業(yè)界。
參考資料:
1.https://elpais.com/economia/negocios/2025-08-14/multiverse-computing-cabalga-a-lomos-de-la-computacion-cuantica.html#
https://techcrunch.com/2025/08/14/buzzy-ai-startup-multiverse-creates-two-of-the-smallest-high-performing-models-ever/
https://www.ainvest.com/news/multiverse-launches-smallest-high-performing-ai-models-quantum-inspired-compression-2508/
https://www.sciencedirect.com/science/article/pii/S2405428318300571#sec0013
https://www.sciencedirect.com/science/article/pii/S2405428318300571#sec0013
https://www.linkedin.com/in/enriquelizaso/?originalSubdomain=es
https://en.wikipedia.org/wiki/Rom%C3%A1n_Or%C3%BAs
https://multiversecomputing.com/
運營/排版:何晨龍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.