“過去,美國和中國的大模型遙遙領(lǐng)先于其他所有對手,但如今情況已不復(fù)存在。”說這句話的是韓國 AI 初創(chuàng)公司 Upstage 的創(chuàng)始人兼 CEO 金成勛(Sung Hun KIM)。
圖 | 金成勛(來源:https://www.upstage.ai/blog)
近日,該公司獲得了 4500 萬美元的投資(約合人民幣 3 億元),投資者包含亞馬遜和 AMD 等,這使得該公司的總?cè)谫Y額達(dá)到了 1.57 億美元。金成勛表示:“我們僅使用其他公司 10% 數(shù)量的 AI 芯片,就打造出了一款頂尖前沿大模型,成本效率遠(yuǎn)超同行?!痹摴舅邪l(fā)的名為 Solar 的系列大模型,也被《金融時(shí)報(bào)》認(rèn)為性能能夠媲美中美兩國的先進(jìn)大模型,并被認(rèn)為有希望代表韓國進(jìn)軍全球 AI 競賽。與此同時(shí),該公司也致力于幫助韓國實(shí)現(xiàn)“在全球 AI 競賽中彌補(bǔ)差距”的目標(biāo)。
據(jù)了解,金成勛出生于韓國,博士畢業(yè)于美國加利福尼亞大學(xué)圣克魯斯分校。博士畢業(yè)之后,他曾在韓國互聯(lián)網(wǎng)軟件公司奈良視覺有限公司(Nara Vision Co. Ltd)擔(dān)任 CTO 6 年左右。后在香港科技大學(xué)擔(dān)任副教授一職將近 14 年。2020 年,他在韓國創(chuàng)辦 Upstage 公司并擔(dān)任 CEO。目前,其谷歌學(xué)術(shù)的 H 指數(shù)達(dá)到 58。
(來源:https://scholar.google.com/citations?hl=zh-CN&user=)
有意思的是,金成勛此前的工作經(jīng)歷主要在中國香港完成,在中國的工作經(jīng)歷想必也為他的創(chuàng)業(yè)帶來了一定助力。
(來源:https://seng.hkust.edu.hk/about/people/faculty/sung)
露西·帕克(Lucy Park)是該公司的另一位聯(lián)合創(chuàng)始人,其博士畢業(yè)于韓國首爾科技大學(xué),目前是該公司的首席產(chǎn)品官。
圖 | 露西·帕克(Lucy Park)(來源:https://www.lucypark.kr)
該公司于 7 月推出的 Solar Pro 2 模型,已成為韓國首款被獨(dú)立基準(zhǔn)測試分析機(jī)構(gòu) Artificial Analysis 認(rèn)定為“前沿模型”(frontier model)的大模型。
根據(jù) Artificial Analysis 的智能指數(shù),Solar Pro 2 在多項(xiàng)基準(zhǔn)測試中的綜合得分高于 Anthropic 的 Claude 3.7 Sonnet Thinking、DeepSeek 的 V3 以及 OpenAI 的 GPT-4.1——排名僅次于全球前十的前沿模型。
金成勛強(qiáng)調(diào),盡管 Solar Pro 2 的“參數(shù)”僅為 300 億,但性能已超越多家老牌企業(yè)的模型。他表示,公司之所以能實(shí)現(xiàn)這一突破,是因?yàn)椴捎昧嗣麨椤吧疃葦U(kuò)展”(DUS,Depth-Up Scaling)的訓(xùn)練方法:通過對基礎(chǔ)模型進(jìn)行信息層的移除與新增,在計(jì)算效率與模型性能之間找到了平衡。該方法包含深度維度擴(kuò)展與持續(xù)預(yù)訓(xùn)練兩個(gè)核心環(huán)節(jié)。與其他采用專家混合(MOE,Mixture-of-Experts)技術(shù)的大模型擴(kuò)展方法不同的是,深度擴(kuò)展方法無需進(jìn)行復(fù)雜調(diào)整,即可實(shí)現(xiàn)高效的訓(xùn)練與推理。實(shí)驗(yàn)結(jié)果表明,深度擴(kuò)展方法雖然原理簡潔,但能有效將小型高性能語言模型擴(kuò)展為更大規(guī)模的模型。經(jīng)深度擴(kuò)展方法擴(kuò)展的模型無需額外模塊(如門控網(wǎng)絡(luò)、動(dòng)態(tài)專家選擇模塊)。因此,使用深度擴(kuò)展方法擴(kuò)展的模型具備以下特點(diǎn):首先,無需為實(shí)現(xiàn)最優(yōu)訓(xùn)練效率而設(shè)計(jì)專屬訓(xùn)練框架;其次,無需為實(shí)現(xiàn)快速推理而依賴專用 CUDA 核函數(shù)。最終,經(jīng)深度擴(kuò)展方法擴(kuò)展的模型可無縫集成到現(xiàn)有訓(xùn)練與推理框架中,同時(shí)保持較高效率。值得注意的是,深度擴(kuò)展的相關(guān)論文也是金成勛目前引用量最高的論文。
圖 | 相關(guān)論文(來源:https://arxiv.org/pdf/2312.15166)
據(jù)了解,Solar Pro 2 擅長為金融、法律、醫(yī)療領(lǐng)域的企業(yè)處理復(fù)雜計(jì)算任務(wù),目前已被英特爾以及三星、韓華(Hanwha)的保險(xiǎn)子公司采用。該公司還表示,五家“美國大型保險(xiǎn)公司”也有意引入該模型,以輔助核保流程。
圖 | Solar Pro 2(來源:https://www.upstage.ai/blog/en/sola)
前沿模型的參數(shù)規(guī)模通常在 1000 億至 2000 億之間,這意味著它們需要更強(qiáng)的計(jì)算能力來完成運(yùn)算。在 Artificial Analysis 最新指數(shù)中排名第一的 xAI 公司 Grok 4 模型,參數(shù)規(guī)模更是高達(dá) 1.7 萬億。而 Solar Pro 2 不僅在韓語處理方面較為出色,它在關(guān)鍵基準(zhǔn)測試中,性能超越了許多參數(shù)規(guī)模大得多的模型。該公司在公司官網(wǎng)博客中寫道:“Solar Pro 2 充分證明,小型模型依然可以引領(lǐng)行業(yè)發(fā)展?!?/p>
在 Ko-Arena-Hard-Auto 基準(zhǔn)測試中,Solar Pro 2 的性能與 GPT-4、Claude 3 相當(dāng)。這一結(jié)果凸顯出,即便在復(fù)雜的對抗性場景中,Solar Pro 2 也能生成自然且準(zhǔn)確的響應(yīng),具備與頂尖模型抗衡的能力。
除在 Ko-Arena-Hard-Auto 基準(zhǔn)測試中表現(xiàn)突出外,Solar Pro 2 在各類通用韓語自然語言處理任務(wù)中均展現(xiàn)出穩(wěn)定性能。它在 Ko-MMLU、Hae-Rae、Ko-IFEval 等關(guān)鍵基準(zhǔn)測試中穩(wěn)居領(lǐng)先地位。從文本摘要、翻譯,到文檔理解與開放式問答,在各類任務(wù)中,它均能與參數(shù)規(guī)模大得多的頂尖模型相媲美,甚至實(shí)現(xiàn)性能超越。其優(yōu)勢還覆蓋韓語專業(yè)領(lǐng)域,可處理法律、金融、醫(yī)療等領(lǐng)域的文本內(nèi)容。
該公司在官方博客中寫道:“Solar Pro 2 不僅在韓語及其他語言的理解上表現(xiàn)卓越,其設(shè)計(jì)目標(biāo)更超越了‘預(yù)測下一個(gè)詞’的基礎(chǔ)功能?!睉{借多步推理能力與高精度分析能力,Solar Pro 2 可應(yīng)對復(fù)雜數(shù)學(xué)計(jì)算、文檔摘要、邏輯推導(dǎo)等各類任務(wù)。
當(dāng)開啟高級推理模式(Advanced Reasoning Mode)時(shí),Solar Pro 2 在各類復(fù)雜任務(wù)中均展現(xiàn)出較好能力。配套基準(zhǔn)測試表中的數(shù)據(jù)清晰表明,它在以下領(lǐng)域的性能優(yōu)勢顯著:
- 能夠提升多步任務(wù)處理性能,在 MMLU、MMLU-Pro、HumanEval 等通用推理基準(zhǔn)測試中均取得優(yōu)異成績,可為此提供佐證;
- 擅長解決高級數(shù)學(xué)問題,在 Math500、AIME(以復(fù)雜數(shù)學(xué)推理著稱的基準(zhǔn)測試)等測試中表現(xiàn)突出;
- 在復(fù)雜代碼編寫與軟件工程任務(wù)中能力強(qiáng)勁,在 SWE-Bench Agentless 等基準(zhǔn)測試中的成績可印證這一點(diǎn);
- 實(shí)現(xiàn)了極高的“每參數(shù)推理效率”。
盡管 Solar Pro 2 僅為 310 億參數(shù)模型,但其性能可與參數(shù)規(guī)模超自身兩倍以上的模型抗衡。與此同時(shí),Solar Pro 2 針對“與外部工具進(jìn)行智能交互”進(jìn)行了優(yōu)化。它不僅能夠理解語言,更能模仿人類行為模式,比如與環(huán)境交互、自主思考、執(zhí)行必要功能。
金成勛認(rèn)為,這一突破意味著韓國已躋身“擁有先進(jìn) AI 模型的少數(shù)國家”行列。目前,除了美國的 OpenAI、谷歌等行業(yè)領(lǐng)軍企業(yè),以及中國幾家公司之外,全球擁有世界級前沿模型的機(jī)構(gòu)寥寥無幾,其他僅包括法國的 Mistral 以及中東地區(qū)由政府支持的 AI 企業(yè)。其認(rèn)為,韓國老牌科技企業(yè)此前在 AI 領(lǐng)域“過于謹(jǐn)慎,錯(cuò)失良機(jī)”,而 Upstage 的成就已讓韓國重新回歸“研發(fā)超人類智能機(jī)器”的競賽賽道。另據(jù)悉,Upstage 計(jì)劃在未來一年內(nèi)研發(fā)出一款參數(shù)規(guī)模達(dá) 1000 億的新模型。
參考資料:
https://www.linkedin.com/in/hunkimup/
https://arxiv.org/pdf/2312.15166
https://www.lucypark.kr/
https://seng.hkust.edu.hk/about/people/faculty/sung-hun-kim
https://scholar.google.com/citations?hl=zh-CN&user=JE_m2UgAAAAJ&view_op=list_works&sortby=pubdate
運(yùn)營/排版:何晨龍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.