韓國AI獨(dú)角獸獲AMD參投3億元，以300億參數(shù)模型媲美中美頂尖模型

2025-08-25 20:09:15　來源: DeepTech深科技

北京舉報(bào)

分享至

“過去，美國和中國的大模型遙遙領(lǐng)先于其他所有對手，但如今情況已不復(fù)存在。”說這句話的是韓國 AI 初創(chuàng)公司 Upstage 的創(chuàng)始人兼 CEO 金成勛（Sung Hun KIM）。

圖 | 金成勛（來源：https://www.upstage.ai/blog）

近日，該公司獲得了 4500 萬美元的投資（約合人民幣 3 億元），投資者包含亞馬遜和 AMD 等，這使得該公司的總?cè)谫Y額達(dá)到了 1.57 億美元。金成勛表示：“我們僅使用其他公司 10% 數(shù)量的 AI 芯片，就打造出了一款頂尖前沿大模型，成本效率遠(yuǎn)超同行?！痹摴舅邪l(fā)的名為 Solar 的系列大模型，也被《金融時(shí)報(bào)》認(rèn)為性能能夠媲美中美兩國的先進(jìn)大模型，并被認(rèn)為有希望代表韓國進(jìn)軍全球 AI 競賽。與此同時(shí)，該公司也致力于幫助韓國實(shí)現(xiàn)“在全球 AI 競賽中彌補(bǔ)差距”的目標(biāo)。

據(jù)了解，金成勛出生于韓國，博士畢業(yè)于美國加利福尼亞大學(xué)圣克魯斯分校。博士畢業(yè)之后，他曾在韓國互聯(lián)網(wǎng)軟件公司奈良視覺有限公司（Nara Vision Co. Ltd）擔(dān)任 CTO 6 年左右。后在香港科技大學(xué)擔(dān)任副教授一職將近 14 年。2020 年，他在韓國創(chuàng)辦 Upstage 公司并擔(dān)任 CEO。目前，其谷歌學(xué)術(shù)的 H 指數(shù)達(dá)到 58。

（來源：https://scholar.google.com/citations?hl=zh-CN&user=）

有意思的是，金成勛此前的工作經(jīng)歷主要在中國香港完成，在中國的工作經(jīng)歷想必也為他的創(chuàng)業(yè)帶來了一定助力。

（來源：https://seng.hkust.edu.hk/about/people/faculty/sung）

露西·帕克（Lucy Park）是該公司的另一位聯(lián)合創(chuàng)始人，其博士畢業(yè)于韓國首爾科技大學(xué)，目前是該公司的首席產(chǎn)品官。

圖 | 露西·帕克（Lucy Park）（來源：https://www.lucypark.kr）

該公司于 7 月推出的 Solar Pro 2 模型，已成為韓國首款被獨(dú)立基準(zhǔn)測試分析機(jī)構(gòu) Artificial Analysis 認(rèn)定為“前沿模型”（frontier model）的大模型。

根據(jù) Artificial Analysis 的智能指數(shù)，Solar Pro 2 在多項(xiàng)基準(zhǔn)測試中的綜合得分高于 Anthropic 的 Claude 3.7 Sonnet Thinking、DeepSeek 的 V3 以及 OpenAI 的 GPT-4.1——排名僅次于全球前十的前沿模型。

金成勛強(qiáng)調(diào)，盡管 Solar Pro 2 的“參數(shù)”僅為 300 億，但性能已超越多家老牌企業(yè)的模型。他表示，公司之所以能實(shí)現(xiàn)這一突破，是因?yàn)椴捎昧嗣麨椤吧疃葦U(kuò)展”（DUS，Depth-Up Scaling）的訓(xùn)練方法：通過對基礎(chǔ)模型進(jìn)行信息層的移除與新增，在計(jì)算效率與模型性能之間找到了平衡。該方法包含深度維度擴(kuò)展與持續(xù)預(yù)訓(xùn)練兩個(gè)核心環(huán)節(jié)。與其他采用專家混合（MOE，Mixture-of-Experts）技術(shù)的大模型擴(kuò)展方法不同的是，深度擴(kuò)展方法無需進(jìn)行復(fù)雜調(diào)整，即可實(shí)現(xiàn)高效的訓(xùn)練與推理。實(shí)驗(yàn)結(jié)果表明，深度擴(kuò)展方法雖然原理簡潔，但能有效將小型高性能語言模型擴(kuò)展為更大規(guī)模的模型。經(jīng)深度擴(kuò)展方法擴(kuò)展的模型無需額外模塊（如門控網(wǎng)絡(luò)、動(dòng)態(tài)專家選擇模塊）。因此，使用深度擴(kuò)展方法擴(kuò)展的模型具備以下特點(diǎn)：首先，無需為實(shí)現(xiàn)最優(yōu)訓(xùn)練效率而設(shè)計(jì)專屬訓(xùn)練框架；其次，無需為實(shí)現(xiàn)快速推理而依賴專用 CUDA 核函數(shù)。最終，經(jīng)深度擴(kuò)展方法擴(kuò)展的模型可無縫集成到現(xiàn)有訓(xùn)練與推理框架中，同時(shí)保持較高效率。值得注意的是，深度擴(kuò)展的相關(guān)論文也是金成勛目前引用量最高的論文。

圖 | 相關(guān)論文（來源：https://arxiv.org/pdf/2312.15166）

據(jù)了解，Solar Pro 2 擅長為金融、法律、醫(yī)療領(lǐng)域的企業(yè)處理復(fù)雜計(jì)算任務(wù)，目前已被英特爾以及三星、韓華（Hanwha）的保險(xiǎn)子公司采用。該公司還表示，五家“美國大型保險(xiǎn)公司”也有意引入該模型，以輔助核保流程。

圖 | Solar Pro 2（來源：https://www.upstage.ai/blog/en/sola）

前沿模型的參數(shù)規(guī)模通常在 1000 億至 2000 億之間，這意味著它們需要更強(qiáng)的計(jì)算能力來完成運(yùn)算。在 Artificial Analysis 最新指數(shù)中排名第一的 xAI 公司 Grok 4 模型，參數(shù)規(guī)模更是高達(dá) 1.7 萬億。而 Solar Pro 2 不僅在韓語處理方面較為出色，它在關(guān)鍵基準(zhǔn)測試中，性能超越了許多參數(shù)規(guī)模大得多的模型。該公司在公司官網(wǎng)博客中寫道：“Solar Pro 2 充分證明，小型模型依然可以引領(lǐng)行業(yè)發(fā)展?！?/p>

在 Ko-Arena-Hard-Auto 基準(zhǔn)測試中，Solar Pro 2 的性能與 GPT-4、Claude 3 相當(dāng)。這一結(jié)果凸顯出，即便在復(fù)雜的對抗性場景中，Solar Pro 2 也能生成自然且準(zhǔn)確的響應(yīng)，具備與頂尖模型抗衡的能力。

除在 Ko-Arena-Hard-Auto 基準(zhǔn)測試中表現(xiàn)突出外，Solar Pro 2 在各類通用韓語自然語言處理任務(wù)中均展現(xiàn)出穩(wěn)定性能。它在 Ko-MMLU、Hae-Rae、Ko-IFEval 等關(guān)鍵基準(zhǔn)測試中穩(wěn)居領(lǐng)先地位。從文本摘要、翻譯，到文檔理解與開放式問答，在各類任務(wù)中，它均能與參數(shù)規(guī)模大得多的頂尖模型相媲美，甚至實(shí)現(xiàn)性能超越。其優(yōu)勢還覆蓋韓語專業(yè)領(lǐng)域，可處理法律、金融、醫(yī)療等領(lǐng)域的文本內(nèi)容。

該公司在官方博客中寫道：“Solar Pro 2 不僅在韓語及其他語言的理解上表現(xiàn)卓越，其設(shè)計(jì)目標(biāo)更超越了‘預(yù)測下一個(gè)詞’的基礎(chǔ)功能?！睉{借多步推理能力與高精度分析能力，Solar Pro 2 可應(yīng)對復(fù)雜數(shù)學(xué)計(jì)算、文檔摘要、邏輯推導(dǎo)等各類任務(wù)。

當(dāng)開啟高級推理模式（Advanced Reasoning Mode）時(shí)，Solar Pro 2 在各類復(fù)雜任務(wù)中均展現(xiàn)出較好能力。配套基準(zhǔn)測試表中的數(shù)據(jù)清晰表明，它在以下領(lǐng)域的性能優(yōu)勢顯著：

能夠提升多步任務(wù)處理性能，在 MMLU、MMLU-Pro、HumanEval 等通用推理基準(zhǔn)測試中均取得優(yōu)異成績，可為此提供佐證；
擅長解決高級數(shù)學(xué)問題，在 Math500、AIME（以復(fù)雜數(shù)學(xué)推理著稱的基準(zhǔn)測試）等測試中表現(xiàn)突出；
在復(fù)雜代碼編寫與軟件工程任務(wù)中能力強(qiáng)勁，在 SWE-Bench Agentless 等基準(zhǔn)測試中的成績可印證這一點(diǎn)；
實(shí)現(xiàn)了極高的“每參數(shù)推理效率”。

盡管 Solar Pro 2 僅為 310 億參數(shù)模型，但其性能可與參數(shù)規(guī)模超自身兩倍以上的模型抗衡。與此同時(shí)，Solar Pro 2 針對“與外部工具進(jìn)行智能交互”進(jìn)行了優(yōu)化。它不僅能夠理解語言，更能模仿人類行為模式，比如與環(huán)境交互、自主思考、執(zhí)行必要功能。

金成勛認(rèn)為，這一突破意味著韓國已躋身“擁有先進(jìn) AI 模型的少數(shù)國家”行列。目前，除了美國的 OpenAI、谷歌等行業(yè)領(lǐng)軍企業(yè)，以及中國幾家公司之外，全球擁有世界級前沿模型的機(jī)構(gòu)寥寥無幾，其他僅包括法國的 Mistral 以及中東地區(qū)由政府支持的 AI 企業(yè)。其認(rèn)為，韓國老牌科技企業(yè)此前在 AI 領(lǐng)域“過于謹(jǐn)慎，錯(cuò)失良機(jī)”，而 Upstage 的成就已讓韓國重新回歸“研發(fā)超人類智能機(jī)器”的競賽賽道。另據(jù)悉，Upstage 計(jì)劃在未來一年內(nèi)研發(fā)出一款參數(shù)規(guī)模達(dá) 1000 億的新模型。

參考資料：

https://www.linkedin.com/in/hunkimup/

https://arxiv.org/pdf/2312.15166

https://www.lucypark.kr/

https://seng.hkust.edu.hk/about/people/faculty/sung-hun-kim

https://scholar.google.com/citations?hl=zh-CN&user=JE_m2UgAAAAJ&view_op=list_works&sortby=pubdate

運(yùn)營/排版：何晨龍

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.