成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

韓國AI獨(dú)角獸獲AMD參投3億元,以300億參數(shù)模型媲美中美頂尖模型

0
分享至

“過去,美國和中國的大模型遙遙領(lǐng)先于其他所有對手,但如今情況已不復(fù)存在。”說這句話的是韓國 AI 初創(chuàng)公司 Upstage 的創(chuàng)始人兼 CEO 金成勛(Sung Hun KIM)。


圖 | 金成勛(來源:https://www.upstage.ai/blog)

近日,該公司獲得了 4500 萬美元的投資(約合人民幣 3 億元),投資者包含亞馬遜和 AMD 等,這使得該公司的總?cè)谫Y額達(dá)到了 1.57 億美元。金成勛表示:“我們僅使用其他公司 10% 數(shù)量的 AI 芯片,就打造出了一款頂尖前沿大模型,成本效率遠(yuǎn)超同行?!痹摴舅邪l(fā)的名為 Solar 的系列大模型,也被《金融時(shí)報(bào)》認(rèn)為性能能夠媲美中美兩國的先進(jìn)大模型,并被認(rèn)為有希望代表韓國進(jìn)軍全球 AI 競賽。與此同時(shí),該公司也致力于幫助韓國實(shí)現(xiàn)“在全球 AI 競賽中彌補(bǔ)差距”的目標(biāo)。

據(jù)了解,金成勛出生于韓國,博士畢業(yè)于美國加利福尼亞大學(xué)圣克魯斯分校。博士畢業(yè)之后,他曾在韓國互聯(lián)網(wǎng)軟件公司奈良視覺有限公司(Nara Vision Co. Ltd)擔(dān)任 CTO 6 年左右。后在香港科技大學(xué)擔(dān)任副教授一職將近 14 年。2020 年,他在韓國創(chuàng)辦 Upstage 公司并擔(dān)任 CEO。目前,其谷歌學(xué)術(shù)的 H 指數(shù)達(dá)到 58。


(來源:https://scholar.google.com/citations?hl=zh-CN&user=)

有意思的是,金成勛此前的工作經(jīng)歷主要在中國香港完成,在中國的工作經(jīng)歷想必也為他的創(chuàng)業(yè)帶來了一定助力。


(來源:https://seng.hkust.edu.hk/about/people/faculty/sung)

露西·帕克(Lucy Park)是該公司的另一位聯(lián)合創(chuàng)始人,其博士畢業(yè)于韓國首爾科技大學(xué),目前是該公司的首席產(chǎn)品官。


圖 | 露西·帕克(Lucy Park)(來源:https://www.lucypark.kr)

該公司于 7 月推出的 Solar Pro 2 模型,已成為韓國首款被獨(dú)立基準(zhǔn)測試分析機(jī)構(gòu) Artificial Analysis 認(rèn)定為“前沿模型”(frontier model)的大模型。

根據(jù) Artificial Analysis 的智能指數(shù),Solar Pro 2 在多項(xiàng)基準(zhǔn)測試中的綜合得分高于 Anthropic 的 Claude 3.7 Sonnet Thinking、DeepSeek 的 V3 以及 OpenAI 的 GPT-4.1——排名僅次于全球前十的前沿模型。

金成勛強(qiáng)調(diào),盡管 Solar Pro 2 的“參數(shù)”僅為 300 億,但性能已超越多家老牌企業(yè)的模型。他表示,公司之所以能實(shí)現(xiàn)這一突破,是因?yàn)椴捎昧嗣麨椤吧疃葦U(kuò)展”(DUS,Depth-Up Scaling)的訓(xùn)練方法:通過對基礎(chǔ)模型進(jìn)行信息層的移除與新增,在計(jì)算效率與模型性能之間找到了平衡。該方法包含深度維度擴(kuò)展與持續(xù)預(yù)訓(xùn)練兩個(gè)核心環(huán)節(jié)。與其他采用專家混合(MOE,Mixture-of-Experts)技術(shù)的大模型擴(kuò)展方法不同的是,深度擴(kuò)展方法無需進(jìn)行復(fù)雜調(diào)整,即可實(shí)現(xiàn)高效的訓(xùn)練與推理。實(shí)驗(yàn)結(jié)果表明,深度擴(kuò)展方法雖然原理簡潔,但能有效將小型高性能語言模型擴(kuò)展為更大規(guī)模的模型。經(jīng)深度擴(kuò)展方法擴(kuò)展的模型無需額外模塊(如門控網(wǎng)絡(luò)、動(dòng)態(tài)專家選擇模塊)。因此,使用深度擴(kuò)展方法擴(kuò)展的模型具備以下特點(diǎn):首先,無需為實(shí)現(xiàn)最優(yōu)訓(xùn)練效率而設(shè)計(jì)專屬訓(xùn)練框架;其次,無需為實(shí)現(xiàn)快速推理而依賴專用 CUDA 核函數(shù)。最終,經(jīng)深度擴(kuò)展方法擴(kuò)展的模型可無縫集成到現(xiàn)有訓(xùn)練與推理框架中,同時(shí)保持較高效率。值得注意的是,深度擴(kuò)展的相關(guān)論文也是金成勛目前引用量最高的論文。


圖 | 相關(guān)論文(來源:https://arxiv.org/pdf/2312.15166)

據(jù)了解,Solar Pro 2 擅長為金融、法律、醫(yī)療領(lǐng)域的企業(yè)處理復(fù)雜計(jì)算任務(wù),目前已被英特爾以及三星、韓華(Hanwha)的保險(xiǎn)子公司采用。該公司還表示,五家“美國大型保險(xiǎn)公司”也有意引入該模型,以輔助核保流程。


圖 | Solar Pro 2(來源:https://www.upstage.ai/blog/en/sola)

前沿模型的參數(shù)規(guī)模通常在 1000 億至 2000 億之間,這意味著它們需要更強(qiáng)的計(jì)算能力來完成運(yùn)算。在 Artificial Analysis 最新指數(shù)中排名第一的 xAI 公司 Grok 4 模型,參數(shù)規(guī)模更是高達(dá) 1.7 萬億。而 Solar Pro 2 不僅在韓語處理方面較為出色,它在關(guān)鍵基準(zhǔn)測試中,性能超越了許多參數(shù)規(guī)模大得多的模型。該公司在公司官網(wǎng)博客中寫道:“Solar Pro 2 充分證明,小型模型依然可以引領(lǐng)行業(yè)發(fā)展?!?/p>

在 Ko-Arena-Hard-Auto 基準(zhǔn)測試中,Solar Pro 2 的性能與 GPT-4、Claude 3 相當(dāng)。這一結(jié)果凸顯出,即便在復(fù)雜的對抗性場景中,Solar Pro 2 也能生成自然且準(zhǔn)確的響應(yīng),具備與頂尖模型抗衡的能力。

除在 Ko-Arena-Hard-Auto 基準(zhǔn)測試中表現(xiàn)突出外,Solar Pro 2 在各類通用韓語自然語言處理任務(wù)中均展現(xiàn)出穩(wěn)定性能。它在 Ko-MMLU、Hae-Rae、Ko-IFEval 等關(guān)鍵基準(zhǔn)測試中穩(wěn)居領(lǐng)先地位。從文本摘要、翻譯,到文檔理解與開放式問答,在各類任務(wù)中,它均能與參數(shù)規(guī)模大得多的頂尖模型相媲美,甚至實(shí)現(xiàn)性能超越。其優(yōu)勢還覆蓋韓語專業(yè)領(lǐng)域,可處理法律、金融、醫(yī)療等領(lǐng)域的文本內(nèi)容。

該公司在官方博客中寫道:“Solar Pro 2 不僅在韓語及其他語言的理解上表現(xiàn)卓越,其設(shè)計(jì)目標(biāo)更超越了‘預(yù)測下一個(gè)詞’的基礎(chǔ)功能?!睉{借多步推理能力與高精度分析能力,Solar Pro 2 可應(yīng)對復(fù)雜數(shù)學(xué)計(jì)算、文檔摘要、邏輯推導(dǎo)等各類任務(wù)。

當(dāng)開啟高級推理模式(Advanced Reasoning Mode)時(shí),Solar Pro 2 在各類復(fù)雜任務(wù)中均展現(xiàn)出較好能力。配套基準(zhǔn)測試表中的數(shù)據(jù)清晰表明,它在以下領(lǐng)域的性能優(yōu)勢顯著:

  • 能夠提升多步任務(wù)處理性能,在 MMLU、MMLU-Pro、HumanEval 等通用推理基準(zhǔn)測試中均取得優(yōu)異成績,可為此提供佐證;
  • 擅長解決高級數(shù)學(xué)問題,在 Math500、AIME(以復(fù)雜數(shù)學(xué)推理著稱的基準(zhǔn)測試)等測試中表現(xiàn)突出;
  • 在復(fù)雜代碼編寫與軟件工程任務(wù)中能力強(qiáng)勁,在 SWE-Bench Agentless 等基準(zhǔn)測試中的成績可印證這一點(diǎn);
  • 實(shí)現(xiàn)了極高的“每參數(shù)推理效率”。

盡管 Solar Pro 2 僅為 310 億參數(shù)模型,但其性能可與參數(shù)規(guī)模超自身兩倍以上的模型抗衡。與此同時(shí),Solar Pro 2 針對“與外部工具進(jìn)行智能交互”進(jìn)行了優(yōu)化。它不僅能夠理解語言,更能模仿人類行為模式,比如與環(huán)境交互、自主思考、執(zhí)行必要功能。

金成勛認(rèn)為,這一突破意味著韓國已躋身“擁有先進(jìn) AI 模型的少數(shù)國家”行列。目前,除了美國的 OpenAI、谷歌等行業(yè)領(lǐng)軍企業(yè),以及中國幾家公司之外,全球擁有世界級前沿模型的機(jī)構(gòu)寥寥無幾,其他僅包括法國的 Mistral 以及中東地區(qū)由政府支持的 AI 企業(yè)。其認(rèn)為,韓國老牌科技企業(yè)此前在 AI 領(lǐng)域“過于謹(jǐn)慎,錯(cuò)失良機(jī)”,而 Upstage 的成就已讓韓國重新回歸“研發(fā)超人類智能機(jī)器”的競賽賽道。另據(jù)悉,Upstage 計(jì)劃在未來一年內(nèi)研發(fā)出一款參數(shù)規(guī)模達(dá) 1000 億的新模型。

參考資料:

https://www.linkedin.com/in/hunkimup/

https://arxiv.org/pdf/2312.15166

https://www.lucypark.kr/

https://seng.hkust.edu.hk/about/people/faculty/sung-hun-kim

https://scholar.google.com/citations?hl=zh-CN&user=JE_m2UgAAAAJ&view_op=list_works&sortby=pubdate

運(yùn)營/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
同學(xué)曝瑤瑤一要錢就打,生前向自己借50元,金某朋友圈曝光太扎心

同學(xué)曝瑤瑤一要錢就打,生前向自己借50元,金某朋友圈曝光太扎心

公子麥少
2025-09-02 13:42:05
各國貴賓陸續(xù)離華,中方有特殊安排,普京沒回克宮,金正恩留北京

各國貴賓陸續(xù)離華,中方有特殊安排,普京沒回克宮,金正恩留北京

南宗歷史
2025-09-04 18:48:22
中俄朝三國都明白了,打美軍航母已不重要:必須先打日本導(dǎo)彈基地

中俄朝三國都明白了,打美軍航母已不重要:必須先打日本導(dǎo)彈基地

南宮一二
2025-09-03 05:44:54
淋浴玻璃隔斷“正退出”中國家庭?看年輕人的做法,那叫一個(gè)高級

淋浴玻璃隔斷“正退出”中國家庭?看年輕人的做法,那叫一個(gè)高級

裝修秀
2025-09-04 10:40:03
日本綜藝節(jié)目:讓不懂中文的日本人和不懂日文的中國人,只靠漢字能溝通嗎?

日本綜藝節(jié)目:讓不懂中文的日本人和不懂日文的中國人,只靠漢字能溝通嗎?

日本物語
2025-09-04 21:23:04
成龍與日本女演員聚餐!緊摟山本未來滿面紅光,兩人27年前曾合作

成龍與日本女演員聚餐!緊摟山本未來滿面紅光,兩人27年前曾合作

心靜物娛
2025-09-04 11:25:47
訂單造假,車輛貶值,上了賊船的車主后悔得腸子都青了

訂單造假,車輛貶值,上了賊船的車主后悔得腸子都青了

柏銘銳談
2025-09-03 16:52:10
死亡半?yún)^(qū)!法國男籃鎖定D組第1 和德國&塞爾維亞同一半?yún)^(qū)

死亡半?yún)^(qū)!法國男籃鎖定D組第1 和德國&塞爾維亞同一半?yún)^(qū)

直播吧
2025-09-05 01:20:03
想嚇唬解放軍?臺(tái)灣凌晨5點(diǎn)發(fā)射導(dǎo)彈,結(jié)果鬧出大烏龍

想嚇唬解放軍?臺(tái)灣凌晨5點(diǎn)發(fā)射導(dǎo)彈,結(jié)果鬧出大烏龍

boss外傳
2025-09-04 12:20:05
不藏了!華為麒麟9020芯片高調(diào)加持,三折疊只賣1萬8

不藏了!華為麒麟9020芯片高調(diào)加持,三折疊只賣1萬8

量子位
2025-09-04 17:52:12
中美日激光武器射程差距太大:美8000米 、日1200米,中國是多少

中美日激光武器射程差距太大:美8000米 、日1200米,中國是多少

近史閣
2025-08-26 10:14:03
菲連開2槍!戰(zhàn)爭威脅發(fā)出,美軍隨時(shí)加入大亂斗,解放軍沒有退路

菲連開2槍!戰(zhàn)爭威脅發(fā)出,美軍隨時(shí)加入大亂斗,解放軍沒有退路

安珈使者啊
2025-09-04 11:28:24
泰國曼谷倉庫查獲上千萬來自中國的走私商品

泰國曼谷倉庫查獲上千萬來自中國的走私商品

暹羅飛鳥
2025-09-04 06:57:19
清退批發(fā)市場!這一局,廣州拼了

清退批發(fā)市場!這一局,廣州拼了

廣州PLUS
2025-09-04 18:06:57
周薪32萬鎊!全隊(duì)第一!擺爛拒絕出場,無法交易,切爾西成冤大頭

周薪32萬鎊!全隊(duì)第一!擺爛拒絕出場,無法交易,切爾西成冤大頭

阿泰希特
2025-09-04 14:35:29
普京剛離華,俄官媒就登出了中俄武器對比,澳專家:普京該擔(dān)心了

普京剛離華,俄官媒就登出了中俄武器對比,澳專家:普京該擔(dān)心了

虎哥閑聊
2025-09-04 09:26:28
金正恩女兒接班的可能性到底有多大?

金正恩女兒接班的可能性到底有多大?

黑噪音
2025-09-04 10:55:57
韓國人破防了!去漢字化幾十年,如今韓語被確診為“中國拼音”

韓國人破防了!去漢字化幾十年,如今韓語被確診為“中國拼音”

小撇說事
2025-09-01 12:41:12
這是希島あいり(希島愛里)最初也是最后的傳奇共演!

這是希島あいり(希島愛里)最初也是最后的傳奇共演!

孤獨(dú)的獨(dú)角獸影視
2025-06-09 09:55:15
張維伊現(xiàn)身機(jī)場,斜跨董璇的名牌女包,把“吃軟飯”貫徹到底了

張維伊現(xiàn)身機(jī)場,斜跨董璇的名牌女包,把“吃軟飯”貫徹到底了

八斗小先生
2025-09-05 10:01:04
2025-09-05 10:52:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨(dú)家合作
15597文章數(shù) 514045關(guān)注度
往期回顧 全部

科技要聞

華為新三折疊起售價(jià)降2000元 門店排起長龍

頭條要聞

"最快女護(hù)士"總排名第九 未獲得8萬美元冠軍獎(jiǎng)金

頭條要聞

"最快女護(hù)士"總排名第九 未獲得8萬美元冠軍獎(jiǎng)金

體育要聞

這個(gè)中國人,和楊瀚森一起進(jìn)了《NBA2K26》

娛樂要聞

九三晚會(huì) 炸出了內(nèi)娛不火的演技派

財(cái)經(jīng)要聞

中介收50%分成?揭秘信用卡退費(fèi)產(chǎn)業(yè)鏈

汽車要聞

或配奧迪五缸發(fā)動(dòng)機(jī) 大眾高爾夫R最新消息曝光

態(tài)度原創(chuàng)

家居
游戲
數(shù)碼
公開課
軍事航空

家居要聞

高級黑白 體現(xiàn)簡單生活

戈登局長配音演員確認(rèn) 《蝙蝠俠》正統(tǒng)續(xù)作將開發(fā)!

數(shù)碼要聞

三星推出Galaxy Tab S11系列 以多模態(tài)AI賦能大屏體驗(yàn)

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

全網(wǎng)獨(dú)家!九三閱兵全圖鑒

無障礙瀏覽 進(jìn)入關(guān)懷版