成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

全球開源大模型,前十五名全是中國(guó)的

0
分享至




機(jī)器之心報(bào)道

機(jī)器之心編輯部

國(guó)產(chǎn)開源力量的集中爆發(fā)。

都在說國(guó)內(nèi)大模型正在馳騁開源領(lǐng)域,具體的情況如何?

近日,隨著新一代大語言模型(LLM)的一波更新,開源大模型再次成為了熱門討論話題。軟件工程師、自媒體 Rohan Paul 發(fā)現(xiàn)了一個(gè)驚人的現(xiàn)象:Design Arena 排行榜上排名前十幾位開源 AI 模型全部來自中國(guó)。



Design Arena 是目前全球最大規(guī)模的眾包 AI 生成設(shè)計(jì) Benchmark 平臺(tái),它的核心機(jī)制是讓真實(shí)的人類用戶進(jìn)行評(píng)測(cè),基于 Elo Rating(類似于國(guó)際象棋評(píng)分體系)等級(jí)分制度進(jìn)行模型對(duì)戰(zhàn)。

用戶在平臺(tái)上會(huì)被隨機(jī)展示兩段由不同模型生成的回答,然后進(jìn)行投票選擇「哪一個(gè)更好」。每一次投票都會(huì)影響對(duì)應(yīng)模型的 Elo 分?jǐn)?shù),進(jìn)而形成動(dòng)態(tài)的排行榜。Elo 核心原理是,高分選手擊敗低分選手,得分會(huì)很少,而低分選手爆冷戰(zhàn)勝高分選手時(shí),得分會(huì)很多。因此用對(duì)弈的角度來看的話,這是一個(gè)相對(duì)公平、符合認(rèn)知的評(píng)分系統(tǒng)。

因此,不同于 MMLU、SWE-Bench 這類客觀指標(biāo),Design Arena 更貼近于「用戶真實(shí)體驗(yàn)」。新模型一上線,就能迅速通過對(duì)戰(zhàn)獲得口碑分?jǐn)?shù)。

在 Design Arena 上,如果把條件設(shè)定為「開源」,可見現(xiàn)在的前 15 名是清一色的國(guó)產(chǎn)開源大模型:



排名第一的是 DeepSeek-R1-0528,智譜的 GLM-4.5 和阿里的 Qwen 3 Coder 480B 緊隨其后。

再往下我們能看到 DeepSeek、Qwen、GLM 的各種型號(hào),Kimi 在 7 月份開源的 K2 模型…… 一直到第 16 名才是 OpenAI 最近開源的 GPT OSS 120B。



在前 15 名中,各家大模型廠商上榜的模型數(shù)量依次如下:

  • 阿里:6 款
  • DeepSeek:5 款
  • 智譜:3 款
  • Kimi:1 款

最近一段時(shí)間,國(guó)內(nèi) AI 公司不斷發(fā)布新一代開源大模型,正在開拓 AI 技術(shù)的前沿。甚至對(duì)于國(guó)內(nèi)科技公司來說,開源已經(jīng)成為了最近一兩個(gè)月發(fā)布的主旋律。

在 Hugging Face 發(fā)布的中國(guó) AI 社區(qū) 7 月開放成果中,包括阿里、智譜、昆侖萬維、月之暗面、騰訊、階躍星辰等在內(nèi)的多家廠商先后開源了 33 款大模型。



此前還有機(jī)構(gòu) Interconnects(深度聚焦前沿 AI 研究的高質(zhì)量?jī)?nèi)容平臺(tái))匯總了國(guó)內(nèi)頂尖的 19 家開源模型實(shí)驗(yàn)室,包括 DeepSeek 這樣的頂級(jí)機(jī)構(gòu),以及一些通過技術(shù)報(bào)告和小眾模型嶄露頭角的新興學(xué)術(shù)實(shí)驗(yàn)室。



這 19 個(gè)開源玩家依次是:DeepSeek、Qwen、Moonshot AI (Kimi)、Zhipu / Z.AI、StepFun、Tencent (Hunyuan)、RedNote (Xiaohongshu)、MiniMax、OpenGVLab / InternLM、Skywork、ByteDance Seed、OpenBMB、Xiaomi (MiMo)、Baidu (ERNIE)、Multimodal Art Projection、Alibaba International Digital Commerce Group、BAAI 以及 inclusionAI、Pangu (Huawei)。

在大模型領(lǐng)域里,技術(shù)和性能領(lǐng)先的一直是以 GPT 系列為代表的閉源大模型。但隨著 Llama 系列興起,越來越多的開源模型逐漸成為了推動(dòng)技術(shù)向前進(jìn)步的重要?jiǎng)恿?。近一年多時(shí)間里,國(guó)產(chǎn)大模型集群式的崛起,則重塑了全球 AI 版圖。

現(xiàn)在說起開源的大模型,大多數(shù)人的第一反應(yīng)早已不是 Llama,而是 Qwen 和 DeepSeek。有人認(rèn)為,正是 DeepSeek 等開源大模型能夠與閉源頂尖模型分庭抗禮,才讓眾多應(yīng)用端公司得以轉(zhuǎn)變工作重點(diǎn),把精力放在模型調(diào)優(yōu)和應(yīng)用優(yōu)化的工作上來,進(jìn)而加速了 AI 技術(shù)的落地。

或許這樣的趨勢(shì)也會(huì)扭轉(zhuǎn) AI 研究社區(qū)的趨勢(shì),讓未來最先進(jìn)模型的開源成為必選項(xiàng)。

最后,在外網(wǎng)也有人在為中國(guó)的 AI 模型崛起尋找深層原因。這位 Illya Gerasymchuk 是數(shù)學(xué)專業(yè)的碩士,他認(rèn)為原因在于數(shù)學(xué)基礎(chǔ) —— 目前東亞人在數(shù)學(xué)領(lǐng)域上已經(jīng)占據(jù)了主導(dǎo)地位。



這是否和我們一直以來的印象已經(jīng)有些不一樣了?

https://www.designarena.ai/

https://x.com/rohanpaul_ai/status/1959710355208499692

https://x.com/interconnectsai/status/1957105950201950715

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
90歲鐘南山院士佩戴“共和國(guó)勛章”觀禮閱兵,曾撰文稱“在我不到兩歲的時(shí)候,日本飛機(jī)把我家房子炸塌,我被埋在土里”

90歲鐘南山院士佩戴“共和國(guó)勛章”觀禮閱兵,曾撰文稱“在我不到兩歲的時(shí)候,日本飛機(jī)把我家房子炸塌,我被埋在土里”

極目新聞
2025-09-03 10:52:14
號(hào)角已吹響,27國(guó)統(tǒng)一戰(zhàn)線,德外長(zhǎng)叫陣中國(guó),解放軍大批軍機(jī)起飛

號(hào)角已吹響,27國(guó)統(tǒng)一戰(zhàn)線,德外長(zhǎng)叫陣中國(guó),解放軍大批軍機(jī)起飛

boss外傳
2025-09-03 01:00:03
美媒分析東風(fēng)-61,說了半天也搞不清楚:至少確定有這么個(gè)東西

美媒分析東風(fēng)-61,說了半天也搞不清楚:至少確定有這么個(gè)東西

頭條爆料007
2025-09-03 22:01:10
底層人難以看清的社會(huì)真相

底層人難以看清的社會(huì)真相

深藍(lán)夜讀
2025-09-01 22:06:24
閱兵現(xiàn)場(chǎng)特殊一幕:1945 檢閱車立麥空無一人,真相讓人肅然起敬

閱兵現(xiàn)場(chǎng)特殊一幕:1945 檢閱車立麥空無一人,真相讓人肅然起敬

瘋狂薯?xiàng)l
2025-09-03 16:22:52
中國(guó)舉行九三盛大閱兵,外國(guó)媒體和網(wǎng)友密集關(guān)注

中國(guó)舉行九三盛大閱兵,外國(guó)媒體和網(wǎng)友密集關(guān)注

環(huán)球網(wǎng)資訊
2025-09-03 14:55:24
“??招l(wèi)士”王偉遺孀在京觀看閱兵:他今天會(huì)跟著我一塊仰望天空

“??招l(wèi)士”王偉遺孀在京觀看閱兵:他今天會(huì)跟著我一塊仰望天空

極目新聞
2025-09-03 21:25:45
莫言:成年人的交往,既談錢又談性,女的不太矜持,男的不太摳

莫言:成年人的交往,既談錢又談性,女的不太矜持,男的不太摳

清風(fēng)拂心
2025-09-01 11:15:03
“漿果兒”事件回顧:200名女主角,拍攝17部視頻,內(nèi)容不堪入目

“漿果兒”事件回顧:200名女主角,拍攝17部視頻,內(nèi)容不堪入目

就一點(diǎn)
2025-09-01 14:01:24
一句“滾出湖北”,新華社撕掉武大遮羞布!是誰在袒護(hù)楊景媛?

一句“滾出湖北”,新華社撕掉武大遮羞布!是誰在袒護(hù)楊景媛?

熱點(diǎn)菌本君
2025-09-03 14:18:21
九三閱兵現(xiàn)場(chǎng):霍震霆哽咽發(fā)言,奧運(yùn)天團(tuán)姚明搶眼,雷軍排隊(duì)好乖

九三閱兵現(xiàn)場(chǎng):霍震霆哽咽發(fā)言,奧運(yùn)天團(tuán)姚明搶眼,雷軍排隊(duì)好乖

花心電影
2025-09-03 17:07:49
100坦克有多離譜??jī)?nèi)行人解讀被戲稱為“雙離譜”的100坦克

100坦克有多離譜??jī)?nèi)行人解讀被戲稱為“雙離譜”的100坦克

金戈鐵馬入夢(mèng)來
2025-09-03 17:37:52
9.3閱兵展示的新裝備,超出了世界的認(rèn)知

9.3閱兵展示的新裝備,超出了世界的認(rèn)知

楓冷慕詩
2025-09-03 10:53:34
我有一種預(yù)感,勝利日閱兵將成為大轉(zhuǎn)折時(shí)刻的標(biāo)志性記憶

我有一種預(yù)感,勝利日閱兵將成為大轉(zhuǎn)折時(shí)刻的標(biāo)志性記憶

阿爾法34號(hào)
2025-09-03 11:35:59
出席紀(jì)念抗戰(zhàn)勝利80周年大會(huì)的老領(lǐng)導(dǎo)們

出席紀(jì)念抗戰(zhàn)勝利80周年大會(huì)的老領(lǐng)導(dǎo)們

微微熱評(píng)
2025-09-03 09:57:59
中國(guó)U23 2-1東帝汶U(xiǎn)23,拜合拉木、王鈺棟建功,向余望屢失良機(jī)

中國(guó)U23 2-1東帝汶U(xiǎn)23,拜合拉木、王鈺棟建功,向余望屢失良機(jī)

懂球帝
2025-09-03 21:35:11
訪華目的達(dá)到了,在中方的主場(chǎng)上,金正恩送出了第一份“大禮”

訪華目的達(dá)到了,在中方的主場(chǎng)上,金正恩送出了第一份“大禮”

薦史
2025-09-03 18:19:25
李谷一不再沉默,揭曉宋祖英“消失”的真相,觀眾:原來是這樣

李谷一不再沉默,揭曉宋祖英“消失”的真相,觀眾:原來是這樣

查爾菲的筆記
2025-09-02 16:01:14
央視曝光奪命“毒衣服”,致癌物超標(biāo)20多倍,對(duì)人體危害有多大?

央視曝光奪命“毒衣服”,致癌物超標(biāo)20多倍,對(duì)人體危害有多大?

泠泠說史
2025-09-02 15:01:25
九三盛大閱兵!霍啟剛姚明意外同框,鄭欽文太興奮,馬龍低調(diào)

九三盛大閱兵!霍啟剛姚明意外同框,鄭欽文太興奮,馬龍低調(diào)

180視角
2025-09-03 12:47:44
2025-09-04 02:40:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11224文章數(shù) 142439關(guān)注度
往期回顧 全部

科技要聞

疑似理想i9諜照首曝!尾部或采用全新造型

頭條要聞

普京和金正恩北京長(zhǎng)談兩個(gè)半小時(shí)

頭條要聞

普京和金正恩北京長(zhǎng)談兩個(gè)半小時(shí)

體育要聞

排面!德國(guó)大使館盛贊樊振東:世界級(jí)巨星

娛樂要聞

劉尚嫻 最幸運(yùn)的事 就是嫁給初戀丈夫

財(cái)經(jīng)要聞

A股,2015與2025

汽車要聞

一天一個(gè)樣 方程豹鈦3玩轉(zhuǎn)“面部重組”

態(tài)度原創(chuàng)

數(shù)碼
教育
健康
家居
公開課

數(shù)碼要聞

Beats Solo 4 推出紅寶石色 JENNIE 特別版

教育要聞

今年會(huì)重新火爆的幾所英國(guó)大學(xué)!

內(nèi)分泌科專家破解身高八大謠言

家居要聞

與光同塵 居于自然空間

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版