成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

DeepSeek-V3.1震撼發(fā)布,全球開(kāi)源編程登頂!R1/V3首度合體,訓(xùn)練量暴增10倍

0
分享至


新智元報(bào)道

編輯:桃子

【新智元導(dǎo)讀】DeepSeek-V3.1官宣了,作為首款「混合推理」模型,將開(kāi)啟智能體新時(shí)代。新模型共有671B參數(shù),編碼實(shí)力碾壓DeepSeek-R1、Claude 4 Opus,登頂編程開(kāi)源第一。

官宣了!

剛剛,DeepSeek正式上線DeepSeek-V3.1,這是邁向智能體時(shí)代第一步。

新版V3.1采用了「混合推理」,一個(gè)模型,兩種模型:思考與非思考(自主切換)。


相較于DeepSeek-R1-0528 ,DeepSeek-V3.1-Think推理速度更快。

最關(guān)鍵的是,V3.1具備了強(qiáng)大的智能體能力,不論是工具使用,還是多步驟任務(wù),全部拿捏。

在軟件工程基準(zhǔn)測(cè)試中,DeepSeek-V3.1全方位碾壓V3-0324和R1-0528。


在人類的最后考試HLE中,V3.1拿下了29.8高分,另外在數(shù)學(xué)、知識(shí)問(wèn)答、編程等任務(wù)中,全面超越推理模型R1。


CoT壓縮訓(xùn)練后,V3.1-Think在輸出token減少了20%-50%,與R1-0528打成平手

在Hugging Face上,一共開(kāi)源了兩款V3.1 Base和V3.1,前者在V3基礎(chǔ)上又進(jìn)行了8400億token的持續(xù)預(yù)訓(xùn)練,擴(kuò)展了上下文支持。


項(xiàng)目地址:

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

https://huggingface.co/deepseek-ai/DeepSeek-V3.1

總的來(lái)說(shuō),DeepSeek-V3.1此次更新的最大亮點(diǎn):

  • 參數(shù)共671B,激活參數(shù)37B,上下文128k

  • 混合推理模式:一個(gè)模型,即可同時(shí)支持推理模式和非推理模式。

  • 更智能的工具調(diào)用能力:工具使用、智能體任務(wù)有了顯著提升,多步推理能力強(qiáng)化,復(fù)雜搜索不在話下

  • 更高的推理效率:回答質(zhì)量上與DeepSeek-R1-0528相媲美,思考效率飆升,反應(yīng)快如閃電

  • 全面基準(zhǔn)測(cè)試:實(shí)力全面碾壓DeepSeek-R1-0528、DeepSeek-V3-0324

在API方面,deepseek-chat是非思考模式,deepseek-reasoner是思考模式,全部支持128k。


從9月5日開(kāi)始,采用新的API定價(jià)

繼OpenAI gpt-oss之后,DeepSeek終于做出了最強(qiáng)回應(yīng)。


V3.1編程擊敗Claude 4,訓(xùn)練擴(kuò)增10倍

HF模型卡中,給出了DeepSeek新模型技術(shù)的詳細(xì)解讀。

基于DeepSeek-V3.1-Base,DeepSeek-V3.1通過(guò)后訓(xùn)練優(yōu)化完成。而V3.1-Base又是基于V3模型訓(xùn)練而來(lái)。


具體來(lái)說(shuō),它通過(guò)「兩階段長(zhǎng)上下文擴(kuò)展策略」構(gòu)建,遵循了原始V3論文中的方法。

研究團(tuán)隊(duì)又?jǐn)U展了數(shù)據(jù)集,收集了更多長(zhǎng)文檔,并大幅延長(zhǎng)了兩個(gè)訓(xùn)練階段的規(guī)模。

32k擴(kuò)展階段增加了10倍,達(dá)6300億Token,而128k擴(kuò)展階段增加了3.3倍,達(dá)到2090億Token。


此外,DeepSeek-V3.1采用UE8M0 FP8縮放數(shù)據(jù)格式進(jìn)行訓(xùn)練,確保與微尺度數(shù)據(jù)格式的兼容性。

在通用能力的基準(zhǔn)測(cè)試中,開(kāi)啟思考模式V3.1,在MMLU、GPQA上拿下了亮眼的成績(jī)。


數(shù)學(xué)方面,V3.1同樣刷新SOTA,創(chuàng)下了最高分。


如上文所述,V3.1是邁向智能體時(shí)代第一步。它可以支持多種Code Agent框架,開(kāi)發(fā)者可以自己搭建智能體。

在編碼測(cè)試中,DeepSeek-V3.1-Thinking在Aider編碼測(cè)試中,拿下了76.3%高分,遠(yuǎn)超Claude 4 Opus、Gemini 2.5 Pro(0325)。


在編碼智能體測(cè)試中,DeepSeek-V3.1-Non Thinking性能碾壓R1、V3。


此外,DeepSeek-V3.1可以支持Search Agent,在推理模式下可以使用。

當(dāng)需要訪問(wèn)外部信息或最新信息的復(fù)雜問(wèn)題,V3.1可以通過(guò)多輪工具調(diào)用流程,利用用戶提供的搜索工具來(lái)完成。

基準(zhǔn)測(cè)試中,尤其是BrowseComp上,V3.1實(shí)力粉碎了R1。


第三方Artificial Analysis基準(zhǔn),同樣驗(yàn)證了DeepSeek-V3.1強(qiáng)大實(shí)力,僅次于gpt-oss。


在推理效率方面,V3.1也與OpenAI相當(dāng)。


如今來(lái)看,DeepSeek-V3.1穩(wěn)坐編程開(kāi)源第一王座。


參考資料:

https://x.com/karminski3/status/1958429843558945015

https://x.com/deepseek_ai/status/1958417062008918312


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
街頭無(wú)規(guī)則限制,散打高手打得過(guò)身經(jīng)百戰(zhàn)的地痞流氓嗎?網(wǎng)友解密

街頭無(wú)規(guī)則限制,散打高手打得過(guò)身經(jīng)百戰(zhàn)的地痞流氓嗎?網(wǎng)友解密

帶你感受人間冷暖
2025-08-30 00:20:05
林心如馬爾代夫度假照曝光!網(wǎng)友驚嘆:這身材太驚艷?

林心如馬爾代夫度假照曝光!網(wǎng)友驚嘆:這身材太驚艷?

娛樂(lè)領(lǐng)航家
2025-08-29 21:00:03
格力揭秘:千元空調(diào)的真相,我差點(diǎn)被小米的“技術(shù)逆襲”所騙

格力揭秘:千元空調(diào)的真相,我差點(diǎn)被小米的“技術(shù)逆襲”所騙

輝哥說(shuō)動(dòng)漫
2025-08-29 09:24:34
爆冷!英超豪強(qiáng)倒下:主場(chǎng)淪陷,連勝被終結(jié),9億歐豪陣也沒(méi)用

爆冷!英超豪強(qiáng)倒下:主場(chǎng)淪陷,連勝被終結(jié),9億歐豪陣也沒(méi)用

足球狗說(shuō)
2025-08-30 23:57:26
梁山好漢中,這9人決不可交,現(xiàn)實(shí)遇上要躲開(kāi),第九人公認(rèn)最可恨

梁山好漢中,這9人決不可交,現(xiàn)實(shí)遇上要躲開(kāi),第九人公認(rèn)最可恨

耳東文史
2025-08-29 00:02:27
他倆準(zhǔn)備離婚!女方已四結(jié)三離

他倆準(zhǔn)備離婚!女方已四結(jié)三離

FM93浙江交通之聲
2025-08-30 12:40:58
賴清德最后通牒,不許馬英九、洪秀柱參加93閱兵,國(guó)臺(tái)辦8字定調(diào)

賴清德最后通牒,不許馬英九、洪秀柱參加93閱兵,國(guó)臺(tái)辦8字定調(diào)

現(xiàn)代小青青慕慕
2025-08-30 21:53:20
中國(guó)工程鬧“烏龍”?本想沙漠種糧保產(chǎn)量,陰差陽(yáng)錯(cuò)解決世界難題

中國(guó)工程鬧“烏龍”?本想沙漠種糧保產(chǎn)量,陰差陽(yáng)錯(cuò)解決世界難題

禾寒?dāng)?/span>
2025-08-19 11:10:26
就在今天!8月31日02:36!中央5套CCTV5、CCTV5+直播節(jié)目表

就在今天!8月31日02:36!中央5套CCTV5、CCTV5+直播節(jié)目表

皮皮觀天下
2025-08-31 11:15:40
確認(rèn)了!是主持人尼格買(mǎi)提!

確認(rèn)了!是主持人尼格買(mǎi)提!

魯中晨報(bào)
2025-08-30 20:52:28
1983年南陽(yáng)慘?。旱弥龃蛩赖那嗄晟矸莺?,局長(zhǎng)槍殺女婿后自盡

1983年南陽(yáng)慘?。旱弥龃蛩赖那嗄晟矸莺螅珠L(zhǎng)槍殺女婿后自盡

八哥講故事
2024-01-16 00:11:39
新一代輕型護(hù)衛(wèi)艦,2000噸級(jí),替換056A型,到底有多強(qiáng)悍?

新一代輕型護(hù)衛(wèi)艦,2000噸級(jí),替換056A型,到底有多強(qiáng)悍?

萬(wàn)里繁華
2025-08-31 11:09:29
金正恩還沒(méi)抵華,9國(guó)高層拒參閱兵,中方送出一句話,信號(hào)不簡(jiǎn)單

金正恩還沒(méi)抵華,9國(guó)高層拒參閱兵,中方送出一句話,信號(hào)不簡(jiǎn)單

通文知史
2025-08-30 12:35:03
朱國(guó)華被槍斃后,康克清震怒:你們出了問(wèn)題,都是在折騰你們爺爺

朱國(guó)華被槍斃后,康克清震怒:你們出了問(wèn)題,都是在折騰你們爺爺

浩舞默畫(huà)
2025-08-26 03:10:03
中俄印三巨頭到齊,俄羅斯想了27年的事,普京在中國(guó)能否實(shí)現(xiàn)?

中俄印三巨頭到齊,俄羅斯想了27年的事,普京在中國(guó)能否實(shí)現(xiàn)?

通文知史
2025-08-30 13:55:02
醫(yī)生告誡:一旦確診頸動(dòng)脈斑塊,4種食物必須戒掉,避免斑塊增大

醫(yī)生告誡:一旦確診頸動(dòng)脈斑塊,4種食物必須戒掉,避免斑塊增大

健身狂人
2025-08-30 13:58:56
果然,李嘉誠(chéng)反擊了

果然,李嘉誠(chéng)反擊了

妮妮玩不夠
2025-05-28 12:22:04
匠妹 Sabrina Carpenter 打臉整個(gè)樂(lè)評(píng)圈!

匠妹 Sabrina Carpenter 打臉整個(gè)樂(lè)評(píng)圈!

下水道男孩
2025-08-30 23:55:40
新兵被開(kāi)除軍籍,問(wèn)連長(zhǎng)知道他爺爺是誰(shuí)嗎,連長(zhǎng)譏笑:誰(shuí)都沒(méi)用

新兵被開(kāi)除軍籍,問(wèn)連長(zhǎng)知道他爺爺是誰(shuí)嗎,連長(zhǎng)譏笑:誰(shuí)都沒(méi)用

第四思維
2025-08-25 22:11:33
都到了北京邊上了,卻不參加93閱兵,莫迪和埃爾多安在擔(dān)心什么?

都到了北京邊上了,卻不參加93閱兵,莫迪和埃爾多安在擔(dān)心什么?

頭條爆料007
2025-08-30 13:00:12
2025-08-31 15:15:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
13357文章數(shù) 66140關(guān)注度
往期回顧 全部

科技要聞

入手iPhone 16還是等17??jī)煽钍謾C(jī)全面對(duì)比

頭條要聞

老板開(kāi)免費(fèi)青旅稱自己承擔(dān)房租和水電 已接待4000多人

頭條要聞

老板開(kāi)免費(fèi)青旅稱自己承擔(dān)房租和水電 已接待4000多人

體育要聞

遼籃官宣:4冠功勛李曉旭續(xù)約迎第21季 新賽季變球員兼教練

娛樂(lè)要聞

韓磊起訴后,女方公開(kāi)道歉

財(cái)經(jīng)要聞

罕見(jiàn)熱鬧的8月之后,A股將迎怎樣的9月

汽車要聞

家庭泛越野 大狗PLUS預(yù)售煥新11.28萬(wàn)起

態(tài)度原創(chuàng)

家居
親子
旅游
本地
公開(kāi)課

家居要聞

提升功能 靈活居住環(huán)境

親子要聞

深度科普:人類卵子體積是精子的千萬(wàn)倍,還會(huì)主動(dòng)選擇心儀的精子

旅游要聞

熱聞|清明假期將至,熱門(mén)目的地有哪些?

本地新聞

換個(gè)城市過(guò)夏天 | 夏末狂歡,浪在阜新黃家溝!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版