成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek V3.1 Base突襲上線!擊敗Claude 4編程爆表,全網(wǎng)在蹲R2和V4

0
分享至


新智元報道

編輯:桃子 定慧

【新智元導(dǎo)讀】DeepSeek V3.1新版正式上線,上下文128k,編程實力碾壓Claude 4 Opus,成本低至1美元。

就在昨晚,DeepSeek官方悄然上線了全新的V3.1版本,上下文長度拓展到128k。


本次開源的V3.1模型擁有685B參數(shù),支持多種精度格式,從BF16到FP8。

綜合公開信息和國內(nèi)大咖karminski3的實測,V3.1此次更新亮點有:

  • 編程能力:表現(xiàn)突出,根據(jù)社區(qū)使用Aider測試數(shù)據(jù),V3.1在開源模型中霸榜。

  • 性能突破:V3.1在Aider編程基準(zhǔn)測試中取得71.6%高分,超越Claude Opus 4,同時推理和響應(yīng)速度更快。

  • 原生搜索:新增了原生「search token」的支持,這意味著搜索的支持更好。

  • 架構(gòu)創(chuàng)新:線上模型去除「R1」標(biāo)識,分析稱DeepSeek未來有望采用「混合架構(gòu)」。

  • 成本優(yōu)勢:每次完整編程任務(wù)僅需1.01美元,成本僅為專有系統(tǒng)的六十分之一。

值得一提的是,官方群中強調(diào)拓展至128K上下文,此前V3版本就已經(jīng)支持。


對于這波更新,大家的熱情可謂是相當(dāng)高漲。

即便還未公布模型卡,DeepSeek V3.1就已經(jīng)在Hugging Face的趨勢榜上排到了第四。



DeepSeek粉絲數(shù)已破8萬

看到這里,網(wǎng)友們更期待R2的發(fā)布了!


混合推理,編程擊敗Claude 4

這次最明顯的變化是,DeepSeek在官方APP和網(wǎng)頁端上,把深度思考(R1)中的「R1」去掉了。


同時,與V3-base相比,DeepSeek V3.1新增了四個特殊Token:

  • <|search▁begin|> (id: 128796)

  • <|search▁end|> (id: 128797)

  • (id: 128798)

  • (id: 128799)


對此,有推測認(rèn)為,這可能暗示推理模型與非推理模型的融合。


在編程方面,根據(jù)網(wǎng)友曝出的結(jié)果,DeepSeek V3.1在Aider Polyglot多語言編程測試中拿下了71.6%高分,一舉擊敗了Claude 4 Opus、DeepSeek R1。


而且,它的成本僅1美元,成為非推理模型中的SOTA。


最鮮明的對比,V3.1編程性能比Claude 4高1%,成本要低68倍。


在SVGBench基準(zhǔn)上,V3.1實力僅次于GPT-4.1-mini,遠超DeepSeek R1的實力。


在MMLU多任務(wù)語言理解方面,DeepSeek V3.1毫不遜色于GPT-5。不過在,編程、研究生級基準(zhǔn)問答、軟件工程上,V3.1與之有一定的差距。


一位網(wǎng)友實測,模擬六邊形中小球自由落體的物理測試,DeepSeek V3.1理解力明顯提升。


一手實測

第一時間,我們對V3.1進行了實測,首先是此次模型更新的重點:上下文長度。

假設(shè)對于中文而言,1個token ≈ 1–1.3個漢字,那么這128K tokens ≈ 100,000–160,000漢字。

相當(dāng)于整本《紅樓夢》正文(約80–100萬字)的1/6–1/8,或者一篇超長博士論文/大部頭學(xué)術(shù)專著。

實際測試也很準(zhǔn)確,DeepSeek告訴我們它只能閱讀差不多9%,也就是大約十分之一。


由于總結(jié)內(nèi)容太長,我們截取了前三回,你覺得這個總結(jié)的怎么樣?


在128K上下文測試中,DeepSeek-V3.1輸出速度相比以往獲得較大提升,并且在工程上做了一些優(yōu)化。


此次更新,DeepSeek重點強調(diào)了對上下文的支持。

整個活,給DeepSeek-V3.1上點壓力,讓它根據(jù)「夢」這個字,輸出盡可能多的內(nèi)容,盡量達到上下文極限。


不過最后,差不多只輸出了3000字左右,模型就停止了輸出。


再來看下推理能力。

經(jīng)典的9.11和9.9比大小問題,兩種詢問方式都能正確做答。

這次更新的一大體感還是速度變快了很多。


最后再來看看編程能力。

DeepSeek的上一個模型是R1-0528,主打的是編程能力。

看看這次V3.1是否有更大的提升。


最終結(jié)果只能說,打個80分吧,基本要求都滿足了,但是畫面風(fēng)格和顏色變換功能并沒有完美實現(xiàn)。


并且和R1-0528的結(jié)果相比,兩者之間還是有些差距的,但孰好孰壞還需看個人偏好。

以下是開啟思考模式后的結(jié)果,你覺得哪個更好?


接下來,看看DeepSeek V3.1能否復(fù)刻出GPT-5發(fā)布會上的法語學(xué)習(xí)小程序。

我們再來讓V3.1畫一個自己的SVG自畫像,兩種效果著實有些抽象。




參考資料:HYX

https://weibo.com/2169039837/Q0FC4lmeo

https://x.com/karminski3/status/1957928641884766314

https://github.com/johnbean393/SVGBench/

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
3-2,62歲莫耶斯率隊3連勝,29歲曼城舊將格拉利什助攻梅開二度

3-2,62歲莫耶斯率隊3連勝,29歲曼城舊將格拉利什助攻梅開二度

側(cè)身凌空斬
2025-08-30 23:58:53
65歲大姐雇46歲男保姆,男保姆:雇主對我很好,每天都很開心

65歲大姐雇46歲男保姆,男保姆:雇主對我很好,每天都很開心

惟來
2025-08-29 07:31:06
小孩子的話一定要聽嗎?網(wǎng)友:我的天,我要看哭了嗚嗚嗚

小孩子的話一定要聽嗎?網(wǎng)友:我的天,我要看哭了嗚嗚嗚

解讀熱點事件
2025-08-13 00:10:08
真當(dāng)中方好惹的?趕在中國九三閱兵前,釣魚島一夜生變

真當(dāng)中方好惹的?趕在中國九三閱兵前,釣魚島一夜生變

史海無崖
2025-08-27 09:42:01
惡果和形式主義泛濫,央企暫停干部年輕化?

惡果和形式主義泛濫,央企暫停干部年輕化?

環(huán)球通信
2025-08-30 15:34:29
越南“胡志明大炮”首次亮相,號稱國產(chǎn)最強,因造型蠢萌引發(fā)熱議

越南“胡志明大炮”首次亮相,號稱國產(chǎn)最強,因造型蠢萌引發(fā)熱議

碳基生物關(guān)懷組織
2025-08-27 18:31:01
泰國內(nèi)閣任命普坦為代理總理

泰國內(nèi)閣任命普坦為代理總理

財聯(lián)社
2025-08-30 17:52:17
隨著上海海港客場1:4慘敗成都蓉城,3問主帥穆斯卡特?

隨著上海海港客場1:4慘敗成都蓉城,3問主帥穆斯卡特?

田先生籃球
2025-08-30 21:54:02
中國腦梗發(fā)病率世界第一,醫(yī)生:主要原因已查出,4種蔬菜要少吃

中國腦梗發(fā)病率世界第一,醫(yī)生:主要原因已查出,4種蔬菜要少吃

詩意世界
2025-08-26 13:31:36
00后女孩紋身畫面曝出:女孩全程微笑,沒有痛苦表情,紋身師驚訝

00后女孩紋身畫面曝出:女孩全程微笑,沒有痛苦表情,紋身師驚訝

胡侃社會百態(tài)
2025-08-30 16:50:53
林心如馬爾代夫度假照曝光!網(wǎng)友驚嘆:這身材太驚艷?

林心如馬爾代夫度假照曝光!網(wǎng)友驚嘆:這身材太驚艷?

娛樂領(lǐng)航家
2025-08-29 21:00:03
薩姆納自宣加盟廣東男籃隨后刪除動態(tài),上賽季場均可得36分

薩姆納自宣加盟廣東男籃隨后刪除動態(tài),上賽季場均可得36分

雷速體育
2025-08-31 07:14:18
岡薩雷斯家中出軌女友:用攝像頭看到露骨畫面 還好沒拍臥室

岡薩雷斯家中出軌女友:用攝像頭看到露骨畫面 還好沒拍臥室

直播吧
2025-08-30 12:00:22
年輕時是大帥哥但沒紅,老了靠丑化自己成為一線男星!

年輕時是大帥哥但沒紅,老了靠丑化自己成為一線男星!

下水道男孩
2025-08-30 23:51:00
金正恩赴華方式引熱議:“蒼鷹一號”太舊,韓媒稱可能乘火車出行

金正恩赴華方式引熱議:“蒼鷹一號”太舊,韓媒稱可能乘火車出行

起喜電影
2025-08-31 02:56:03
一個很玄學(xué)的現(xiàn)象:心善能通神,德高可鎮(zhèn)鬼

一個很玄學(xué)的現(xiàn)象:心善能通神,德高可鎮(zhèn)鬼

金沛的國學(xué)筆記
2025-08-29 15:10:50
姆巴佩另類雙響,熊皇一條龍救主!0-1到2-1,皇馬逆轉(zhuǎn)登頂

姆巴佩另類雙響,熊皇一條龍救主!0-1到2-1,皇馬逆轉(zhuǎn)登頂

我的護球最獨特
2025-08-31 05:36:04
看到大家分房睡都沒成功。我就放心了

看到大家分房睡都沒成功。我就放心了

特約前排觀眾
2025-08-31 00:05:08
刺激夜:皇馬2-1,巴黎6-3,羅馬1-0,拜仁3-2,曼聯(lián)3-2,馬競1-1

刺激夜:皇馬2-1,巴黎6-3,羅馬1-0,拜仁3-2,曼聯(lián)3-2,馬競1-1

側(cè)身凌空斬
2025-08-31 05:32:03
蘇有朋道歉

蘇有朋道歉

中國日報
2025-08-30 16:04:59
2025-08-31 08:07:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
13353文章數(shù) 66140關(guān)注度
往期回顧 全部

科技要聞

李斌內(nèi)部講話:蔚來四季度必須盈利

頭條要聞

高校被指強制學(xué)生辦校園電話卡:不辦卡無法開宿舍門

頭條要聞

高校被指強制學(xué)生辦校園電話卡:不辦卡無法開宿舍門

體育要聞

扛著別人的老婆,贏下那該死的冠軍

娛樂要聞

吳京風(fēng)波拉出多位明星

財經(jīng)要聞

美上訴法院裁定特朗普關(guān)稅非法!

汽車要聞

全國靜態(tài)品鑒開啟 方程豹鈦7成都車展首秀

態(tài)度原創(chuàng)

本地
時尚
藝術(shù)
公開課
軍事航空

本地新聞

換個城市過夏天 | 夏末狂歡,浪在阜新黃家溝!

伊姐周六熱推:電視劇《十二封信》;電影《死神來了:血脈詛咒》......

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

以軍繼續(xù)襲擊加沙城

無障礙瀏覽 進入關(guān)懷版