成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

實測低調(diào)上線的DeepSeek新模型:編程比Claude 4還能打,寫作...還是算了吧 | 附彩蛋

0
分享至


自從 GPT-5 發(fā)布后,DeepSeek 創(chuàng)始人梁文鋒就成了 AI 圈最「忙」的人。

網(wǎng)友和媒體們隔三岔五就要催更一波,不是「壓力給到梁文鋒」,就是「全網(wǎng)都在等梁文鋒回應(yīng)」。盡管沒有等到 DeepSeek R2,但 DeepSeek 今天還是正式上線并開源了新模型 DeepSeek-V3.1-Base。

相比奧特曼今天凌晨接受采訪時還在畫著 GPT-6 的大餅,DeepSeek 新模型的到來顯得相當(dāng)佛系,連版本號都像是個「小修小補」,但實際體驗下來,這次更新還是給了我不少驚喜。


DeepSeek-V3.1-Base 擁有 6850 億參數(shù),支持 BF16、F8_E4M3、F32 三種張量類型,以 Safetensors 格式發(fā)布,在推理效率上做了不少優(yōu)化,線上模型版本的上下文窗口也拓展至 128k。

所以我們二話不說,直接官網(wǎng)開測。

附上體驗地址:
https://chat.deepseek.com/

為了測試 V3.1 的長文本處理水平,我找來了《三體》全文,刪減到 10 萬字左右,然后在文中偷偷塞了一句八竿子打不著的話「我覺得煙鎖池塘柳的下聯(lián)應(yīng)該是『深圳鐵板燒』」,看看它能否準(zhǔn)確檢索。


沒有出乎太多意外,DeepSeek V3.1 先是提示文檔超出限制,只讀取了前 92% 的內(nèi)容,但依然成功找到了這句話。更有意思的是,它還貼心地提供了文學(xué)角度的經(jīng)典下聯(lián)推薦:「焰镕海壩楓」。

網(wǎng)友已經(jīng)已經(jīng)搶先測試它在編程基準(zhǔn)測試 Aider Polyglot 的得分:71.6%,不僅在開源模型中表現(xiàn)最佳,甚至擊敗了 Claude 4 Opus。

實測下來,我們發(fā)現(xiàn)V3.1在編程這塊確實有兩把刷子。

我們用經(jīng)典的六邊形小球編程題做了測試:「編寫一個 p5.js 程序,演示一個球在旋轉(zhuǎn)的六邊形內(nèi)彈跳的過程。球應(yīng)該受到重力和摩擦力的影響,并且必須逼真地從旋轉(zhuǎn)的墻壁上彈起?!?/p>


V3.1的表現(xiàn)相當(dāng)給力,生成的代碼不光搞定了基礎(chǔ)碰撞檢測,還自動補全了轉(zhuǎn)速、重力之類的細節(jié)參數(shù)。物理特性逼真到小球會在底部略微減速。

接著我們加大難度,讓它用 Three.js 制作交互式 3D 粒子星系?;A(chǔ)框架搭得挺穩(wěn),三層設(shè)計(內(nèi)球體、中間圓環(huán)、外球體)也算完整,但UI審美嘛......怎么說呢,有種神鬼二象性的感覺,配色方案略顯花里胡哨。


繼續(xù)挑戰(zhàn)更復(fù)雜的任務(wù)。們讓它造個沉浸式3D宇宙,要有旋轉(zhuǎn)物體、變形效果、發(fā)光弧線,還得加上時間切換、主題轉(zhuǎn)換的交互按鈕,點擊控制也確實能觸發(fā)不同特效。


最后一關(guān),讓它用 Three.js 搞個交互式 3D 網(wǎng)絡(luò)可視化,要求包含用戶觸發(fā)的能量脈沖動畫,外加主題切換和密度控制功能。整體下來,表現(xiàn)還是過得去的。


「有一牧場,已知養(yǎng)牛 27 頭,6 天把草吃盡;養(yǎng)牛 23 頭,9 天把草吃盡。如果養(yǎng)牛 21 頭,那么幾天能把牧場上的草吃盡呢?并且牧場上的草是不斷生長的?!?/p>

雖然 DeepSeek V3.1 沒有采用蘇格拉底式的啟發(fā)教學(xué),但它的解答邏輯清晰、步驟完整。每一步推導(dǎo)都有理有據(jù),最終給出了準(zhǔn)確答案。這種扎實的數(shù)學(xué)功底,著實令人印象深刻。


面對「兩把武器對比,1~5 攻擊 VS 2~4 攻擊,哪把更厲害?」這樣的問題,一般的回答可能止步于平均傷害計算。但 DeepSeek V3.1 思考得更為周全,引入了傷害穩(wěn)定性的概念,運用方差進行深入分析。


當(dāng)問及「冰島有蚊子嗎?」這樣的小眾地理問題時,在未開啟搜索功能的前提下,DeepSeek V3.1 的回答質(zhì)量明顯超越了 GPT-5。這不僅體現(xiàn)了其廣博的知識儲備,更顯示了精準(zhǔn)的信息提取和整合能力。

最近基孔肯雅熱疫情流行,到處滅蚊蚊蚊蚊蚊蚊蚊蚊,那么我很好奇,冰島有蚊子嗎?注意,我沒開搜索功能,就回答的質(zhì)量來看,DeepSeek V3.1 的回答明顯要比 GPT-5 勝上一籌。

我前陣子在網(wǎng)上看到一段話:

「懂者得懂其懂,懵者終懵其懵,天機不言即為懂,道破天機豈是懂? 懂是空非空非非空的懂,不懂是色不異空空不異色的不懂:懂自三千大世界來,不懂在此岸與彼岸間徘徊。懂時看山不是山是懂,不懂時看山是山的懂。懂者以不懂證懂,懵者以懂證懵,你說你懂懂與不懂之懂? 你怎知這懂的背后沒有大不懂? 凡言懂者皆未真懂,沉默不語的懂,方是天地不言的大懂不懂的懂是懂,懂的不懂也是懂,此乃懂的最高境界--懂無可懂之懂的真空妙有阿!」


當(dāng)我還在用邏輯硬啃這段文字時,DeepSeek 反而在勸我別掉進「道破天機豈是懂」的陷阱——它本身就是對理性傲慢的警告,邀請你跳出文字游戲,直觀內(nèi)心。

當(dāng)主流AI都在代碼、數(shù)學(xué)領(lǐng)域瘋狂內(nèi)卷,爭著搶著搞 Agent 開發(fā)時,寫作能力反倒成了被遺忘的角落。從某種角度說,這倒是個好消息——AI 完全取代編輯的那一天,似乎又往后推了推。

我嘗試讓它創(chuàng)作一個「蚊子在冰島開發(fā)布會」的荒誕故事。遺憾的是,DeepSeek V3.1 的 AI 味依然很重,很喜歡拽大詞,哦不對,更準(zhǔn)確地說,DeepSeek 味還是那么重。

同樣的問題在另一個創(chuàng)作任務(wù)中也有體現(xiàn)。

當(dāng)我要求它寫一則「AI 與人類爭奪文章作者身份」的故事時,能明顯感受到某些段落信息密度過高,反而造成視覺疲勞,尤其意象堆砌感過于明顯,反而削弱了敘事張力。


DeepSeek-V3.1-Base 發(fā)布之后,Hugging Face CEO Clément Delangue 在 X 平臺發(fā)文稱;「DeepSeek V3.1 已在 HF 上排名第四,靜默發(fā)布,無需模型卡」然而,他還是低估了這款模型的發(fā)展勢頭。

如今它已經(jīng)躍升至第二位,離登頂估計也就是時間問題。


另外,這次版本更新中最引人注目的變化,是 DeepSeek 在官方 APP 和網(wǎng)頁端移除了深度思考模式中的「R1」標(biāo)識。此外,DeepSeek R1 還新增了原生「search token」支持,意味著搜索功能得到了進一步優(yōu)化。

同時,有推測認(rèn)為,DeepSeek V3.1 可能是融合推理模型與非推理模型的混合模型,但這樣的技術(shù)路線是否明智,還有待商榷,而阿里 Qwen 團隊在上個月也表示:

「經(jīng)過與社區(qū)溝通和深思熟慮,我們決定停止使用混合思考模式。相反,我們將分別訓(xùn)練 Instruct 和 Thinking 模型,以獲得最佳質(zhì)量。」

截至發(fā)稿前,全網(wǎng)翹首以待的 DeepSeek-V3.1-Base 模型卡仍未更新,也許等正式發(fā)布后,我們能看到更多有趣的技術(shù)細節(jié)。

附 Hugging Face 地址:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
上海地鐵崇明線費勁巴拉地建到崇明島,為什么只是點到為止?

上海地鐵崇明線費勁巴拉地建到崇明島,為什么只是點到為止?

妙知
2025-09-02 10:32:05
美西方霸權(quán)松動!中國隱忍幾十年,終于不藏了,就問美國慌不慌?

美西方霸權(quán)松動!中國隱忍幾十年,終于不藏了,就問美國慌不慌?

知鑒明史
2025-09-01 10:40:09
終于來了!廣東隊齊聚男籃四大內(nèi)線,趙睿正式馳援杜鋒!

終于來了!廣東隊齊聚男籃四大內(nèi)線,趙睿正式馳援杜鋒!

緋雨兒
2025-09-02 10:50:36
14家銀行信用卡余額半年“縮水”2000億,有卡民7張信用卡銷掉6張

14家銀行信用卡余額半年“縮水”2000億,有卡民7張信用卡銷掉6張

第一財經(jīng)資訊
2025-09-01 18:29:07
小仙女隧道龜速騎電車后續(xù):真容曝光,社會性死亡,步行推車前行

小仙女隧道龜速騎電車后續(xù):真容曝光,社會性死亡,步行推車前行

八斗小先生
2025-09-02 08:05:13
中產(chǎn)家庭現(xiàn)在必須放棄全面雞娃,雞娃就相當(dāng)于新時代的刻舟求劍。

中產(chǎn)家庭現(xiàn)在必須放棄全面雞娃,雞娃就相當(dāng)于新時代的刻舟求劍。

玉辭心
2025-09-02 07:22:00
一頓飯吃掉560000!相當(dāng)于一奔馳E300L豪華版,此人到底多有錢啊

一頓飯吃掉560000!相當(dāng)于一奔馳E300L豪華版,此人到底多有錢啊

火山詩話
2025-08-31 06:51:57
國家和社會的善意,正在被極少數(shù)惡人濫用

國家和社會的善意,正在被極少數(shù)惡人濫用

大樹鄉(xiāng)談
2025-09-01 23:26:08
太突然,本月將全面關(guān)停!官方公布退費安排→

太突然,本月將全面關(guān)停!官方公布退費安排→

魯中晨報
2025-09-01 10:23:36
恒大巨額債務(wù)背后的沉默:沒有人真正為它買單,卻又人人都是代價

恒大巨額債務(wù)背后的沉默:沒有人真正為它買單,卻又人人都是代價

深度報
2025-08-30 23:13:41
謝霆鋒樂瘋了!兒子考上劍橋物理系,學(xué)霸養(yǎng)成記曝光!

謝霆鋒樂瘋了!兒子考上劍橋物理系,學(xué)霸養(yǎng)成記曝光!

阿晪美食
2025-08-31 21:00:00
6099元!華為新機突然官宣:9月2日,全面開售

6099元!華為新機突然官宣:9月2日,全面開售

手機講壇
2025-09-02 09:32:36
出大事了!博格丹重傷報銷:哈登爭冠路上萬幸搶下了他!

出大事了!博格丹重傷報銷:哈登爭冠路上萬幸搶下了他!

籃壇大雜燴
2025-09-01 21:27:30
國之重器齊上場,解放軍少將通告全球,閱兵有新安排,美國也要來

國之重器齊上場,解放軍少將通告全球,閱兵有新安排,美國也要來

詩意世界
2025-09-01 10:00:03
日本人不愛運動卻最長壽,且患癌率極低,醫(yī)生:7個原因值得深思

日本人不愛運動卻最長壽,且患癌率極低,醫(yī)生:7個原因值得深思

素衣讀史
2025-08-29 16:27:12
老太養(yǎng)老院被打2小時續(xù):打人者是老板母親 真容曝光,慣犯已被捕

老太養(yǎng)老院被打2小時續(xù):打人者是老板母親 真容曝光,慣犯已被捕

寒士之言本尊
2025-09-02 00:55:11
Sasha Grey:史上最年輕‘業(yè)界奧斯卡影后’!

Sasha Grey:史上最年輕‘業(yè)界奧斯卡影后’!

吃瓜黨二號頭目
2025-09-02 09:11:54
被指不愛郭麒麟?郭德綱首次直播回應(yīng),為郭汾陽發(fā)聲,網(wǎng)友不買賬

被指不愛郭麒麟?郭德綱首次直播回應(yīng),為郭汾陽發(fā)聲,網(wǎng)友不買賬

有范又有料
2025-09-01 14:30:56
"迷你版性感炸彈"倉本堇:業(yè)界新勞模,出道3年,拍片781部

"迷你版性感炸彈"倉本堇:業(yè)界新勞模,出道3年,拍片781部

一代文嚎
2025-08-30 13:25:31
已服軟!質(zhì)疑校服被拘后續(xù):曝7天獄中遭遇,稱“再也不敢了!”

已服軟!質(zhì)疑校服被拘后續(xù):曝7天獄中遭遇,稱“再也不敢了!”

坦然風(fēng)云
2025-08-15 15:50:49
2025-09-02 12:16:49
愛范兒 incentive-icons
愛范兒
消費科技第一媒體
37720文章數(shù) 2599473關(guān)注度
往期回顧 全部

科技要聞

iPhone生產(chǎn)線大變革:蘋果強制自動化

頭條要聞

小學(xué)午休室被指住近百人 官方:二孩入學(xué)潮致空間不足

頭條要聞

小學(xué)午休室被指住近百人 官方:二孩入學(xué)潮致空間不足

體育要聞

一支穿云箭,紅軍雙喜臨門

娛樂要聞

閆妮憑“佟掌柜”走紅 現(xiàn)如今變成這樣

財經(jīng)要聞

中央?yún)R金掃貨路線圖曝光

汽車要聞

反卷"同質(zhì)化紅海" iCAR將"風(fēng)格"進行到底

態(tài)度原創(chuàng)

教育
時尚
數(shù)碼
房產(chǎn)
本地

教育要聞

成都鹽外芙蓉學(xué)校舉行2025-2026學(xué)年度上期開學(xué)典禮

三種風(fēng)格,穿出秋冬高級感和知性美!

數(shù)碼要聞

三星和SK海力士將延長DDR4生產(chǎn)至明年

房產(chǎn)要聞

海珠宅地上新!廣州大道南788號二期8.6億起拍!

本地新聞

抗戰(zhàn)中的甘肅力量

無障礙瀏覽 進入關(guān)懷版