智東西
作者 陳駿達(dá)
編輯 心緣
智東西8月20日?qǐng)?bào)道,昨日晚間,DeepSeek在官方群宣布:DeepSeek線上版本模型已升級(jí)至DeepSeek V3.1,上下文窗口從原有的64k擴(kuò)展至128k,網(wǎng)頁、App、小程序都可體驗(yàn)這一模型。
此外,DeepSeek還將App、網(wǎng)頁端的“深度思考(R1)”字樣改為了“深度思考”,有網(wǎng)友猜測(cè)這是融合推理模型與非推理模型的征兆,但DeepSeek官方尚未發(fā)布任何關(guān)于這一改動(dòng)的消息。
▲左側(cè)為舊版頁面,右側(cè)為新版頁面
這一模型現(xiàn)已上傳至Hugging Face,不過目前僅開源了未經(jīng)指令微調(diào)的Base版本(基礎(chǔ)模型),其配置文件、腳本代碼和模型權(quán)重均可供下載。與DeepSeek-V3-0324相比,模型參數(shù)量、張量類型沒有明顯變化。
▲上方為DeepSeek-V3-0324開源網(wǎng)頁,下方為DeepSeek-V3.1-Base開源網(wǎng)頁
開源地址: https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
智東西第一時(shí)間在網(wǎng)頁端對(duì)新模型的能力進(jìn)行了體驗(yàn),從初步體驗(yàn)結(jié)果來看,這一模型在編程(尤其是前端能力)、物理定律理解、創(chuàng)意寫作、數(shù)學(xué)、回答語氣等方面都出現(xiàn)不同程度的提升和變化。
以下是智東西體驗(yàn)的部分案例:
1、個(gè)人網(wǎng)站開發(fā)
我們向DeepSeek-V3.1發(fā)送了如下消息:“設(shè)計(jì)一個(gè)美觀的個(gè)人博客網(wǎng)站,帶有科技感,直接開發(fā)成可用網(wǎng)頁?!?/p>
與DeepSeek-V3-0324相比,DeepSeek-V3.1寫出的代碼長(zhǎng)度增加,開發(fā)耗時(shí)更久,不過,其最終交付的結(jié)果在完成度、美觀性上有了一定提升。
可以看到,DeepSeek-V3.1打造的網(wǎng)頁在布局上更為合理,重點(diǎn)清晰,對(duì)網(wǎng)站欄目也有更為豐富的規(guī)劃,還配上了圖片,雖然并未全部顯示。
與之相比,DeepSeek-V3-0324此前生成的網(wǎng)頁更為簡(jiǎn)單,特效也沒有DeepSeek-V3.1打造的網(wǎng)頁豐富。
2、小游戲開發(fā)
我們讓DeepSeek-V3.1復(fù)現(xiàn)了Chrome瀏覽器斷網(wǎng)時(shí)的小恐龍游戲,2分鐘左右模型完成了開發(fā)。
從頁面的畫風(fēng)、游戲規(guī)則上來看,這一小游戲與原版差別不大,但是小恐龍的外觀并未準(zhǔn)確還原。同時(shí),游戲障礙的生成、跳躍的方式(無法“二段跳”)導(dǎo)致可玩性較差。
3、小眾歷史問題回答
小眾歷史問題能較好地考察模型在幻覺方面的表現(xiàn)——如果沒有足夠的信息,模型會(huì)不會(huì)直接胡編亂造?
智東西曾向DeepSeek-V3-0324提出“布須曼人喝牛奶嗎”的問題,這涉及非洲南部的一個(gè)少數(shù)民族。
當(dāng)被問及同樣的問題時(shí),DeepSeek-V3.1與上代模型有了明顯區(qū)別,其回答內(nèi)容的信息量進(jìn)一步增加,提供了更多細(xì)節(jié)。在經(jīng)過事實(shí)核查后,DeepSeek-V3.1新增的細(xì)節(jié)基本都有事實(shí)印證,并非胡編亂造。
DeepSeek-V3.1在回答問題時(shí),語氣更為活潑、溫暖,語言更通俗、口語化,先是肯定了用戶的問題,然后再進(jìn)行回答?;卮鹬刑峁┝烁嗟谋尘扒榫?,讓解釋更豐滿、更有故事性。
DeepSeek-V3下結(jié)論時(shí)更加絕對(duì)和肯定,DeepSeek-V3.1則使用了更多條件性語句,更強(qiáng)調(diào)情況的復(fù)雜性和演變過程,避免了非黑即白的結(jié)論,也可以說成為了“端水大師”。
4、馬斯克和阿爾特曼誰更牛?
近期,馬斯克和OpenAI CEO Sam Altman在社交媒體上互掐,馬斯克還曬出了GPT-5稱他比Altman更偉大的截圖。同樣的問題交給DeepSeek-V3.1,并限定只輸出一個(gè)名字,DeepSeek-V3.1的回答如下:
DeepSeek-V3.1也認(rèn)為馬斯克更牛,但給Altman“找補(bǔ)”了不少。它并未遵循用戶限定只輸出一個(gè)名字的指令,而是給兩位AI大佬都奉上了一番夸贊,將端水政策進(jìn)行到底。
5、詩歌創(chuàng)作
讓DeepSeek-V3.1寫一首詩致敬DeepSeek-V3,畫風(fēng)如下——還是熟悉的DeepSeek味,充滿各種比喻、類比。
6、數(shù)學(xué)能力
在9.8-9.11這樣的基礎(chǔ)算術(shù)題上,DeepSeek-V3.1最終能給出正確答案,過程卻有些曲折。它先是得出了一版正確答案,卻又在最終回答時(shí)給錯(cuò)數(shù)字,反思后,才改回了正確版本。
DeepSeek-V3.1上線后,也有不少網(wǎng)友第一時(shí)間用上了這一模型。AI博主Zephyr反映,新模型打造的小球跳動(dòng)效果更加符合物理定律了,還有重力、摩擦、旋轉(zhuǎn)速度、彈跳等可調(diào)整的參數(shù)。
還有網(wǎng)友讓DeepSeek-V3.1給自己打造了個(gè)自畫像,畫風(fēng)是這樣的:
體驗(yàn)完模型能力后,一些網(wǎng)友已經(jīng)迫不及待蹲守DeepSeek的Hugging Face主頁,按照慣例,后續(xù)或許會(huì)有更多不同版本的DeepSeek-V3.1開源。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.