機(jī)器之心報(bào)道
編輯:Panda
昨晚,深度求索在用戶群里宣布「DeepSeek 線上模型版本已升級至 V3.1,上下文長度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 標(biāo)示)之后,在 Hugging Face 發(fā)布了一款新模型DeepSeek-V3.1-Base
模型地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
從名字也能看出來,該模型是 DeepSeek-V3 系列最新的基礎(chǔ)模型。至于為什么命名為 V3.1,而不是像之前以前命名為 V3 帶四位日期數(shù)字的形式(如 V3-0324),盡管社區(qū)有諸多猜測,但深度求索官方尚未給出明確說明 —— 和該公司之前的操作一樣,這一次同樣是模型先行,說明和宣傳還在后面。
該模型一發(fā)布就吸引了 AI 社區(qū)的廣泛關(guān)注,短短幾個(gè)小時(shí)就已經(jīng)沖上了 Hugging Face 熱門模型榜第 4 位!
具體技術(shù)指標(biāo)上,DeepSeek-V3.1-Base 與 DeepSeek-V3 差別不大,同樣的參數(shù)量,采用了混合專家(MoE)架構(gòu),擁有 128k 上下文長度。
整體來看,社交網(wǎng)絡(luò)上對深度求索的這次更新看法不一。有人表示非常振奮,認(rèn)為這是深度求索在為接下來的 DeepSeek-V4 和 DeepSeek-R2 做鋪墊,但也有人認(rèn)為這次更新不夠亮眼,沒有達(dá)到該公司之前的一貫水準(zhǔn)。
對此,你怎么看?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.