成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

GPT-5之后,奧特曼向左,梁文鋒向右

0
分享至



GPT-5正式發(fā)布,雖然在測試集上登頂,但用戶反饋卻褒貶不一,不少用戶希望能保留GPT-4o。OpenAI希望通過增加模型路由功能,以不同模型,不同算力成本滿足不同用戶需求的目標。

就目前的體驗來看,OpenAI想要的“統(tǒng)一模型”的努力還任重道遠。而GPT-5沒有出現(xiàn)模型能力的顯著突破和技術(shù)范式的更新,OpenAI做的更多是產(chǎn)品化創(chuàng)新——GPT-5是一個幻覺更少,更易用,能幫用戶解決更多具體問題的模型,但是沒有新能力,也沒有徹底解決大模型的某個結(jié)構(gòu)性缺陷。


而近日,有外媒報道DeepSeek正在用國產(chǎn)芯片訓(xùn)練最新的模型,但是新模型的發(fā)布日期依然不定。


GPT-5的發(fā)布似乎表明,大模型能力上限疑似撞墻。在這堵“Transformer能力邊界之墻”面前,OpenAI選擇了將現(xiàn)有能力產(chǎn)品化到極致,將“超級APP”的敘事進行到底。而DeepSeek在追求模型上限的競爭壓力變緩時,正在開啟“自給自足”的支線任務(wù)。

一心要用AGI將人類社會帶入“極度富足”狀態(tài)的OpenAI在做超級APP的路上漸行漸遠,營收和估值一路飆升;而希望探索AI能力上限,搭建開源生態(tài)推進技術(shù)普惠的DeepSeek,需要解的可能是不同的題目。

也許多年后,當人們回顧大模型行業(yè)發(fā)展的時間線時會發(fā)現(xiàn),多條線路相交于DeepSeek R1和GPT-4o發(fā)布,分化于GPT-5之后。

01

性能霸榜卻未達預(yù)期的GPT-5,加速產(chǎn)品化

市場期待的是一次范式轉(zhuǎn)移,一次足以重新定義人機交互的時刻。但最終的結(jié)果,更像是一次常規(guī)的升級。它的模型參數(shù)更多,訓(xùn)練數(shù)據(jù)更廣,在一些基準測試中得分更高,但它在核心的智能層面,并未展現(xiàn)出革命性的進步。紐約大學(xué)名譽教授加里·馬庫斯曾用三個詞來概括GPT-5的表現(xiàn):“姍姍來遲、過度炒作、平庸無奇”。

他的分析指出,GPT-5未能根除大型語言模型固有的缺陷。它仍然會在某些時候編造事實,即所謂的“幻覺”問題。在面對需要多步邏輯推理的任務(wù)時,它仍然會犯錯。在提供現(xiàn)實世界的理解的多模態(tài)性能上,也沒有什么質(zhì)的提升。

這些問題在GPT-4時代就存在,業(yè)界曾希望GPT-5能提供解決方案,但現(xiàn)實是OpenAI選擇了對現(xiàn)有框架進行修補和優(yōu)化。然后在此能力基礎(chǔ)之上提供一個產(chǎn)品化更好,更加易用的模型工具。



如果說核心智能的停滯是技術(shù)專家和深度用戶的感受,那么其在多模態(tài)能力上有限的進步,則讓技術(shù)愛好者感到失望。在GPT-5發(fā)布之前,一個普遍的共識是,下一代人工智能的決勝場將是多模態(tài)。人們想象中的GPT-5應(yīng)該能像人類一樣,無縫地接收、理解和融合處理來自文本、圖像、音頻、視頻等多種渠道的信息。然而,現(xiàn)實中的GPT-5在多模態(tài)交互上的表現(xiàn),更像是一個經(jīng)過優(yōu)化的GPT-4V。它能精準地完成描述性任務(wù),比如識別照片中的物體,但一旦任務(wù)轉(zhuǎn)向理解,它的能力邊界就顯現(xiàn)出來。

作為將Transformer算法能力和語言最早進行結(jié)合,用ChatGPT開創(chuàng)了大模型時代,又將強化學(xué)習(xí)有機地融入大模型的訓(xùn)練過程中,捅破了大模型推理能力天花板的OpenAI,一直以來都是業(yè)界的標桿。但是GPT-5發(fā)布之后,除去性能上的“未達預(yù)期”之外,獲得獲得外界關(guān)注的特性似乎都是產(chǎn)品級別的變化。

OpenAI希望通過“模型路由”功能來讓用戶避免在眾多模型中進行選擇,降低新用戶的使用門檻,同時也能合理化算力分配,使得OpenAI能夠在有限的算力資源下為更多的用戶提供更加高質(zhì)量的服務(wù)。

按照OpenAI的說法,雖然GPT-5大幅降低了模型的幻覺,但是對于一些基礎(chǔ)的數(shù)理問題和對現(xiàn)實世界的理解上,表現(xiàn)難以說得上令人滿意,依然會出現(xiàn)很多明顯的錯誤。相反,可能由于訓(xùn)練數(shù)據(jù)中用了更多的生產(chǎn)力相關(guān)內(nèi)容,在情商上還有很大的退步,引得普通聊天用戶用取關(guān)來威脅GPT-4o的“返場”。

GPT-5表現(xiàn)出OpenAI在大模型能力突破的“躺平”,幾乎間接宣布了“大模型能力墻”已經(jīng)到來,或者至少是大模型技術(shù)突破暫時進入了平緩期。未來模型能力能否重新回到“GPT-3到GPT-4o”這樣的“蒙眼狂奔”的快車道,依賴于研究人員在底層技術(shù)上的突破和創(chuàng)新。

OpenAI前首席科學(xué)家Ilya曾經(jīng)在2023年底的“Why next-token prediction is enough for AGI”訪談中對于AI技術(shù)發(fā)展趨勢的總結(jié)似乎某種程度上預(yù)言了這一刻的到來。



“不同的研究人員和項目會在一個時間段內(nèi)有不同的方向,然后當人們發(fā)現(xiàn)了一個技術(shù)有效之后,研究會向那個方向快速收斂,之后可能又會回歸到之前百花爭鳴的狀態(tài)”

02

梁文鋒能否抓住時機,完成國產(chǎn)大模型的“自給自足”

如果Transformer技術(shù)墻真的已經(jīng)到來,我們對DeepSeek還能有什么合理的期待?縱觀DeepSeek的產(chǎn)品發(fā)布歷史,每一個重量級的發(fā)布,都在它自己的時間線上解決了大模型技術(shù)上某個重要問題。

2024年5月的DeepSeek-V2系列則革命性地處理了長上下文處理的效率問題,首創(chuàng)多頭潛注意力(MLA)機制,支持高達128K token的處理,同時以極低的API定價(每百萬token 2元人民幣)引發(fā)了中國AI巨頭的價格戰(zhàn),顯著提升了大模型的可負擔(dān)性和實際部署潛力。

2024年12月的DeepSeek-V3以671B參數(shù)的MoE架構(gòu)登場,針對推理速度的痛點實現(xiàn)了每秒60token的3倍加速,性能達到GPT-4o的同時保持資源高效,以一己之力幾乎拉平了開源模型和閉源模型性能上的差距。

2025年1月的DeepSeek-R1專注于推理能力的提升,在AIME和MATH任務(wù)上匹敵或超越OpenAI的o1模型,成本遠遠低于當時的所有模型,通過App登頂美國App Store,解決了高端AI的訪問壁壘問題,加速了開源AI的全球普及與民主化。

而在V3和R1讓DeepSeek徹底出圈之后,它似乎也從一家發(fā)源于量化,成名于大模型,變成了一家肩負起了更多使命的科技公司。

根據(jù)外媒報道,DeepSeek目前正在將最先進大模型的訓(xùn)練轉(zhuǎn)移到國產(chǎn)芯片之上。大模型的國產(chǎn)化之路,遠比普通人想象的要困難。但是在不穩(wěn)定的地緣政治等各種因素的影響之下,如果沒有辦法擺脫對英偉達GPU的依賴,所有中國AI公司的頭上,永遠懸掛著一把達摩克里斯之劍。

而此時OpenAI發(fā)布的GPT-5,暗示了以Transformer為核心的大模型技術(shù),發(fā)展曲線暫時變緩。這給了包括DeepSeek在內(nèi)的所有科技公司一個信號——可以在不斷穩(wěn)定提升模型性能的主線任務(wù)之外,放心地點開其他支線了。

而要實現(xiàn)前沿性能大模型從訓(xùn)練到推理的國產(chǎn)化,即便對于一家已經(jīng)將大模型研發(fā)從“原子彈變成茶葉蛋”的頂尖AI公司來說,難度不亞于再研發(fā)一種全新的原子彈。這個過程中需要解決的技術(shù)問題,可能比訓(xùn)練DeepSeek之前發(fā)布的所有模型需要攻克的難題加起來還要多得多。

首先是國產(chǎn)GPU本身性能和英偉達的GPU的單卡性能相比依然還有接近代際的差距。即便是國產(chǎn)GPU已經(jīng)能通過更密集的互聯(lián)技術(shù)將單卡的性能差距盡力彌補。但是要和硅谷大模型采用的英偉達“10萬卡集群”競爭,采用國產(chǎn)GPU訓(xùn)練性能最頂尖的模型,需要面對難以想象的工程難題。


大模型研發(fā)離不開像PyTorch或TensorFlow這樣的開源框架,這些框架原本是為國際主流硬件優(yōu)化的。如果DeepSeek要國產(chǎn)化,就得把整個軟件棧遷移到本土硬件上,這意味著要重寫或修改大量的代碼來兼容本土的計算架構(gòu)。和發(fā)展了多年的成熟主流開源框架和CUDA生態(tài)相比,重構(gòu)的國產(chǎn)軟件棧要在性能和穩(wěn)定性上接近已經(jīng)發(fā)展近10年的主流解決方案,難度也相當大。

但如果DeepSeek能和國產(chǎn)硬件廠商持續(xù)密切配合,像DeepSeek將大模型的研發(fā)一樣,從零開始一步步行至行業(yè)最前沿,才有希望徹底解下頭頂那柄達摩克里斯之劍。

在持續(xù)改進大模型訓(xùn)練和推理效率這個方向上,DeepSeek也依然在持續(xù)探索,取得了令人矚目的成績。

今年7月底,由DeepSeek團隊和北京大學(xué)等機構(gòu)發(fā)表,梁文鋒作為通訊作者的論文《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》獲得ACL 2025最佳論文獎。



https://arxiv.org/abs/2502.11089

這篇論文首次將稀疏注意力從理論推理帶進了完整訓(xùn)練流程,在保持模型性能,提高訓(xùn)練效率的同時,還帶來了高達 11 倍的推理加速。在自然語言處理頂會ACL上獲得最佳論文獎,足以說明業(yè)界對于這項技術(shù)含金量的認可。

愿意將這樣在商業(yè)競爭中起到關(guān)鍵作用的創(chuàng)新公開,也體現(xiàn)了DeepSeek不斷推進大模型技術(shù)普惠的決心和能力。

讓我們拭目以待,融合了更多像“原生稀疏注意力”這樣的DeepSeek新模型將會在能力和效率上帶給業(yè)界多大驚喜,又能將大模型研發(fā)的國產(chǎn)化程度,推動到哪里。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
剛剛,固態(tài)電池闖出獨角獸,拿下300億訂單!

剛剛,固態(tài)電池闖出獨角獸,拿下300億訂單!

飛鯨投研
2025-09-03 09:06:04
洪秀柱抵達北京,在落地的那一刻,做出鄭重表態(tài),民進黨氣急敗壞

洪秀柱抵達北京,在落地的那一刻,做出鄭重表態(tài),民進黨氣急敗壞

藍色海邊
2025-09-02 19:05:20
齊魯銀行行長張華年齡不小已滿59歲 離法定退休年齡只有1年

齊魯銀行行長張華年齡不小已滿59歲 離法定退休年齡只有1年

運營商財經(jīng)網(wǎng)
2025-09-03 11:07:21
全世界都想知道,現(xiàn)如今中國的真實軍事實力究竟有多強?

全世界都想知道,現(xiàn)如今中國的真實軍事實力究竟有多強?

看世界的人
2025-09-02 20:51:01
全網(wǎng)熱議的“小孩喝口水得刷指紋”事件:永遠不要低估人性的惡

全網(wǎng)熱議的“小孩喝口水得刷指紋”事件:永遠不要低估人性的惡

胡一舸南游y
2025-09-02 19:51:57
讓領(lǐng)導(dǎo)先走?以色列徹底改變了戰(zhàn)爭習(xí)慣,自此食肉者得三思而后行

讓領(lǐng)導(dǎo)先走?以色列徹底改變了戰(zhàn)爭習(xí)慣,自此食肉者得三思而后行

尋途
2025-08-22 20:22:00
金平日:與金正日爭權(quán)失敗,駐外30年躲過暗殺,因這件事允許回國

金平日:與金正日爭權(quán)失敗,駐外30年躲過暗殺,因這件事允許回國

阿胡
2025-04-03 13:59:42
汗液是心臟最好的反饋!提醒:汗液出現(xiàn)4個異常,可能是心臟在“報警”!

汗液是心臟最好的反饋!提醒:汗液出現(xiàn)4個異常,可能是心臟在“報警”!

神奇故事
2025-09-02 22:52:49
朝鮮專列抵華,中俄已等候多時,特朗普開始后悔,美方將致電中國

朝鮮專列抵華,中俄已等候多時,特朗普開始后悔,美方將致電中國

吳欣純Deborah
2025-09-02 18:39:04
四川成都一小學(xué)一年級新生36個班級!放學(xué)人都找不到

四川成都一小學(xué)一年級新生36個班級!放學(xué)人都找不到

史行途
2025-09-03 08:01:44
女子“換房游”,三天遭侵犯20次,醫(yī)生:這輩子可能站不起來了

女子“換房游”,三天遭侵犯20次,醫(yī)生:這輩子可能站不起來了

就一點
2025-09-03 17:01:27
律師張紅兵在文革時舉報母親致其被槍決,40年后申請母墓地為文物

律師張紅兵在文革時舉報母親致其被槍決,40年后申請母墓地為文物

深度報
2025-08-29 16:24:32
辛柏青喪妻剛滿100天,離譜的事就發(fā)生了,被撮合娶馬伊琍引爭議

辛柏青喪妻剛滿100天,離譜的事就發(fā)生了,被撮合娶馬伊琍引爭議

檸檬有娛樂
2025-08-26 09:51:07
考辛斯:我真的不明白 為什么歷史前五控衛(wèi)的名單里每次都有保羅

考辛斯:我真的不明白 為什么歷史前五控衛(wèi)的名單里每次都有保羅

直播吧
2025-09-03 07:26:07
43歲郭晶晶活動太圈粉!一身綠西裝春意盎然,戴幾毛錢發(fā)圈好真實

43歲郭晶晶活動太圈粉!一身綠西裝春意盎然,戴幾毛錢發(fā)圈好真實

小喬古裝漢服
2025-09-03 13:59:21
杜特爾特家族收到封口令,除了老杜本人的死活,其他一概不許外傳

杜特爾特家族收到封口令,除了老杜本人的死活,其他一概不許外傳

科普100克克
2025-09-03 17:50:10
反華德媒評論中國閱兵:實力決定一切,西方已經(jīng)無能為力

反華德媒評論中國閱兵:實力決定一切,西方已經(jīng)無能為力

遠山行客
2025-09-03 12:34:28
J-鮑威爾:職業(yè)球員受傷1次可能就完蛋 這種事很多所以要保持謙遜

J-鮑威爾:職業(yè)球員受傷1次可能就完蛋 這種事很多所以要保持謙遜

直播吧
2025-09-03 19:06:07
24小時絕地反轉(zhuǎn),穆里尼奧接手西漢姆能救跌落的鐵錘幫嗎

24小時絕地反轉(zhuǎn),穆里尼奧接手西漢姆能救跌落的鐵錘幫嗎

小明侃文體
2025-09-03 09:15:02
多名院士發(fā)現(xiàn):低密度脂蛋白不超過這個范圍,根本不需要用藥

多名院士發(fā)現(xiàn):低密度脂蛋白不超過這個范圍,根本不需要用藥

牛鍋巴小釩
2025-09-03 18:22:06
2025-09-03 19:52:49
字母榜 incentive-icons
字母榜
讓未來不止于大。
2015文章數(shù) 8012關(guān)注度
往期回顧 全部

科技要聞

8月車市觀察:價格戰(zhàn)退潮,價值感上位

頭條要聞

23歲雙胞胎亮相閱兵裝備方隊 父母:沒找到他們在哪

頭條要聞

23歲雙胞胎亮相閱兵裝備方隊 父母:沒找到他們在哪

體育要聞

東契奇場均31+8+7 2連敗后2連勝帶隊晉級

娛樂要聞

劉尚嫻 最幸運的事 就是嫁給初戀丈夫

財經(jīng)要聞

高盛高管:中國股市仍有上漲空間

汽車要聞

一天一個樣 方程豹鈦3玩轉(zhuǎn)“面部重組”

態(tài)度原創(chuàng)

教育
時尚
家居
本地
旅游

教育要聞

“老娘當年旗袍開叉到肩膀!”上了大學(xué)才知道,原來父母這么生猛

“老頭衫”爆火出圈!今年流行的老錢風(fēng)、運動混搭風(fēng)都離不開它

家居要聞

與光同塵 居于自然空間

本地新聞

換個城市過夏天 | “中式美學(xué)”打開夏日濰坊

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

無障礙瀏覽 進入關(guān)懷版