新智元報道
編輯:桃子
【新智元導(dǎo)讀】GPT-5是一個分水嶺,終于學(xué)會了「推理」。聯(lián)創(chuàng)Greg Brockman最新訪談暢談了OpenAI AGI之路,未來AI可以做到邊用邊學(xué),在超臨界模式下推導(dǎo)出N階后果。
「GPT-5,是一個分水嶺」。
昨天,OpenAI聯(lián)創(chuàng)Greg Brockman在Latent Space團隊的專訪中對GPT-5做出了高度的評價。
這一小時的訪談,含金量極高。
從GPT-5 的意義、推理與強化學(xué)習(xí)的轉(zhuǎn)折點,到算力瓶頸、AI工程實踐,再到對未來社會的預(yù)判,Greg Brockman的對話透露了OpenAI最新戰(zhàn)略的思考。
他還表示,「當內(nèi)部訓(xùn)完GPT-4時,我們就知道下一步必須走向推理范式。這不是新想法,而是讓模型變得可靠的唯一途徑」。
以下是,全文訪談的核心亮點:
· GPT-4持續(xù)對話,但不夠可靠;GPT-5開始真正學(xué)會「推理」
· 未來模型不再是「一次訓(xùn)練+無限推理」,而是邊用邊學(xué)
· 超臨界學(xué)習(xí):AI學(xué)到的不止是答案,還能推導(dǎo)出后果鏈
· 使用AI是一門管理學(xué),要當多智能體的經(jīng)理人。
· 唯一稀缺的,是算力
GPT-5,一個分水嶺
談及GPT-5時,Greg強調(diào)這是OpenAI首個「混合模型」,通過路由器在推理模型與非推理模型之間自動切換。
這種模式降低了使用復(fù)雜度,避免用戶糾結(jié)于「該選哪個版本」。
從性能上看,GPT-5 已經(jīng)在數(shù)學(xué)、編程、物理等高智力任務(wù)上表現(xiàn)出質(zhì)變。
對此,Greg將其與前幾代旗艦做了一個鮮明的對比。
GPT-3出世后,所具備的文本能力還很淺,甚至連「排序數(shù)字」這樣的基礎(chǔ)任務(wù)都做不好。
到了GPT-4,其實用性大幅提升,成為廣泛商用的基礎(chǔ),但在真正深度智力上仍有欠缺。
「而GPT-5,則是一個分水嶺」。
GPT-5在極難的領(lǐng)域上,如IMO、IOI國際比賽中,已經(jīng)能寫出與最優(yōu)秀人類相當?shù)淖C明。
這在過去是極大的挑戰(zhàn),而現(xiàn)在我們能用少數(shù)人團隊把它解決掉。
更令人震驚的是,物理學(xué)家已經(jīng)反饋,GPT-5 給出的推理過程,能重現(xiàn)他們花了數(shù)月研究才得出的見解。
這意味著,模型已經(jīng)不再只是「輔助寫作工具」,而是真正的科研合作者。
他還提到,OpenAI在GPT-4之后,做出了一個關(guān)鍵的判斷:
光靠海量預(yù)訓(xùn)練數(shù)據(jù),根本無法讓模型真正可靠。
早期實驗顯示,GPT-4雖能連續(xù)對話,但常?!概芷梗⒉豢煽?。
因此,團隊認定必須讓模型「測試想法——獲得反饋——強化學(xué)習(xí)」,才能縮小與AGI的差距。
Greg解釋道,我們希望語言模型能像當年Dota AI一樣,從隨機初始化的神經(jīng)網(wǎng)絡(luò),最終學(xué)到復(fù)雜、穩(wěn)定的行為。
強化學(xué)習(xí)能把有限的人類任務(wù)設(shè)計,放大出可靠的智能。
這也是GPT-5背后最大的范式轉(zhuǎn)折:從靜態(tài)訓(xùn)練,邁向動態(tài)推理。
超臨界學(xué)習(xí)
人類學(xué)習(xí)有「睡眠回放」,AI也在探索「推理-再訓(xùn)練」的循環(huán)。
OpenAI模型從「離線訓(xùn)練+大量推理」轉(zhuǎn)向了「推理+基于推理數(shù)據(jù)的再訓(xùn)練」,逐步接近人類學(xué)習(xí)的過程。
Greg表示,「我們正在從『一次性訓(xùn)練,無限次推理』的時代,邁向『邊推理邊訓(xùn)練』的新紀元」。
這個過程中,人類只需設(shè)計少量任務(wù),模型通過成千上萬次嘗試即可學(xué)習(xí)到復(fù)雜行為,但算力消耗巨大。
當算力增加10倍、10000倍,模型就會出現(xiàn)「超臨界學(xué)習(xí)」(Supercritical learning)。
它意味著,LLM學(xué)習(xí)不僅是掌握當前任務(wù),還要推導(dǎo)二階、三階效應(yīng)。
展望模型未來新應(yīng)用,Greg在生物研究所的經(jīng)歷讓他相信,DNA就像預(yù)言一樣,可以被神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)。
他表示,對于神經(jīng)網(wǎng)絡(luò)來說,人類語言和生物語言沒有本質(zhì)區(qū)別,我們在DNA建模上已經(jīng)能做到GPT-2的水平。
Greg還提到,自己的妻子患有罕見遺傳病,AI在醫(yī)療上的突破,對于他來說有著更重要的個人意義。
最佳工程實踐,打造Prompt武器庫
有了如此強大模型,開發(fā)者如何將其發(fā)揮出最大的效用?
「若要充分發(fā)揮模型的潛力,確實需要一些特殊的技巧」。
這需要一種近乎偏執(zhí)的韌性,去真正摸清模型能力的邊界與缺陷的輪廓。
為此,Greg提出了最佳工程實踐——
1. 構(gòu)建AI友好型代碼庫:模塊清晰、單元測試完整、文檔詳盡;
2. 拆解任務(wù),讓多個智能體并行完成;
3. 要做「Prompt庫」管理,積累自己的提示武器庫,不斷探索模型的邊界。
不過,這些Prompt往往不是唯一正確答案,而是能讓模型發(fā)揮創(chuàng)造性和多樣性的測試。
訪談中, Greg表示,「我始終模型當作一個開發(fā)團隊,而不是單一的工具」。
它可以遠程異步完成任務(wù),也可以像結(jié)對編程一樣實時協(xié)作。
更重要的是,AI不介意被完全「微觀管理」,而且還可以被無限復(fù)制,這一點是人類開發(fā)者無法做到的。
GPT-5在前端測試上表現(xiàn)突出,但開發(fā)者不能只「過擬合」某些強項場景,要學(xué)會讓AI在不同模塊間切換,形成完整的工作流。
Greg舉了一個例子,自己平時會把非關(guān)鍵任務(wù)外包給模型,降低風(fēng)險,同時還能保持信息流動。
他還豪言,OpenAI正在建造人類史上最龐大的智能機器。相比之下,「阿波羅計劃」這樣的工程都黯然失色。
即便部分工作被自動化,優(yōu)秀工程師依然稀缺。
關(guān)于當前AI研究現(xiàn)狀,Greg指出,不同實驗室并非是同質(zhì)化,而是各自有獨特取向。
OpenAI的重點是——下一個范式的轉(zhuǎn)折,優(yōu)先級包括:推理范式、多模態(tài)、應(yīng)用。
算力,是永恒的瓶頸
下一個未來,算力將成為最炙手可熱的資源。
在OpenAI內(nèi)部,擁有更多計算資源后,研究人員才能開展更大的項目,取得更多的成果。
近來,奧特曼稱,我們內(nèi)部有更強大的模型,但因算力不夠,還拿不出來。
談到AI的極限時,Greg一針見血,「瓶頸永遠是算力」。
如果你能給我們更多的算力,我們就能把它轉(zhuǎn)化為更強的模型。
他還將算力比做一種「能量」,預(yù)訓(xùn)練是將能量轉(zhuǎn)化為潛在的智力(potential energy),而推理則把智力再次釋放為動能(kinetic energy),用于現(xiàn)實世界中的任務(wù)。
為此,OpenAI今年開始打造「星際之門」超級集群,不斷擴張基礎(chǔ)設(shè)施。
在Greg看來,未來社會中的「算力分配」將成為核心議題,甚至比財富更加稀缺。
用他的話來說,「未來唯一肯定會稀缺的資源,是算力」。
Greg相信,隨著算力Scaling,AI推理深度將呈指數(shù)級增長。
2045年:AI生成一切,錢沒用了?
訪談中,當主持人問及,你想要發(fā)送到2045年一張便條會是什么?
Greg Brockman表示,那將會是一個驚人豐饒的世界,AI的進步可能讓我們實現(xiàn)科幻小說中的夢想,甚至邁向多星球文明。
AI的應(yīng)用空間無比廣闊,無論是醫(yī)療、教育還是其他行業(yè),都有無數(shù)「未被采摘的果實」等待探索。
不過,如何構(gòu)建一個公平、高效的社會來分配計算資源,將是未來需要深思的問題。
但他也認真強調(diào):
如果AI能免費生成一切物質(zhì),金錢可能會失去意義;
但算力將成為新的稀缺品,誰能獲得更多算力,就能做更多事。
采訪的最后,Greg回憶起年輕時,常覺得「錯過了時代」。
他表示,「我曾以為等到我準備好時,所有酷炫的問題肯定早被解決完了…結(jié)果證明這想法大錯特錯。問題的數(shù)量會隨時間增長而非減少」。
換句話說,現(xiàn)在依然是進入AI的最佳時機。
參考資料:
https://www.youtube.com/watch?v=35ZWesLrv5A&t=1s
https://x.com/slow_developer/status/1956741490170106288
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.