從編寫復(fù)雜程序到扮演博士級專家,ChatGPT-5 的發(fā)布伴隨著大膽的承諾和強大的演示。
山姆·阿爾特曼 (Sam Altman)、格雷格·布羅克曼 (Greg Brockman)、塞巴斯蒂安·布貝克 (Sebastien Bubeck)、馬克·陳 (Mark Chen) 等 OpenAI 核心研究人員在 GPT-5 的直播發(fā)布活動中亮相,展示了該模型的先進能力和實際應(yīng)用。
山姆·阿爾特曼在直播開場時稱 GPT-5 為一種“按需超級能力”,強調(diào)新模型讓人感覺像是在“與一位名副其實的專家對話”,這位專家能在多個領(lǐng)域提供博士級技能的協(xié)助。
阿爾特曼表示,GPT-5 能夠從零開始編寫完整的計算機程序,將按需軟件生成定位為其最強大的能力之一。
統(tǒng)一系統(tǒng),更智能的決策
GPT-5 引入了一個多層系統(tǒng):一個快速響應(yīng)的基礎(chǔ)模型、一個深度推理引擎(GPT-5 思考模式)和一個實時路由器,該路由器根據(jù)用戶請求的復(fù)雜性決定使用哪個版本。
如果用戶說類似“仔細(xì)思考這個問題”的話,系統(tǒng)會將提示路由到推理模型。
一旦達(dá)到使用限制,輕量級版本會接管,確保連續(xù)性。OpenAI 計劃在未來的版本中將這些層級合并為一個無縫的單一模型。
超越基準(zhǔn)測試,注重實用價值
盡管 GPT-5 在基準(zhǔn)測試中表現(xiàn)出色,但真正使其脫穎而出的是其實際應(yīng)用價值。
OpenAI 表示,該模型在三個核心 ChatGPT 應(yīng)用場景中取得了重大進展:
- 寫作:生成更具連貫性、靈活性且目標(biāo)導(dǎo)向的回應(yīng)。
- 編程:在前端設(shè)計、響應(yīng)式布局和大規(guī)模調(diào)試方面表現(xiàn)大幅提升。
- 健康:對健康、醫(yī)療和癥狀相關(guān)查詢的回應(yīng)有所改進(附有適當(dāng)免責(zé)聲明)。
更優(yōu)設(shè)計,更佳代碼
OpenAI 稱 GPT-5 是其迄今為止最強大的編程模型,在前端生成、審美感知和大規(guī)模調(diào)試方面實現(xiàn)了重大改進。
該模型現(xiàn)在可以通過單個提示生成響應(yīng)式網(wǎng)站、應(yīng)用程序和游戲,將抽象概念轉(zhuǎn)化為具有驚人設(shè)計美感的工作產(chǎn)品。
據(jù) OpenAI 稱,早期測試者贊揚了 GPT-5 在視覺布局理解上的提升,特別是在間距、排版和留白方面的選擇。
除了其創(chuàng)意靈活性,該模型在調(diào)試復(fù)雜代碼庫方面也表現(xiàn)更佳,使其成為開發(fā)人員在處理大型代碼庫時更可靠的合作伙伴。
這些進步標(biāo)志著人工智能在軟件開發(fā)生命周期中輔助方式的顯著轉(zhuǎn)變,它不再僅僅是一個編程助手,更是一個有能力的設(shè)計協(xié)作者。
提升事實準(zhǔn)確性
OpenAI 表示,GPT-5 在回答現(xiàn)實世界問題時比其前代模型準(zhǔn)確得多。在啟用匿名生產(chǎn)提示的網(wǎng)頁搜索功能時,發(fā)現(xiàn) GPT-5 出現(xiàn)“幻覺”(編造信息)的可能性比 GPT-4o 降低了約 45%。
當(dāng)使用其深度推理模式“GPT-5 思考模式”時,事實性錯誤率相比 OpenAI o3 模型降低了約 80%。
為了進一步測試模型,OpenAI 使用 LongFact 和 FActScore 等公共基準(zhǔn),在開放式、尋求事實的提示上評估了 GPT-5。
結(jié)果顯示,GPT-5 思考模式產(chǎn)生的“幻覺”比 o3 模型少約六倍,使其成為迄今為止在生成長篇事實性內(nèi)容方面最可靠的模型之一。
AI 開發(fā)的最大挑戰(zhàn)之一是誠實處理那些不可能、定義不清或缺少關(guān)鍵上下文的任務(wù)。OpenAI 表示 GPT-5 在這方面也實現(xiàn)了飛躍。
例如,在 CharXiv 多模態(tài)基準(zhǔn)測試中移除所有圖像后,OpenAI o3 模型仍有 86.7% 的情況下給出了自信(但虛假)的答案。
相比之下,GPT-5 僅在 9% 的情況下如此,表明它更清楚自身的局限性,更少偽裝知道答案。
更智能的安全保障
GPT-5 還帶來了更先進的安全框架。之前的模型主要依賴拒絕訓(xùn)練,即要么回答問題要么拒絕請求。
但 GPT-5 現(xiàn)在能更有效地處理模糊或具有雙重用途的提示。這意味著它可以在病毒學(xué)或化學(xué)等領(lǐng)域提供高層次的安全回應(yīng),而不會提供可能被濫用的詳細(xì)指導(dǎo)。
OpenAI 表示,這一轉(zhuǎn)變對于在不過度限制模型的前提下提升細(xì)致入微的安全性至關(guān)重要。
四種全新預(yù)設(shè)個性
OpenAI 推出了四種新的 ChatGPT 個性的研究預(yù)覽版 —— 憤世嫉俗者 (Cynic)、機器人 (Robot)、傾聽者 (Listener) 和 極客 (Nerd)。
這些模式讓用戶無需編寫詳細(xì)提示即可自定義聊天機器人的語氣和互動風(fēng)格。
無論您偏好干練的分析性語氣,還是更溫暖、更具同理心的風(fēng)格,新的個性都能相應(yīng)調(diào)整。
這一功能得益于 GPT-5 增強的可引導(dǎo)性和改進的指令遵循能力。OpenAI 表示,所有四種個性均符合其內(nèi)部關(guān)于降低諂媚性和增強一致性的基準(zhǔn)。
ChatGPT-5 是免費的嗎?
是的,GPT-5 對所有 ChatGPT 用戶開放,但采用基于使用量的訪問權(quán)限。免費用戶可以在一定限制內(nèi)使用 GPT-5,而 ChatGPT Plus 訂閱用戶獲得更多使用量,專業(yè)版 (Pro) 訂閱用戶則可解鎖 GPT-5 Pro,該版本包含針對更復(fù)雜或技術(shù)性問題的深度推理能力。
如何使用 GPT-5?
GPT-5 現(xiàn)在是所有登錄 ChatGPT 用戶的默認(rèn)模型,取代了 GPT-4o、GPT-4.1、GPT-4.5、OpenAI o3 和 o4-mini。
要使用它,只需打開 ChatGPT 并提問即可。根據(jù)您的輸入,GPT-5 會決定是立即響應(yīng)還是應(yīng)用深度推理。
付費用戶還可以從模型選擇器中手動選擇“GPT-5 思考模式”,或通過“仔細(xì)思考這個問題”等短語來觸發(fā)該模式。
總結(jié)
通過 GPT-5,OpenAI 在提升 AI 的能力、準(zhǔn)確性和可定制性方面邁出了一大步。從專家級編程和推理能力,到更安全的回應(yīng)和可個性化定制的角色,該模型為日常 AI 應(yīng)用樹立了新標(biāo)準(zhǔn)。
如果朋友們喜歡,敬請關(guān)注“知新了了”!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.