西風(fēng) 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
退休經(jīng)濟學(xué)教授用一個簡單問題干懵GPT-5,其拉胯表現(xiàn)與奧特曼口中“博士級AI”的宣傳大相徑庭。
問題很簡單,關(guān)于咱小時候都玩過的“井”字棋游戲
教授告訴GPT-5:“游戲開始前,把棋盤向右旋轉(zhuǎn)90度一次”。顯然,按常識來看,這么做根本不會讓游戲本身有任何變化。
然鵝,GPT-5侃侃而談:
- 玩家們早已習(xí)慣了“直立”的井字棋棋盤,旋轉(zhuǎn)可能會微妙地改變他們識別威脅與機會的方式。從數(shù)學(xué)角度看,將棋盤旋轉(zhuǎn)90度并不會改變可能獲勝的組合,就結(jié)果而言,它仍然是同一個游戲。但從心理層面來說,玩家的感受可能會有所不同
后續(xù)GPT-5還接連出了不少離譜操作,直接讓教授無了個大語。
教授也直言,現(xiàn)在的GPT-5和剛發(fā)布時完全不是一個感覺,這種風(fēng)格轉(zhuǎn)變,大概率是因為OpenAI的策略調(diào)整:特意讓這款新模型往GPT-4o的方向靠,變得“更親切、更友好”。
在最近的一次采訪中,奧特曼承認確實對GPT-5進行了調(diào)整,稱GPT-5最初的發(fā)布工作存在處理不當之處(讓GPT-4o等一眾模型直接退役),于是乎,OpenAI悄然為GPT-5推送了一項語氣更新,使其風(fēng)格“親切了許多”
By the way,奧特曼已經(jīng)開炒GPT-6了,表示“GPT-6的到來速度,會比GPT-4到GPT-5的間隔更快”。
另外,有人還曝出OpenAI正在測試ChatGPT的“Thinking effort”新功能。
GPT-5回答漏洞百出
這位教授名叫Gary Smith,是波莫納學(xué)院的一名經(jīng)濟學(xué)教授,近期剛剛退休。
當他向GPT-5提出“井字棋棋盤旋轉(zhuǎn)90度”的問題時,模型的回答已經(jīng)漏洞百出。而后續(xù),GPT-5還拋出了與民間博弈論相悖的觀點。
按照民間博弈論的常識,井字棋先落子在角落,獲勝概率會更高
GPT-5卻篤定稱“選擇正中央的格子仍是最強的開局走法”,還繼續(xù)解釋:“當棋盤方向改變時,玩家可能會錯誤評估落子在邊緣與角落的優(yōu)劣”,這番話毫無邏輯可言。
之后,教授順著這個話題追問:“旋轉(zhuǎn)棋盤是否會讓人類更難玩好這個游戲?”
也正是從這個問題開始,GPT-5徹底陷入了語無倫次的狀態(tài)。它先是說道:
- 從純粹的策略角度來看,旋轉(zhuǎn)棋盤不會改變?nèi)魏问虑椤C恳粭l獲勝線(橫排、豎列、對角線)都只是映射到了另一條獲勝線。因此,如果你是人工智能或一位能完美走棋的人類,旋轉(zhuǎn)井字棋與標準井字棋完全相同。
這段話雖然表述啰嗦,但內(nèi)容本身是對的。可沒等教授理清思路,GPT-5話鋒一轉(zhuǎn)“但對于人類而言,情況就不同了
接下來,GPT-5繼續(xù)“熱心”輸出,卻讓教授越看越不對勁——不僅回復(fù)又長又刻意討好,風(fēng)格反倒更像GPT-4o,關(guān)鍵是其中夾雜著不少一眼就能看穿的錯誤,與OpenAI近期宣傳的“和擁有博士級智力的得力朋友聊天”的體驗,簡直是天差地別。
隨后,GPT-5又一次主動請纓,說要“繪制帶有位置標記的旋轉(zhuǎn)井字棋棋盤……這樣你就能看到每種旋轉(zhuǎn)如何影響玩家對棋盤的識別”。
最后結(jié)果是,這些圖不僅完全混亂,還到處是拼寫錯誤,出現(xiàn)了好幾塊毫無意義的空白棋盤。
Two More Things
有網(wǎng)友最近發(fā)現(xiàn),OpenAI正在為ChatGPT開發(fā)一項名為“Thinking effort”的新功能,用戶可自主選擇ChatGPT的思考強度
目前該功能已在測試中,現(xiàn)階段共設(shè)有四個強度等級:light,內(nèi)部屬性值為5;standard,對應(yīng)數(shù)值為18;extended,對應(yīng)數(shù)值48;最高級max則達到200。
這些數(shù)值代表模型的內(nèi)部“運算資源”配額。配額越高,意味著模型會執(zhí)行更多運算步驟,通常能給出更深入的答案,但響應(yīng)速度也會相應(yīng)變慢。
其中,max等級設(shè)有使用權(quán)限限制,僅訂閱價格為200美元的高級套餐Pro用戶可使用。
另外,奧特曼最近在接受CNBC采訪時開始炒GPT-6了,指出GPT-6不僅能響應(yīng)用戶需求,還能主動適配用戶,允許用戶創(chuàng)建符合個人偏好的聊天機器人。
他認為,記憶功能是讓ChatGPT實現(xiàn)真正個性化的關(guān)鍵,并表示OpenAI正與心理學(xué)家密切合作以優(yōu)化產(chǎn)品,團隊會追蹤用戶在使用過程中的感受,并長期監(jiān)測用戶的使用體驗變化。
值得一提的是,奧特曼表示增強版記憶功能是今年ChatGPT推出的他最喜歡的功能,但存在隱私隱患,尤其是臨時記憶數(shù)據(jù)目前尚未加密
對于應(yīng)對方案,奧特曼只是模糊地說,加密功能“很可能”會在未來添加,但目前暫無具體時間規(guī)劃。
談及未來方向,奧特曼提到自己比較關(guān)注腦機接口領(lǐng)域,同時對能源、新型硬件載體、機器人技術(shù)以及更高效的數(shù)據(jù)中心建設(shè)方式感興趣。
他還提到ChatGPT的發(fā)展存在局限性:
- 這些模型在聊天交互這一應(yīng)用場景上已經(jīng)觸及天花板,它們的表現(xiàn)不會再大幅提升了……甚至有可能會變差。
[1]https://futurism.com/gpt-5-simple-question-confusion
[2]https://www.cnbc.com/2025/08/19/sam-altman-on-gpt-6-people-want-memory.html
[3]https://www.bleepingcomputer.com/news/artificial-intelligence/openai-is-testing-thinking-effort-for-chatgpt/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.