網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

GPT-5“變笨”實錘，退休教授出了道井字棋送分題，結(jié)果它真送了

2025-09-01 15:54:46　來源: 量子位

北京舉報

分享至

西風(fēng) 發(fā)自凹非寺
量子位 | 公眾號 QbitAI

退休經(jīng)濟學(xué)教授用一個簡單問題干懵GPT-5，其拉胯表現(xiàn)與奧特曼口中“博士級AI”的宣傳大相徑庭。

問題很簡單，關(guān)于咱小時候都玩過的“井”字棋游戲

教授告訴GPT-5：“游戲開始前，把棋盤向右旋轉(zhuǎn)90度一次”。顯然，按常識來看，這么做根本不會讓游戲本身有任何變化。

然鵝，GPT-5侃侃而談：

玩家們早已習(xí)慣了“直立”的井字棋棋盤，旋轉(zhuǎn)可能會微妙地改變他們識別威脅與機會的方式。從數(shù)學(xué)角度看，將棋盤旋轉(zhuǎn)90度并不會改變可能獲勝的組合，就結(jié)果而言，它仍然是同一個游戲。但從心理層面來說，玩家的感受可能會有所不同

后續(xù)GPT-5還接連出了不少離譜操作，直接讓教授無了個大語。

教授也直言，現(xiàn)在的GPT-5和剛發(fā)布時完全不是一個感覺，這種風(fēng)格轉(zhuǎn)變，大概率是因為OpenAI的策略調(diào)整：特意讓這款新模型往GPT-4o的方向靠，變得“更親切、更友好”。

在最近的一次采訪中，奧特曼承認確實對GPT-5進行了調(diào)整，稱GPT-5最初的發(fā)布工作存在處理不當之處（讓GPT-4o等一眾模型直接退役），于是乎，OpenAI悄然為GPT-5推送了一項語氣更新，使其風(fēng)格“親切了許多”

By the way，奧特曼已經(jīng)開炒GPT-6了，表示“GPT-6的到來速度，會比GPT-4到GPT-5的間隔更快”。

另外，有人還曝出OpenAI正在測試ChatGPT的“Thinking effort”新功能。

GPT-5回答漏洞百出

這位教授名叫Gary Smith，是波莫納學(xué)院的一名經(jīng)濟學(xué)教授，近期剛剛退休。

當他向GPT-5提出“井字棋棋盤旋轉(zhuǎn)90度”的問題時，模型的回答已經(jīng)漏洞百出。而后續(xù)，GPT-5還拋出了與民間博弈論相悖的觀點。

按照民間博弈論的常識，井字棋先落子在角落，獲勝概率會更高

GPT-5卻篤定稱“選擇正中央的格子仍是最強的開局走法”，還繼續(xù)解釋：“當棋盤方向改變時，玩家可能會錯誤評估落子在邊緣與角落的優(yōu)劣”，這番話毫無邏輯可言。

之后，教授順著這個話題追問：“旋轉(zhuǎn)棋盤是否會讓人類更難玩好這個游戲？”

也正是從這個問題開始，GPT-5徹底陷入了語無倫次的狀態(tài)。它先是說道：

從純粹的策略角度來看，旋轉(zhuǎn)棋盤不會改變?nèi)魏问虑椤Ｃ恳粭l獲勝線（橫排、豎列、對角線）都只是映射到了另一條獲勝線。因此，如果你是人工智能或一位能完美走棋的人類，旋轉(zhuǎn)井字棋與標準井字棋完全相同。

這段話雖然表述啰嗦，但內(nèi)容本身是對的。可沒等教授理清思路，GPT-5話鋒一轉(zhuǎn)“但對于人類而言，情況就不同了

接下來，GPT-5繼續(xù)“熱心”輸出，卻讓教授越看越不對勁——不僅回復(fù)又長又刻意討好，風(fēng)格反倒更像GPT-4o，關(guān)鍵是其中夾雜著不少一眼就能看穿的錯誤，與OpenAI近期宣傳的“和擁有博士級智力的得力朋友聊天”的體驗，簡直是天差地別。

隨后，GPT-5又一次主動請纓，說要“繪制帶有位置標記的旋轉(zhuǎn)井字棋棋盤……這樣你就能看到每種旋轉(zhuǎn)如何影響玩家對棋盤的識別”。

最后結(jié)果是，這些圖不僅完全混亂，還到處是拼寫錯誤，出現(xiàn)了好幾塊毫無意義的空白棋盤。

Two More Things

有網(wǎng)友最近發(fā)現(xiàn)，OpenAI正在為ChatGPT開發(fā)一項名為“Thinking effort”的新功能，用戶可自主選擇ChatGPT的思考強度

目前該功能已在測試中，現(xiàn)階段共設(shè)有四個強度等級：light，內(nèi)部屬性值為5；standard，對應(yīng)數(shù)值為18；extended，對應(yīng)數(shù)值48；最高級max則達到200。

這些數(shù)值代表模型的內(nèi)部“運算資源”配額。配額越高，意味著模型會執(zhí)行更多運算步驟，通常能給出更深入的答案，但響應(yīng)速度也會相應(yīng)變慢。

其中，max等級設(shè)有使用權(quán)限限制，僅訂閱價格為200美元的高級套餐Pro用戶可使用。

另外，奧特曼最近在接受CNBC采訪時開始炒GPT-6了，指出GPT-6不僅能響應(yīng)用戶需求，還能主動適配用戶，允許用戶創(chuàng)建符合個人偏好的聊天機器人。

他認為，記憶功能是讓ChatGPT實現(xiàn)真正個性化的關(guān)鍵，并表示OpenAI正與心理學(xué)家密切合作以優(yōu)化產(chǎn)品，團隊會追蹤用戶在使用過程中的感受，并長期監(jiān)測用戶的使用體驗變化。

值得一提的是，奧特曼表示增強版記憶功能是今年ChatGPT推出的他最喜歡的功能，但存在隱私隱患，尤其是臨時記憶數(shù)據(jù)目前尚未加密

對于應(yīng)對方案，奧特曼只是模糊地說，加密功能“很可能”會在未來添加，但目前暫無具體時間規(guī)劃。

談及未來方向，奧特曼提到自己比較關(guān)注腦機接口領(lǐng)域，同時對能源、新型硬件載體、機器人技術(shù)以及更高效的數(shù)據(jù)中心建設(shè)方式感興趣。

他還提到ChatGPT的發(fā)展存在局限性：

這些模型在聊天交互這一應(yīng)用場景上已經(jīng)觸及天花板，它們的表現(xiàn)不會再大幅提升了……甚至有可能會變差。

[1]https://futurism.com/gpt-5-simple-question-confusion
[2]https://www.cnbc.com/2025/08/19/sam-altman-on-gpt-6-people-want-memory.html
[3]https://www.bleepingcomputer.com/news/artificial-intelligence/openai-is-testing-thinking-effort-for-chatgpt/

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.