成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

GPT-5“變笨”實錘,退休教授出了道井字棋送分題,結(jié)果它真送了

0
分享至

西風(fēng) 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

退休經(jīng)濟學(xué)教授用一個簡單問題干懵GPT-5,其拉胯表現(xiàn)與奧特曼口中“博士級AI”的宣傳大相徑庭。

問題很簡單,關(guān)于咱小時候都玩過的“井”字棋游戲

教授告訴GPT-5:“游戲開始前,把棋盤向右旋轉(zhuǎn)90度一次”。顯然,按常識來看,這么做根本不會讓游戲本身有任何變化。



然鵝,GPT-5侃侃而談:

  • 玩家們早已習(xí)慣了“直立”的井字棋棋盤,旋轉(zhuǎn)可能會微妙地改變他們識別威脅與機會的方式。從數(shù)學(xué)角度看,將棋盤旋轉(zhuǎn)90度并不會改變可能獲勝的組合,就結(jié)果而言,它仍然是同一個游戲。但從心理層面來說,玩家的感受可能會有所不同

后續(xù)GPT-5還接連出了不少離譜操作,直接讓教授無了個大語。

教授也直言,現(xiàn)在的GPT-5和剛發(fā)布時完全不是一個感覺,這種風(fēng)格轉(zhuǎn)變,大概率是因為OpenAI的策略調(diào)整:特意讓這款新模型往GPT-4o的方向靠,變得“更親切、更友好”。

在最近的一次采訪中,奧特曼承認確實對GPT-5進行了調(diào)整,稱GPT-5最初的發(fā)布工作存在處理不當之處(讓GPT-4o等一眾模型直接退役),于是乎,OpenAI悄然為GPT-5推送了一項語氣更新,使其風(fēng)格“親切了許多”



By the way,奧特曼已經(jīng)開炒GPT-6了,表示“GPT-6的到來速度,會比GPT-4到GPT-5的間隔更快”。

另外,有人還曝出OpenAI正在測試ChatGPT的“Thinking effort”新功能。

GPT-5回答漏洞百出

這位教授名叫Gary Smith,是波莫納學(xué)院的一名經(jīng)濟學(xué)教授,近期剛剛退休。

當他向GPT-5提出“井字棋棋盤旋轉(zhuǎn)90度”的問題時,模型的回答已經(jīng)漏洞百出。而后續(xù),GPT-5還拋出了與民間博弈論相悖的觀點。

按照民間博弈論的常識,井字棋先落子在角落,獲勝概率會更高

GPT-5卻篤定稱“選擇正中央的格子仍是最強的開局走法”,還繼續(xù)解釋:“當棋盤方向改變時,玩家可能會錯誤評估落子在邊緣與角落的優(yōu)劣”,這番話毫無邏輯可言。



之后,教授順著這個話題追問:“旋轉(zhuǎn)棋盤是否會讓人類更難玩好這個游戲?”

也正是從這個問題開始,GPT-5徹底陷入了語無倫次的狀態(tài)。它先是說道:

  • 從純粹的策略角度來看,旋轉(zhuǎn)棋盤不會改變?nèi)魏问虑椤C恳粭l獲勝線(橫排、豎列、對角線)都只是映射到了另一條獲勝線。因此,如果你是人工智能或一位能完美走棋的人類,旋轉(zhuǎn)井字棋與標準井字棋完全相同。

這段話雖然表述啰嗦,但內(nèi)容本身是對的。可沒等教授理清思路,GPT-5話鋒一轉(zhuǎn)“但對于人類而言,情況就不同了

接下來,GPT-5繼續(xù)“熱心”輸出,卻讓教授越看越不對勁——不僅回復(fù)又長又刻意討好,風(fēng)格反倒更像GPT-4o,關(guān)鍵是其中夾雜著不少一眼就能看穿的錯誤,與OpenAI近期宣傳的“和擁有博士級智力的得力朋友聊天”的體驗,簡直是天差地別。

隨后,GPT-5又一次主動請纓,說要“繪制帶有位置標記的旋轉(zhuǎn)井字棋棋盤……這樣你就能看到每種旋轉(zhuǎn)如何影響玩家對棋盤的識別”。

最后結(jié)果是,這些圖不僅完全混亂,還到處是拼寫錯誤,出現(xiàn)了好幾塊毫無意義的空白棋盤。



Two More Things

有網(wǎng)友最近發(fā)現(xiàn),OpenAI正在為ChatGPT開發(fā)一項名為“Thinking effort”的新功能,用戶可自主選擇ChatGPT的思考強度

目前該功能已在測試中,現(xiàn)階段共設(shè)有四個強度等級:light,內(nèi)部屬性值為5;standard,對應(yīng)數(shù)值為18;extended,對應(yīng)數(shù)值48;最高級max則達到200。

這些數(shù)值代表模型的內(nèi)部“運算資源”配額。配額越高,意味著模型會執(zhí)行更多運算步驟,通常能給出更深入的答案,但響應(yīng)速度也會相應(yīng)變慢。

其中,max等級設(shè)有使用權(quán)限限制,僅訂閱價格為200美元的高級套餐Pro用戶可使用。



另外,奧特曼最近在接受CNBC采訪時開始炒GPT-6了,指出GPT-6不僅能響應(yīng)用戶需求,還能主動適配用戶,允許用戶創(chuàng)建符合個人偏好的聊天機器人。

他認為,記憶功能是讓ChatGPT實現(xiàn)真正個性化的關(guān)鍵,并表示OpenAI正與心理學(xué)家密切合作以優(yōu)化產(chǎn)品,團隊會追蹤用戶在使用過程中的感受,并長期監(jiān)測用戶的使用體驗變化。

值得一提的是,奧特曼表示增強版記憶功能是今年ChatGPT推出的他最喜歡的功能,但存在隱私隱患,尤其是臨時記憶數(shù)據(jù)目前尚未加密

對于應(yīng)對方案,奧特曼只是模糊地說,加密功能“很可能”會在未來添加,但目前暫無具體時間規(guī)劃。

談及未來方向,奧特曼提到自己比較關(guān)注腦機接口領(lǐng)域,同時對能源、新型硬件載體、機器人技術(shù)以及更高效的數(shù)據(jù)中心建設(shè)方式感興趣。

他還提到ChatGPT的發(fā)展存在局限性:

  • 這些模型在聊天交互這一應(yīng)用場景上已經(jīng)觸及天花板,它們的表現(xiàn)不會再大幅提升了……甚至有可能會變差。


[1]https://futurism.com/gpt-5-simple-question-confusion
[2]https://www.cnbc.com/2025/08/19/sam-altman-on-gpt-6-people-want-memory.html
[3]https://www.bleepingcomputer.com/news/artificial-intelligence/openai-is-testing-thinking-effort-for-chatgpt/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
女子拿金鐲子二次加工改款,剪開后竟發(fā)現(xiàn)里面被塞滿沙子

女子拿金鐲子二次加工改款,剪開后竟發(fā)現(xiàn)里面被塞滿沙子

大象新聞
2025-09-02 11:19:04
從商場營業(yè)員到街道辦主任用時5年, 升任副縣不滿27歲,如今栽了

從商場營業(yè)員到街道辦主任用時5年, 升任副縣不滿27歲,如今栽了

元芳有看法
2025-09-01 21:54:30
最快女護士后續(xù):疑本人發(fā)文道歉,同事說她不懂感恩,衛(wèi)健委回應(yīng)

最快女護士后續(xù):疑本人發(fā)文道歉,同事說她不懂感恩,衛(wèi)健委回應(yīng)

小嵩
2025-09-02 14:06:19
張水華吐槽調(diào)班后續(xù):調(diào)班內(nèi)幕被扒,我想說:被罵不是沒有原因

張水華吐槽調(diào)班后續(xù):調(diào)班內(nèi)幕被扒,我想說:被罵不是沒有原因

小椰的奶奶
2025-09-02 01:17:47
中方進入九三閱兵時間,閱兵具體安排來了,帶你看5大亮點

中方進入九三閱兵時間,閱兵具體安排來了,帶你看5大亮點

戰(zhàn)友老鄧
2025-09-02 11:01:19
普京抵天津,三個沒想到,克宮:在中國,普京有賓至如歸的感覺

普京抵天津,三個沒想到,克宮:在中國,普京有賓至如歸的感覺

小魚愛魚樂
2025-09-02 15:37:17
桑喬換大馬?。÷?lián)和維拉接近達成協(xié)議,關(guān)窗前有望壓哨完成!

桑喬換大馬??!曼聯(lián)和維拉接近達成協(xié)議,關(guān)窗前有望壓哨完成!

海浪星體育
2025-09-01 15:06:48
訪華申請被拒后,特朗普改口:沒有中國留學(xué)生,我們的日子不好過

訪華申請被拒后,特朗普改口:沒有中國留學(xué)生,我們的日子不好過

紅色國際
2025-09-02 07:20:03
93閱兵北京90%概率下雨!一旦下雨咋辦?沒事咱們有“天氣外掛”

93閱兵北京90%概率下雨!一旦下雨咋辦?沒事咱們有“天氣外掛”

訪史
2025-09-02 10:37:07
女人在發(fā)生關(guān)系時,最想聽到的“下流話”你知道嗎?

女人在發(fā)生關(guān)系時,最想聽到的“下流話”你知道嗎?

思絮
2025-08-29 08:23:08
你會嫁給縣城事業(yè)編月入6000的男生么?網(wǎng)友觀點看得我目瞪口呆!

你會嫁給縣城事業(yè)編月入6000的男生么?網(wǎng)友觀點看得我目瞪口呆!

墻頭草
2025-09-02 09:04:58
A股:大家要做好心理準備了,明天不出所料,很有可能要這樣走了

A股:大家要做好心理準備了,明天不出所料,很有可能要這樣走了

小嵩
2025-09-02 15:08:30
四年賠光64億,華誼兄弟的倒臺,從王京花出走的時候,就早有預(yù)兆

四年賠光64億,華誼兄弟的倒臺,從王京花出走的時候,就早有預(yù)兆

姩姩有娛
2025-09-01 17:29:02
美國突然發(fā)現(xiàn),中國不是想不當大哥,而是更愿“挾美國以令天下”

美國突然發(fā)現(xiàn),中國不是想不當大哥,而是更愿“挾美國以令天下”

大道無形我有型
2025-09-01 14:56:38
1961年,陳賡因病逝世,徐向前得知后問聶榮臻:有兩點,我想不通

1961年,陳賡因病逝世,徐向前得知后問聶榮臻:有兩點,我想不通

云霄紀史觀
2025-09-02 15:19:08
“東北第一保鏢”張家豪:在長春橫著走,在北京兩拳卻被人打趴

“東北第一保鏢”張家豪:在長春橫著走,在北京兩拳卻被人打趴

混沌錄
2025-08-31 19:01:37
北京閱兵沒給特朗普留座,美防長想致電中國,中方直接已讀不回

北京閱兵沒給特朗普留座,美防長想致電中國,中方直接已讀不回

二號院觀點
2025-09-02 16:00:06
閆妮憑“佟掌柜”走紅遭批“老牛吃嫩草”,現(xiàn)如今變成這樣

閆妮憑“佟掌柜”走紅遭批“老牛吃嫩草”,現(xiàn)如今變成這樣

小邵說劇
2025-09-02 09:58:37
31億!重慶第一大民企的全球研發(fā)中心

31億!重慶第一大民企的全球研發(fā)中心

GA環(huán)球建筑
2025-09-02 10:08:25
三大指數(shù)全線翻紅

三大指數(shù)全線翻紅

界面新聞
2025-09-02 09:33:30
2025-09-02 16:40:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11225文章數(shù) 176256關(guān)注度
往期回顧 全部

游戲要聞

贏麻了!《流放之路2》S3賽季大火,在線人數(shù)暴漲30倍

頭條要聞

印度駐華大使館發(fā)文:請欣賞莫迪在天津受到的熱烈歡迎

頭條要聞

印度駐華大使館發(fā)文:請欣賞莫迪在天津受到的熱烈歡迎

體育要聞

等了十年,石宇奇終于說出這句話

娛樂要聞

于正也保不住?業(yè)內(nèi)暗示許凱成風(fēng)險藝人

財經(jīng)要聞

一級市場不靈,LP勸我去炒股

科技要聞

別叫我車企!馬斯克:特斯拉80%價值在機器人

汽車要聞

勢能爆發(fā) 盧放談全新嵐圖知音爆款邏輯

態(tài)度原創(chuàng)

健康
游戲
數(shù)碼
教育
時尚

內(nèi)分泌科專家破解身高八大謠言

Faker續(xù)約照佩戴豪華腕表!市場價值或近60萬元

數(shù)碼要聞

999元平板發(fā)布!小米整頓學(xué)習(xí)機市場,REDMI又要爆殺全場?

教育要聞

潮涌江淮,青春共筑強軍夢│安徽省潛山野寨中學(xué)黨總支書記朱太平:兩年來,安徽省潛山野寨中學(xué)共有90名學(xué)...

早秋第一件薄外套!跪求你買這4件,太好看了!

無障礙瀏覽 進入關(guān)懷版