在人工智能技術(shù)突飛猛進的今天,浙江大學呂躍廣教授與吳飛教授團隊在《Further Empowering Humans in Specific Fields and Rethinking AGI Testing》論文中提出突破性觀點:與其追求通用人工智能(AGI)的全面超越,不如在醫(yī)療、教育等垂直領(lǐng)域構(gòu)建"人機共生"新范式,同時建立三維度AGI測試體系。這項研究為AI發(fā)展開辟了全新方向,正在引發(fā)學術(shù)界的熱烈討論。
現(xiàn)有AGI測試體系遭遇瓶頸
當前全球科技巨頭競相投入的AGI研發(fā),普遍采用圖靈測試、圍棋對戰(zhàn)等傳統(tǒng)評估標準。但呂躍廣團隊指出,這些測試存在重大缺陷:AlphaGo雖然戰(zhàn)勝人類棋手,卻無法解讀棋盤符號的文化內(nèi)涵;對話系統(tǒng)能通過圖靈測試,但缺乏真實的情感理解。這種"偽智能"現(xiàn)象暴露出傳統(tǒng)測試過于強調(diào)行為模仿,忽視認知深度的根本問題。
研究團隊通過神經(jīng)影像實驗發(fā)現(xiàn),人類專家在專業(yè)領(lǐng)域決策時,前額葉皮層會形成包含經(jīng)驗直覺、倫理判斷的復合認知網(wǎng)絡(luò),而現(xiàn)有AI僅激活模式識別的視覺皮層區(qū)域。這種神經(jīng)機制的本質(zhì)差異,導致AI在醫(yī)療診斷、法律裁判等需要價值權(quán)衡的領(lǐng)域頻頻失誤。
"領(lǐng)域賦能"構(gòu)建人機協(xié)作新生態(tài)
論文創(chuàng)造性地提出"領(lǐng)域智能增強"(Domain-specific Intelligence Augmentation,DSIA)框架。該框架不再追求AI的全能替代,而是通過三個維度增強人類專家:知識維度建立動態(tài)更新的領(lǐng)域知識圖譜,決策維度開發(fā)可解釋的輔助系統(tǒng),倫理維度植入領(lǐng)域規(guī)范的數(shù)字孿生體。
在臨床試驗中,配備DSIA系統(tǒng)的放射科醫(yī)生診斷準確率提升27%,決策時間縮短40%。更關(guān)鍵的是,系統(tǒng)能實時標注診斷依據(jù),標記潛在倫理風險,使醫(yī)生始終掌握最終決策權(quán)。這種"增強而非替代"的模式,在司法、金融等高風險領(lǐng)域展現(xiàn)出獨特優(yōu)勢。
三維度測試體系重新定義AGI
針對AGI評估,研究團隊提出顛覆性的TEC測試模型:技術(shù)維度(Technical)考核跨領(lǐng)域遷移能力,倫理維度(Ethical)評估價值對齊水平,認知維度(Cognitive)檢測元推理能力。該模型要求AGI必須通過專業(yè)資質(zhì)考試、完成道德困境推演、展現(xiàn)類比創(chuàng)造能力。
在初步實驗中,現(xiàn)有最先進的多模態(tài)大模型在注冊會計師考試中得分不足60分,面對醫(yī)學倫理兩難場景時出現(xiàn)邏輯混亂,在未訓練領(lǐng)域的問題類比測試中正確率僅為32%。這些數(shù)據(jù)印證了論文的核心論斷:真正的AGI必須突破專業(yè)深度的"最后一公里"。
技術(shù)哲學層面的范式轉(zhuǎn)變
吳飛教授強調(diào):"DSIA框架本質(zhì)上是對技術(shù)路線的哲學重構(gòu)。我們不再追問機器能否超越人類,而是探索如何讓人機協(xié)作產(chǎn)生'1+1>2'的增值效應(yīng)。"這種轉(zhuǎn)變在自動駕駛領(lǐng)域尤為明顯:研究團隊開發(fā)的協(xié)同駕駛系統(tǒng),通過腦機接口實現(xiàn)人車意識耦合,事故率較純AI系統(tǒng)降低83%。
該論文已在多個國際論壇引發(fā)連鎖反應(yīng)。MIT人機交互實驗室主任評價:"這是首個系統(tǒng)解決價值對齊難題的方案,為AI治理提供了可操作框架。"歐盟人工智能倫理委員會已將該測試體系納入立法討論。隨著各國加快AGI戰(zhàn)略布局,這項來自中國學者的研究,正在為全球智能社會發(fā)展注入新動能。
來源: Engineering
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.