在自然語言處理和多模態(tài)理解領域,盡管大模型已展現(xiàn)出卓越的性能,但需要了解的是,這些模型僅是實現(xiàn)真正智能代理的基礎構建模塊。智能代理的本質(zhì)遠非單純的語言模型擴展,而是一個集環(huán)境感知、決策制定與行動執(zhí)行為一體的復雜系統(tǒng)。
為實現(xiàn)動態(tài)環(huán)境中的自主性與適應性,這類代理需要整合多維度能力,包括但不限于認知處理、記憶存儲、情感模擬、目標設定以及獎勵機制處理等核心功能。這一系統(tǒng)性的能力需求,促使研究者們轉(zhuǎn)向更具生物啟發(fā)性的設計思路。
在近期的一項研究中,加拿大蒙特利爾大學 &Mila 魁北克 AI 研究所副教授劉邦與來自全球 20 多個研究機構的近 50 名研究人員合作,將智能代理的設計與大腦的神經(jīng)科學原理結(jié)合,通過系統(tǒng)研究提出了一個名為 Foundation Agents 的全新框架,涵蓋基礎智能體架構、組件、進化、多智能體社會和 AI 安全。
該框架強調(diào)了模塊化設計的重要性,將代理的功能分解為多個相互關聯(lián)的模塊,如感知、認知、行動、記憶和情感等子系統(tǒng)。這種基于神經(jīng)科學原理的模塊化設計范式,不僅顯著提升了智能代理的任務處理能力,更重要的是為構建下一代具備通用人工智能潛力的系統(tǒng)奠定了可擴展的理論基礎。
劉邦對 DeepTech 表示:“人腦作為目前已知的唯一通用智能載體,其運作機制為人工智能發(fā)展提供了至關重要的參照。通過解析大腦在信息處理、決策形成和行為執(zhí)行等方面的核心特征,不僅能準確評估當前 AI 技術的發(fā)展階段,更能獲得關鍵性的設計啟示。
圖丨劉邦(來源:劉邦)
相關論文以《基礎代理的進展與挑戰(zhàn):從大腦啟發(fā)的智能到進化、協(xié)作和安全系統(tǒng)》(Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborative, and Safe Systems)為題發(fā)表在預印本網(wǎng)站arXiv[1],并于近期更新了第二版,全文共 396 頁。
劉邦是第一作者兼通訊作者,MetaGPT 的 CEO 吳承霖(項目 Co-leader)、美國杜克大學裴健教授、香港科技大學楊強教授、美國斯坦福大學齊曉亮教授擔任共同通訊作者, 以及來自 MetaGPT、蒙特利爾大學 & MILA 研究所、新加坡南洋理工大學、美國阿拉貢國家實驗室,澳大利亞悉尼大學、美國賓州州立大學、微軟亞研院、美國伊利諾伊大學香檳分校、香港科技大學的多位主要貢獻作者。
圖丨相關論文(來源:arXiv)
人腦的功能分區(qū)為智能代理的模塊化設計提供了重要的理論參照。研究表明,智能代理的模塊化架構是實現(xiàn)復雜任務的關鍵所在,而通過將感知、認知和行動等核心模塊與人腦的功能分區(qū)相對應,可顯著提升代理的適應性和性能表現(xiàn)。
具體而言,這種類比研究具有雙重意義:一方面,通過分析人腦的功能特性和模塊化運作機制,能夠揭示當前 AI 研究中的潛在不足或缺失環(huán)節(jié);另一方面,探索不同能力模塊如何協(xié)同運作以構建高效系統(tǒng),有助于智能代理借鑒人腦在持續(xù)學習、快速適應新任務等方面的優(yōu)勢,從而優(yōu)化其學習效率和適應性。
表丨人腦與大模型智能體的簡明高階對比(來源:arXiv)
情感模塊是智能代理設計中的重要突破。由于情感在人類決策中發(fā)揮著重要的作用,因此將情感融入智能代理的設計中,可以使其行為更符合人類的直覺和價值觀。例如,具備情感識別與響應能力的代理能夠更精準地理解用戶情緒狀態(tài),并提供相應的情感支持,從而顯著提升人機交互的滿意度和信任度。
當前,神經(jīng)科學與認知科學的研究成果正不斷反哺 AI 系統(tǒng)的架構設計,而隨著 AI 系統(tǒng)在功能上愈發(fā)接近人類認知模式,其可解釋性和可控性也相應增強。
在這一過程中,AI 領域應秉持審慎原則,正如劉邦所強調(diào):“我們不能完全理解的系統(tǒng),必須極其謹慎地設計和部署。尤其是在將大模型擴展為代理系統(tǒng)時,使其架構和決策邏輯更貼近人類認知模式,可作為一種提升可控性和可理解性的有效機制。 ”
(來源:arXiv)
盡管大模型在語言理解和生成任務上表現(xiàn)卓越,但其固有局限性不容忽視。大模型可類比于孤立的大腦,而智能代理則是將這一“大腦”與感知、記憶、執(zhí)行等外圍模塊整合形成的完整系統(tǒng)。
大模型依賴有限上下文進行概率推理,缺乏持續(xù)記憶和真實世界常識,容易產(chǎn)生自相矛盾或看似合理實則錯誤的“幻覺”輸出,這在醫(yī)療、金融等高風險領域可能引發(fā)嚴重后果。
劉邦指出,代理系統(tǒng)的優(yōu)勢主要體現(xiàn)在兩方面:
其一,在能力增強層面,代理能通過模塊化分工顯著提升任務執(zhí)行效率。例如,相比于直接依賴大模型進行數(shù)學計算或信息檢索,代理可調(diào)用專用工具(如計算引擎或數(shù)據(jù)庫)以確保結(jié)果的準確性和可靠性,其核心在于“讓合適的組件處理擅長的任務”;
其二,在系統(tǒng)可控性層面,代理可通過定制化配置(如工作流程設計、領域數(shù)據(jù)注入、人工規(guī)則約束及后處理機制)提升輸出的安全性、可信度和穩(wěn)定性,從而彌補大模型在真實世界理解和可控性上的不足。
圖丨基于大語言模型的智能體推理范式比較(來源:arXiv)
代理系統(tǒng)在多目標優(yōu)化和長期規(guī)劃領域展現(xiàn)出獨特優(yōu)勢。劉邦提到,通過為代理設計多維獎勵信號,可使其在決策時動態(tài)權衡效率、成本、安全性等目標,從而逼近全局最優(yōu)解。例如,在城市規(guī)劃場景中,代理助手能夠綜合分析經(jīng)濟發(fā)展與環(huán)境保護等矛盾目標,生成均衡策略。
長期規(guī)劃的實現(xiàn)依賴于代理的記憶能力和模型設計:一方面,代理可存儲歷史決策和環(huán)境變化信息,形成持續(xù)學習機制;另一方面,其能夠?qū)⒑暧^目標分解為階段性任務,并根據(jù)實時反饋動態(tài)調(diào)整執(zhí)行路徑。這種架構特性使代理天然適合處理復雜、長周期的規(guī)劃問題,并隨著數(shù)據(jù)積累和獎勵機制的優(yōu)化持續(xù)提升性能。
圖丨人類記憶系統(tǒng)的層級分類體系(來源:arXiv)
盡管代理系統(tǒng)在多領域發(fā)揮作用,但必須明確人機協(xié)同的邊界。例如,在醫(yī)療領域,AI 可輔助數(shù)據(jù)分析并為醫(yī)生提供決策建議,但最終診斷和患者溝通仍需人類醫(yī)生主導;在教育領域,代理能依據(jù)學生反饋定制學習方案,但情感引導和價值觀培養(yǎng)仍需教師參與。
劉邦指出,技術發(fā)展的方向決定了未來世界的面貌,每一種科幻中想象的未來世界都是可能實現(xiàn)的,因此審慎地選擇很重要。我們應該讓 AI 技術驅(qū)動未來社會朝著“以人為本”的方向前進。AI 的角色應是增強人類能力,而非替代人類的核心職能。
此外,研究還揭示了大模型和代理系統(tǒng)在不同階段的安全隱患:預訓練階段的數(shù)據(jù)偏差或污染可能導致模型隱含偏見;應用階段則可能遭遇惡意提示注入攻擊;而在推理過程中,目標函數(shù)設計缺陷可能引發(fā)極端推論(如“消除人類以解決環(huán)境問題”)。
對此,劉邦警示:“單純追求獎勵最大化可能導向違背人類倫理的解決方案,必須通過系統(tǒng)化設計確保 AI 與人類社會價值觀的一致性?!?/p>
總體來說,未來智能代理的發(fā)展不僅需要技術上的突破,更需要在人機協(xié)同、倫理約束和社會價值之間找到平衡,才能真正成為推動人類進步的可靠伙伴。
為了促進開源、安全、以人為本的智能體架構與協(xié)議的研究,劉邦與 MetaGPT 的 CEO 吳承霖聯(lián)合發(fā)起了 Foundation Agents 開源社區(qū)與組織(https://foundationagents.org/),該組織旗下目前包含 MetaGPT、OpenManus 等多個流行智能體框架,已吸引超過 10 萬 GitHub Stars。他們希望為全球?qū)W者與從業(yè)者創(chuàng)建一個開放協(xié)作的開源研究環(huán)境,以推動基礎智能體系列與智能體協(xié)議的深度研究。
參考資料:
1.https://arxiv.org/abs/2504.01990
2.Github: https://github.com/FoundationAgents
運營/排版:何晨龍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.