成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

研究人員構(gòu)建欲求驅(qū)動(dòng)智能體,可用于模擬人類(lèi)日常活動(dòng)

0
分享至

利用大語(yǔ)言模型作為基礎(chǔ)模型構(gòu)建智能體(LLM-based agents)是當(dāng)今熱門(mén)的研究領(lǐng)域,美國(guó)斯坦福大學(xué)團(tuán)隊(duì)提出的 Smallville AI 小鎮(zhèn)更是作為智能體社會(huì)模擬領(lǐng)域的先驅(qū)引起了廣泛關(guān)注。

過(guò)往智能體研究工作大多使用身份演繹+目標(biāo)驅(qū)動(dòng)的方式驅(qū)動(dòng)智能體的行為,也就是提供給智能體一份身份檔案(profile)和一些具體的任務(wù)指令,使其能在特定環(huán)境下提出行動(dòng),完成一些具體的任務(wù)。


(來(lái)源:課題組)

但是這種框架下構(gòu)建的智能體是缺乏自主性的,有違人類(lèi)智能形成的本質(zhì)的,用演繹和目標(biāo)指令驅(qū)動(dòng)的方式也不是智能最本質(zhì)的來(lái)源。人具有基礎(chǔ)的欲望(餓、困、乏等生理需求),在此基礎(chǔ)上有對(duì)于整潔、美觀、安全、社會(huì)聯(lián)結(jié)等各方面的自我價(jià)值追求,碳基智能體(人和動(dòng)物)也正是在這樣的內(nèi)在欲求驅(qū)動(dòng)下,自主地提出和執(zhí)行一系列日常行動(dòng),而不是被動(dòng)地接收指令和執(zhí)行指令。

基于此,北京師范大學(xué)鐘方威副教授和所在團(tuán)隊(duì)認(rèn)為要實(shí)現(xiàn)類(lèi)人智能體,也需要具備賦予智能體這種欲求驅(qū)動(dòng)的自主機(jī)制,為此他們開(kāi)展了一項(xiàng)研究。該研究階段性成果以《用欲求驅(qū)動(dòng)的自主性模擬類(lèi)人日?;顒?dòng)》(SIMULATING HUMAN-LIKE DAILY ACTIVITIES WITH DESIRE-DRIVEN AUTONOMY) 為題在人工智能領(lǐng)域頂會(huì)國(guó)際表征學(xué)習(xí)大會(huì)(ICLR ,International Conference on Learning Representations)2025 發(fā)表。


(來(lái)源:https://openreview.net/pdf?id=3ms8EQY7f8)

本次研究作為對(duì)類(lèi)人智能體建模的先驅(qū)探索與實(shí)踐,希望用類(lèi)人欲求驅(qū)動(dòng)的價(jià)值系統(tǒng)來(lái)建模智能體的內(nèi)在動(dòng)機(jī)和自主機(jī)制,并用這些價(jià)值維度來(lái)指引它在環(huán)境中提出任務(wù)和選擇行為。研究團(tuán)隊(duì)希望通過(guò)這樣方式建模的智能體能在交互環(huán)境中生成更多樣、自然且類(lèi)人的活動(dòng)序列。


(來(lái)源:資料圖)

研究中,該團(tuán)隊(duì)構(gòu)建了欲求驅(qū)動(dòng)智能體 D2A(Desire-driven Autonomous Agent),它主要包含價(jià)值系統(tǒng)(Value System)以及欲求驅(qū)動(dòng)規(guī)劃器(Desire-driven Planner)兩個(gè)部分。

價(jià)值系統(tǒng)負(fù)責(zé)維護(hù)預(yù)定義的一系列欲求維度的變化,模擬人類(lèi)多元欲求的動(dòng)態(tài)變化機(jī)制(比如隨著時(shí)間饑餓感會(huì)增加),在行動(dòng)前將欲求滿(mǎn)足的感官狀態(tài)以文本描述的方式呈現(xiàn)給智能體,并在智能體行動(dòng)得到環(huán)境反饋后進(jìn)行對(duì)應(yīng)更新。

而欲求驅(qū)動(dòng)規(guī)劃器用了一種符合人類(lèi)直覺(jué)的動(dòng)作擴(kuò)展方法,首先想象了多種可行的活動(dòng),之后模擬采取這些行動(dòng)后各維度欲求價(jià)值的變化情況,之后根據(jù)以上想象的結(jié)果選擇能最好滿(mǎn)足當(dāng)前欲求的活動(dòng)作為當(dāng)前步驟的行動(dòng)。


(來(lái)源:資料圖)

研究團(tuán)隊(duì)發(fā)現(xiàn)這種自主智能體框架生成的動(dòng)作序列,相較于給出明確目標(biāo)和角色檔案,或者基于顯式思考或優(yōu)先級(jí)排序的智能體范式(LLMob、ReAct 和 BabyAGI),能夠生成更像人類(lèi)自然的活動(dòng)序列(更加類(lèi)人)。

同時(shí),研究團(tuán)隊(duì)通過(guò)定量分析發(fā)現(xiàn) D2A 生成的動(dòng)作序列能有效地降低各欲求維度的不滿(mǎn)足程度(更加理性),表現(xiàn)出和人類(lèi)驅(qū)動(dòng)模式較高的一致性。研究團(tuán)隊(duì)也將 D2A 擴(kuò)展到多智能體環(huán)境中進(jìn)行實(shí)驗(yàn),發(fā)現(xiàn)其能生成相比基線方法更豐富自然的活動(dòng)序列。

審稿人認(rèn)為,本次研究提出了一種新穎的動(dòng)態(tài)欲求驅(qū)動(dòng)框架,用于模擬人類(lèi)的日?;顒?dòng)以及人類(lèi)的動(dòng)機(jī)系統(tǒng)。研究團(tuán)隊(duì)通過(guò)將需求理論轉(zhuǎn)化為可計(jì)算模型,使用內(nèi)在的價(jià)值系統(tǒng)代替了傳統(tǒng)大模型 agent 的外在任務(wù)系統(tǒng),使智能體能夠更加靈活地生成類(lèi)人的活動(dòng)序列。通過(guò)無(wú)需預(yù)設(shè)指令的主動(dòng)行為生成(Proactive Action),相比 ReAct/BabyAGI/LLMob 等基線方法,研究團(tuán)隊(duì)的智能體在行為擬真度與多樣性上展現(xiàn)優(yōu)勢(shì)。

與此同時(shí),審稿人還認(rèn)為本次研究提供了靈活的框架,讓用戶(hù)能夠自己設(shè)計(jì)特定的價(jià)值維度,從而適應(yīng)不同領(lǐng)域的研究。

最后,審稿人指出,本次研究也針對(duì)不同場(chǎng)景(包括室內(nèi)和室外場(chǎng)景),人物設(shè)定以及 baseline 進(jìn)行實(shí)驗(yàn)。最終通過(guò)清晰的結(jié)果展示,論證了框架的有效性。研究團(tuán)隊(duì)通過(guò)熱力圖和不滿(mǎn)足度的折線圖,清晰地展示了欲求價(jià)值-行為關(guān)系以及實(shí)驗(yàn)結(jié)果對(duì)比基線模型的勝率。

總的來(lái)說(shuō),本次研究為智能體提供了一種全新的自我驅(qū)動(dòng)方法,基于自己的價(jià)值維度進(jìn)行不同活動(dòng)。研究團(tuán)隊(duì)認(rèn)為這個(gè)框架在不遠(yuǎn)的將來(lái),有望能夠應(yīng)用于大型社會(huì)模擬器(例如構(gòu)造多個(gè)不同欲求和個(gè)性的類(lèi)人智能體,從而模擬一場(chǎng)社會(huì)實(shí)驗(yàn),將有望改變社會(huì)科學(xué)領(lǐng)域的研究范式)、社交機(jī)器人(通過(guò)自身的“社會(huì)連接感”以及其他價(jià)值維度需求主動(dòng)與用戶(hù)互動(dòng),或是模擬用戶(hù)當(dāng)前的狀態(tài)提供個(gè)性化服務(wù))等等。

除此之外,研究團(tuán)隊(duì)也認(rèn)為這個(gè)方向的研究能夠應(yīng)用在互動(dòng)游戲的非玩家控制角色(NPC,Non - Player Character)中,幫助 NPC 自我驅(qū)動(dòng)的生成類(lèi)人交互行為。這種技術(shù)可以讓 NPC 表現(xiàn)出更自然、動(dòng)態(tài)和個(gè)性化的行為,從而增強(qiáng)游戲的沉浸感和可玩性。

由于本次工作從一個(gè)嶄新的角度提出了自主智能體的概念,且研究團(tuán)隊(duì)的實(shí)驗(yàn)設(shè)定與以往任務(wù)目標(biāo)導(dǎo)向的實(shí)驗(yàn)不同(主流的工作多在幾個(gè)公開(kāi)數(shù)據(jù)集上追求更高指標(biāo)性能以證明所提方法的創(chuàng)新性)。因此,研究團(tuán)隊(duì)的工作一開(kāi)始受到了評(píng)審人的一些質(zhì)疑,初始分?jǐn)?shù)評(píng)價(jià) 5553,低于論文被接收的標(biāo)準(zhǔn)線。

后來(lái),研究團(tuán)隊(duì)補(bǔ)充了在更多場(chǎng)景下的實(shí)驗(yàn)數(shù)據(jù),并論述了研究團(tuán)隊(duì)的建模思路的巨大潛力和推動(dòng)人工智能與其他學(xué)科交叉應(yīng)用的廣泛前景,從而說(shuō)服了四位審稿人達(dá)成一致,將分?jǐn)?shù)提升至接受線以上(6666),最終讓領(lǐng)域主席認(rèn)可了研究團(tuán)隊(duì)概念上的新穎性和貢獻(xiàn)的扎實(shí)性。

但是,目前建模還較為簡(jiǎn)化,沒(méi)有考慮各種價(jià)值維度間的層次結(jié)構(gòu),也并沒(méi)有將人類(lèi)更復(fù)雜動(dòng)態(tài)的心理機(jī)制納入考慮,這些都是研究團(tuán)隊(duì)未來(lái)將考慮深入探索的方向。

此外,研究團(tuán)隊(duì)對(duì)將欲望或者價(jià)值作為一個(gè)更本質(zhì)的動(dòng)機(jī)充滿(mǎn)興趣。他們計(jì)劃在多智能體社會(huì)模擬主題下做出更多的工作,為之后將智能體引入人類(lèi)社會(huì)中,或讓智能體與人類(lèi)價(jià)值在交互中對(duì)齊做出研究團(tuán)隊(duì)的探索與嘗試。

排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
一夜之間,上海女子晨跑不穿內(nèi)衣沖上熱搜!評(píng)論兩極分化 吵翻天了

一夜之間,上海女子晨跑不穿內(nèi)衣沖上熱搜!評(píng)論兩極分化 吵翻天了

小蜜情感說(shuō)
2025-08-31 10:58:11
80歲大爺聘?jìng)?0歲保姆,保姆傾訴:就算給我漲到2萬(wàn),我也不伺候

80歲大爺聘?jìng)?0歲保姆,保姆傾訴:就算給我漲到2萬(wàn),我也不伺候

熱心柚子姐姐
2025-08-31 07:43:29
吃瓜!女人瘋起來(lái)有多猛?小三愛(ài)上已婚男,主動(dòng)拍視頻,從上親到下……

吃瓜!女人瘋起來(lái)有多猛?小三愛(ài)上已婚男,主動(dòng)拍視頻,從上親到下……

閑侃閑侃
2025-09-01 08:50:11
泡沫破了!南京一樓盤(pán)單價(jià)從3萬(wàn)跌至1.2萬(wàn),房東生怕跑得比別人慢

泡沫破了!南京一樓盤(pán)單價(jià)從3萬(wàn)跌至1.2萬(wàn),房東生怕跑得比別人慢

火山詩(shī)話
2025-09-01 07:09:29
只差光刻技術(shù)了!日媒:中國(guó)將成日荷后,第三個(gè)造光刻機(jī)的國(guó)家

只差光刻技術(shù)了!日媒:中國(guó)將成日荷后,第三個(gè)造光刻機(jī)的國(guó)家

游古史
2025-08-29 15:52:30
金正恩還沒(méi)抵華,9國(guó)高層拒參閱兵,中方送出一句話,信號(hào)不簡(jiǎn)單

金正恩還沒(méi)抵華,9國(guó)高層拒參閱兵,中方送出一句話,信號(hào)不簡(jiǎn)單

吳欣純Deborah
2025-08-29 13:08:46
韓國(guó)頂級(jí)名媛去世一年后,私密視頻曝光,被財(cái)閥當(dāng)母狗,在KTV做

韓國(guó)頂級(jí)名媛去世一年后,私密視頻曝光,被財(cái)閥當(dāng)母狗,在KTV做

社會(huì)醬
2025-08-31 10:15:44
你聽(tīng)過(guò)最離譜的事是什么?網(wǎng)友:抱著她,她和老公打電話

你聽(tīng)過(guò)最離譜的事是什么?網(wǎng)友:抱著她,她和老公打電話

帶你感受人間冷暖
2025-08-31 17:45:25
1架專(zhuān)機(jī)抵華,中方迎來(lái)一位稀客,沙利文:特朗普幫中國(guó)“大忙”

1架專(zhuān)機(jī)抵華,中方迎來(lái)一位稀客,沙利文:特朗普幫中國(guó)“大忙”

南宮一二
2025-09-01 05:55:12
又一知名家居公司創(chuàng)始人疑墜亡

又一知名家居公司創(chuàng)始人疑墜亡

新浪財(cái)經(jīng)
2025-09-01 00:08:36
苑舉正受邀來(lái)看閱兵,已經(jīng)抵達(dá)北京,采訪時(shí)一句話霸氣外露

苑舉正受邀來(lái)看閱兵,已經(jīng)抵達(dá)北京,采訪時(shí)一句話霸氣外露

另子維愛(ài)讀史
2025-09-01 07:56:32
太拼了!86歲劉詩(shī)昆和老婆從香港飛東京為私宴彈琴,完了站不起來(lái)

太拼了!86歲劉詩(shī)昆和老婆從香港飛東京為私宴彈琴,完了站不起來(lái)

恪守原則和底線
2025-08-31 20:32:28
大外交|普京開(kāi)啟“罕見(jiàn)”四天訪華行:深化中俄務(wù)實(shí)合作,開(kāi)展同多國(guó)雙邊互動(dòng)

大外交|普京開(kāi)啟“罕見(jiàn)”四天訪華行:深化中俄務(wù)實(shí)合作,開(kāi)展同多國(guó)雙邊互動(dòng)

澎湃新聞
2025-09-01 07:00:28
美洲杯:美國(guó)男籃拒絕17分逆轉(zhuǎn)險(xiǎn)勝加拿大 連續(xù)兩屆獲季軍

美洲杯:美國(guó)男籃拒絕17分逆轉(zhuǎn)險(xiǎn)勝加拿大 連續(xù)兩屆獲季軍

醉臥浮生
2025-09-01 06:37:58
一直被塵封的特大海難事故:最后的2名幸存者在印度洋上掙扎24天

一直被塵封的特大海難事故:最后的2名幸存者在印度洋上掙扎24天

霹靂炮
2025-08-30 23:36:41
更多跡象表明蘋(píng)果 iPhone 17 將在更多國(guó)家和地區(qū)取消 SIM 卡槽

更多跡象表明蘋(píng)果 iPhone 17 將在更多國(guó)家和地區(qū)取消 SIM 卡槽

IT之家
2025-09-01 07:43:11
丁元英:越是底層的人,越喜歡談人情世故;越是頂級(jí)的,越愛(ài)談..

丁元英:越是底層的人,越喜歡談人情世故;越是頂級(jí)的,越愛(ài)談..

詩(shī)詞中國(guó)
2025-08-31 16:56:52
硅谷炸雷!xAI創(chuàng)始老哥攜機(jī)密叛逃OpenAI,馬斯克:他上傳了整個(gè)代碼庫(kù)

硅谷炸雷!xAI創(chuàng)始老哥攜機(jī)密叛逃OpenAI,馬斯克:他上傳了整個(gè)代碼庫(kù)

新智元
2025-08-31 17:09:32
風(fēng)向變了,民眾突然都醒了

風(fēng)向變了,民眾突然都醒了

深度報(bào)
2025-08-31 22:48:44
北京國(guó)安凌晨發(fā)布聲明

北京國(guó)安凌晨發(fā)布聲明

新京報(bào)政事兒
2025-09-01 08:43:36
2025-09-01 11:28:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
15585文章數(shù) 514038關(guān)注度
往期回顧 全部

科技要聞

百度19億美元收購(gòu)將成歷史:91助手全面停服

頭條要聞

胡塞武裝逮捕至少11名聯(lián)合國(guó)工作人員 古特雷斯發(fā)聲

頭條要聞

胡塞武裝逮捕至少11名聯(lián)合國(guó)工作人員 古特雷斯發(fā)聲

體育要聞

破2億身家!莎拉波娃的"勝負(fù)腦"

娛樂(lè)要聞

張曼玉 活成了多少人不敢想的樣子?

財(cái)經(jīng)要聞

個(gè)人消費(fèi)貸款貼息開(kāi)閘!多家銀行提前預(yù)熱

汽車(chē)要聞

攜熱門(mén)AI科技產(chǎn)品矩陣亮相 小鵬汽車(chē)登陸成都車(chē)展

態(tài)度原創(chuàng)

游戲
房產(chǎn)
親子
健康
軍事航空

《黎明行者之血》如果能大獲成功 在未來(lái)將有續(xù)作

房產(chǎn)要聞

顛覆認(rèn)知!海口真正的豪宅作品,終于出現(xiàn)了!

親子要聞

朝“問(wèn)”健康丨臨近開(kāi)學(xué)孩子緊張?jiān)趺崔k?5招應(yīng)對(duì)“開(kāi)學(xué)焦慮癥”

精神科專(zhuān)家解答學(xué)習(xí)困難七大問(wèn)題

軍事要聞

哈馬斯證實(shí)其軍事領(lǐng)導(dǎo)人辛瓦爾已死亡

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版