網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

黃仁勛預(yù)言的下一個(gè)浪潮來(lái)了？機(jī)器人甩掉遙控器，物理AI讓它們“自己當(dāng)家”

2025-08-15 20:36:37　來(lái)源: 每日經(jīng)濟(jì)新聞

四川舉報(bào)

分享至

每經(jīng)記者：張蕊每經(jīng)編輯：陳星

當(dāng)大多數(shù)機(jī)器人還停留在“依賴(lài)遙控器操作”的階段時(shí)，在近日舉行的世界機(jī)器人大會(huì)上，《每日經(jīng)濟(jì)新聞》記者（以下簡(jiǎn)稱(chēng)每經(jīng)記者）卻看到了不一樣的場(chǎng)景。

在維他動(dòng)力展臺(tái)，可以自主移動(dòng)、自主反應(yīng)的機(jī)器狗“大頭”吸引了眾多小朋友，大家親切地喊著它的名字、撫摸它的身軀，展臺(tái)被圍得水泄不通；

在星海圖展臺(tái)，不管被子怎樣凌亂地?cái)傇诖采?，機(jī)器人每次都能熟練地揪起兩邊被角，翻下來(lái)將被子鋪平；

星海圖展臺(tái)上演示機(jī)器人鋪床

在越疆機(jī)器人展臺(tái)，人形機(jī)器人Atom左手拿起扳手將機(jī)械臂軸承旋緊至0.1毫米公差內(nèi)，右手同步將不同規(guī)格的零件分揀至六宮格料箱，實(shí)現(xiàn)了雙腦決策+雙臂協(xié)同；

在優(yōu)必選展臺(tái)，通過(guò)群腦網(wǎng)絡(luò)2.0的整體調(diào)度與任務(wù)分配管理，多臺(tái)人形機(jī)器人協(xié)同，成功展示了從物料入庫(kù)、搬運(yùn)到動(dòng)態(tài)隨機(jī)分揀的全流程作業(yè)。

這些操作讓現(xiàn)場(chǎng)觀眾直呼，這屆機(jī)器人有點(diǎn)兒東西！

其實(shí)，在維他動(dòng)力聯(lián)合創(chuàng)始人、產(chǎn)品副總裁趙哲倫看來(lái)，這些展示都屬于物理AI范疇。可以說(shuō)，物理AI正在讓機(jī)器人變得越來(lái)越自主、越來(lái)越懂事。

物理AI要求機(jī)器人完全自主運(yùn)行

物理AI被英偉達(dá)創(chuàng)始人黃仁勛視作是人工智能的下一個(gè)浪潮。

趙哲倫對(duì)每經(jīng)記者表示，AI的本質(zhì)是用計(jì)算能力解決問(wèn)題。過(guò)去，AI主要處理的是信息層面的任務(wù)，運(yùn)行環(huán)境局限于電腦或手機(jī)，與物理世界關(guān)聯(lián)較弱。

“物理AI則不同，它要解決的是物理世界的空間移動(dòng)問(wèn)題?！壁w哲倫解釋?zhuān)粌H是移動(dòng)本身，所有機(jī)械臂的移動(dòng)、靈巧手和足的移動(dòng)都是空間移動(dòng)，可以理解為讓空間中的某個(gè)物體從A點(diǎn)有序地移動(dòng)到B點(diǎn)。“人類(lèi)日常很多工作本質(zhì)上都是一連串空間移動(dòng)的集合，比如遞一杯咖啡、疊一件衣服等?！?/p>

趙哲倫表示，自動(dòng)駕駛嚴(yán)格意義上是首個(gè)規(guī)模化落地的物理AI應(yīng)用，但它相對(duì)簡(jiǎn)單，它解決的是平面上前后左右移動(dòng)的問(wèn)題。而像疊衣服、取飲料等動(dòng)作，則屬于更復(fù)雜的空間移動(dòng)。

他提到，物理AI并不限定形態(tài)，比如桌面機(jī)械臂、四足機(jī)器人、輪式底盤(pán)加機(jī)械臂，只要涉及空間移動(dòng)，就都屬于物理AI的范疇。

在他看來(lái)，物理AI的內(nèi)涵要求機(jī)器人完全自主運(yùn)行——自主感知環(huán)境、理解信息、規(guī)劃任務(wù)并執(zhí)行?！斑@四個(gè)環(huán)節(jié)應(yīng)該在機(jī)器人自己的本體完成。一旦有人遙控，肯定不是物理AI，因?yàn)檫b控相當(dāng)于從感知環(huán)境到理解再到執(zhí)行是由人來(lái)做決策。”傳統(tǒng)掃地機(jī)、無(wú)人機(jī)之所以不算物理AI，是因?yàn)樗鼈円蕾?lài)一套固定規(guī)則的基礎(chǔ)算法。

在維他動(dòng)力展臺(tái)，“無(wú)遙控”三個(gè)字也被醒目地寫(xiě)在展臺(tái)中央立柱上。在其展臺(tái)體驗(yàn)區(qū)，機(jī)器狗會(huì)跟著人自主移動(dòng)。趙哲倫說(shuō)，其團(tuán)隊(duì)解決的問(wèn)題就是讓機(jī)器人能夠在任何人類(lèi)可至的環(huán)境中自主移動(dòng)，并知道自己要去哪里、該跟隨誰(shuí)。

維他動(dòng)力展臺(tái)上觀眾與機(jī)器狗“大頭”互動(dòng)

他說(shuō)，用戶(hù)通過(guò)語(yǔ)音下達(dá)指令，機(jī)器狗在理解物理環(huán)境后自主完成指令，它要做的事情跟人形機(jī)器人沒(méi)有任何區(qū)別。

“這個(gè)難度要高于自動(dòng)駕駛，因?yàn)榻煌▓?chǎng)景雖然速度快、風(fēng)險(xiǎn)高，但受明確的交通規(guī)則約束，相對(duì)有規(guī)律；而人類(lèi)生活空間既無(wú)規(guī)則也更無(wú)序。”趙哲倫補(bǔ)充說(shuō)。

全自主運(yùn)行要與具體業(yè)務(wù)需求結(jié)合

優(yōu)必選現(xiàn)場(chǎng)展示的多臺(tái)人形機(jī)器人全流程協(xié)同作業(yè)場(chǎng)景正是物理AI的生動(dòng)實(shí)踐。

優(yōu)必選首席品牌官譚旻告訴每經(jīng)記者，公司機(jī)器人所有演示場(chǎng)景均為AI驅(qū)動(dòng)。其人形機(jī)器人在工業(yè)智能制造領(lǐng)域的應(yīng)用覆蓋搬運(yùn)、質(zhì)檢、分揀三大場(chǎng)景，目前已進(jìn)入多家汽車(chē)工廠實(shí)訓(xùn)。

“在真實(shí)的汽車(chē)工廠環(huán)境中，車(chē)輛到達(dá)時(shí)間隨時(shí)可能變化，所以無(wú)法預(yù)編程，機(jī)器人必須自主運(yùn)行。如果仍需人工遙控，機(jī)器人進(jìn)廠便失去了應(yīng)用價(jià)值?！闭f(shuō)完，譚旻站到正在往車(chē)上搬箱子的人形機(jī)器人面前，機(jī)器人隨即停了下來(lái)?！翱吹?jīng)]有？機(jī)器人識(shí)別到人或者其他物體時(shí)就會(huì)自主停下，之后它會(huì)重新規(guī)劃路線(xiàn)，全程無(wú)需人工干預(yù)?！?/p>

優(yōu)必選展臺(tái)演示機(jī)器人分揀作業(yè)

在科大訊飛機(jī)器人首席科學(xué)家、聆動(dòng)通用CEO季超看來(lái)，全自主并非新命題，傳統(tǒng)自動(dòng)化已經(jīng)實(shí)現(xiàn)特定場(chǎng)景的全自主。他對(duì)每經(jīng)記者表示，具身智能時(shí)代的全自主關(guān)鍵在于泛化性的提升。目前的全自主，大家更關(guān)注的還是定義一個(gè)具體任務(wù)，針對(duì)這個(gè)任務(wù)去做自主運(yùn)行，本質(zhì)上是系統(tǒng)集成的雛形。

因此，他認(rèn)為，定義全自主的關(guān)鍵要素，首先要有動(dòng)作流，一個(gè)個(gè)動(dòng)作基于時(shí)間序列串成一個(gè)連續(xù)動(dòng)作；在這個(gè)過(guò)程中這些動(dòng)作可以完成一些任務(wù)，這就是任務(wù)流；要實(shí)現(xiàn)完全自主，就要把機(jī)器人跟真實(shí)的生產(chǎn)生活結(jié)合起來(lái)，這就是業(yè)務(wù)流?！叭绻亲鯞端（商家）方向，機(jī)器人一定是有業(yè)務(wù)流的。業(yè)務(wù)流、任務(wù)流和動(dòng)作流能夠?qū)崿F(xiàn)全流程閉環(huán)，它就可以完成一個(gè)自主化的運(yùn)行?！?/p>

季超強(qiáng)調(diào)，實(shí)現(xiàn)自動(dòng)化的必要條件是要跟業(yè)務(wù)場(chǎng)景結(jié)合，形成因果驅(qū)動(dòng)的任務(wù)鏈。如果機(jī)器人沒(méi)有場(chǎng)景、沒(méi)有業(yè)務(wù)，比如只是希望它往前走一走，往后走一走，但是并沒(méi)有因果關(guān)系，這其實(shí)更多的還是基礎(chǔ)動(dòng)作流的展示。

加速進(jìn)化公司一直在聚焦機(jī)器人足球賽。公司國(guó)際化負(fù)責(zé)人李超逸對(duì)每經(jīng)記者表示，目前該公司所有上場(chǎng)比賽的機(jī)器人均為全自主運(yùn)行，無(wú)需遙控，自主水平也在快速迭代。

談及投入大量資源聚焦機(jī)器人足球賽的原因，他說(shuō)，比賽能夠在短時(shí)間內(nèi)高密度地錘煉機(jī)器人的感知（快速識(shí)別動(dòng)態(tài)物體）、定位、導(dǎo)航、避障、穩(wěn)定行走及倒地恢復(fù)等能力。這些能力未來(lái)都可以遷移至家庭、工業(yè)等真實(shí)場(chǎng)景。

自主換電機(jī)器人

模型和數(shù)據(jù)制約具身智能擴(kuò)展至更通用場(chǎng)景

季超提到，隨著大語(yǔ)言模型、多模態(tài)大模型及具身大模型的發(fā)展，機(jī)器人已經(jīng)具備任務(wù)理解與動(dòng)作規(guī)劃、動(dòng)作執(zhí)行能力。

但是，多位受訪(fǎng)者提到，模型和數(shù)據(jù)制約了具身智能擴(kuò)展至更通用場(chǎng)景。

趙哲倫提到，現(xiàn)在的難點(diǎn)在于，如果是機(jī)械臂相關(guān)的操作類(lèi)物理AI，執(zhí)行的成功率可能沒(méi)那么高，效率相對(duì)也會(huì)比較低?！斑@涉及具身智能研發(fā)范式問(wèn)題，即它確實(shí)沒(méi)有非常充分的數(shù)據(jù)，使其在某一個(gè)場(chǎng)景下或在通用場(chǎng)景下做得特別好?！?/p>

他進(jìn)一步解釋?zhuān)热缒壳耙灾悄荞{駛為基礎(chǔ)的類(lèi)似VLA（視覺(jué)語(yǔ)言動(dòng)作）的模型，其實(shí)泛化性比較差，因?yàn)闆](méi)有物理環(huán)境的數(shù)據(jù)。就像機(jī)器人疊被子，能疊花被子，但可能疊不了藍(lán)被子。“大家對(duì)機(jī)器人的預(yù)期是它能疊所有的被子，但事實(shí)上它從感知到理解還是有差距的?！?/p>

“當(dāng)然，物理AI在定義上是清晰的，就是要自主?！壁w哲倫說(shuō)，但是也要看到，所有物理AI都必須經(jīng)歷從有限場(chǎng)景到無(wú)限場(chǎng)景的擴(kuò)展，就像自動(dòng)駕駛從單車(chē)道到高速公路，再到城市場(chǎng)景的演進(jìn)。

而在模型方面，松延動(dòng)力CFO韓深任對(duì)每經(jīng)記者表示，現(xiàn)在機(jī)器人可以接收視覺(jué)、觸覺(jué)等數(shù)據(jù)，但它的自主決策能力不足?！爸饕悄Ｐ图軜?gòu)沒(méi)跑通，如何訓(xùn)練、輸出，這些還需要行業(yè)不斷發(fā)展?！?/p>

他認(rèn)為，目前制約模型成熟的因素主要是大家對(duì)模型的認(rèn)知沒(méi)有形成統(tǒng)一范式，或者說(shuō)現(xiàn)在的架構(gòu)不清晰，VLA等主流架構(gòu)能否最終勝出仍不確定。

在韓深任看來(lái)，將模型跟數(shù)據(jù)的邏輯跑通，可能需要3~5年，屆時(shí)機(jī)器人才能像真人一樣決策，遇到問(wèn)題會(huì)自行處理，這樣才能走進(jìn)千家萬(wàn)戶(hù)。

完全自主的人形機(jī)器人何時(shí)能夠?qū)崿F(xiàn)？譚旻認(rèn)為，如果要達(dá)到與人類(lèi)同等水平的完全自主，行業(yè)共識(shí)認(rèn)為仍需數(shù)十年，有限自主有望在2030年至2050年實(shí)現(xiàn)。屆時(shí)，機(jī)器人可在特定場(chǎng)景下理解自然語(yǔ)言指令并完成任務(wù)，例如“從冰箱拿一瓶可樂(lè)”。但復(fù)雜、泛化的家庭服務(wù)仍需長(zhǎng)期迭代。

北京長(zhǎng)木谷醫(yī)療科技股份有限公司的骨科智能手術(shù)機(jī)器人目前處于“人機(jī)協(xié)作”階段，公司董事長(zhǎng)張逸凌對(duì)每經(jīng)記者表示，隨著病例量、應(yīng)用案例的不斷積累，手術(shù)機(jī)器人會(huì)越來(lái)越具備大專(zhuān)家的能力，慢慢從人機(jī)協(xié)作（需要醫(yī)生指導(dǎo)）過(guò)渡到半自主，再到純自主?！拔艺J(rèn)為這在未來(lái)5~10年就能實(shí)現(xiàn)，我相信下一代的自主型手術(shù)機(jī)器人一定會(huì)在中國(guó)出現(xiàn)。”

本文圖片均由每經(jīng)記者張蕊攝

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.