每經(jīng)記者:張蕊 每經(jīng)編輯:陳星
當(dāng)大多數(shù)機(jī)器人還停留在“依賴(lài)遙控器操作”的階段時(shí),在近日舉行的世界機(jī)器人大會(huì)上,《每日經(jīng)濟(jì)新聞》記者(以下簡(jiǎn)稱(chēng)每經(jīng)記者)卻看到了不一樣的場(chǎng)景。
在維他動(dòng)力展臺(tái),可以自主移動(dòng)、自主反應(yīng)的機(jī)器狗“大頭”吸引了眾多小朋友,大家親切地喊著它的名字、撫摸它的身軀,展臺(tái)被圍得水泄不通;
在星海圖展臺(tái),不管被子怎樣凌亂地?cái)傇诖采?,機(jī)器人每次都能熟練地揪起兩邊被角,翻下來(lái)將被子鋪平;
星海圖展臺(tái)上演示機(jī)器人鋪床
在越疆機(jī)器人展臺(tái),人形機(jī)器人Atom左手拿起扳手將機(jī)械臂軸承旋緊至0.1毫米公差內(nèi),右手同步將不同規(guī)格的零件分揀至六宮格料箱,實(shí)現(xiàn)了雙腦決策+雙臂協(xié)同;
在優(yōu)必選展臺(tái),通過(guò)群腦網(wǎng)絡(luò)2.0的整體調(diào)度與任務(wù)分配管理,多臺(tái)人形機(jī)器人協(xié)同,成功展示了從物料入庫(kù)、搬運(yùn)到動(dòng)態(tài)隨機(jī)分揀的全流程作業(yè)。
這些操作讓現(xiàn)場(chǎng)觀眾直呼,這屆機(jī)器人有點(diǎn)兒東西!
其實(shí),在維他動(dòng)力聯(lián)合創(chuàng)始人、產(chǎn)品副總裁趙哲倫看來(lái),這些展示都屬于物理AI范疇。可以說(shuō),物理AI正在讓機(jī)器人變得越來(lái)越自主、越來(lái)越懂事。
物理AI要求機(jī)器人完全自主運(yùn)行
物理AI被英偉達(dá)創(chuàng)始人黃仁勛視作是人工智能的下一個(gè)浪潮。
趙哲倫對(duì)每經(jīng)記者表示,AI的本質(zhì)是用計(jì)算能力解決問(wèn)題。過(guò)去,AI主要處理的是信息層面的任務(wù),運(yùn)行環(huán)境局限于電腦或手機(jī),與物理世界關(guān)聯(lián)較弱。
“物理AI則不同,它要解決的是物理世界的空間移動(dòng)問(wèn)題?!壁w哲倫解釋?zhuān)粌H是移動(dòng)本身,所有機(jī)械臂的移動(dòng)、靈巧手和足的移動(dòng)都是空間移動(dòng),可以理解為讓空間中的某個(gè)物體從A點(diǎn)有序地移動(dòng)到B點(diǎn)。“人類(lèi)日常很多工作本質(zhì)上都是一連串空間移動(dòng)的集合,比如遞一杯咖啡、疊一件衣服等?!?/p>
趙哲倫表示,自動(dòng)駕駛嚴(yán)格意義上是首個(gè)規(guī)模化落地的物理AI應(yīng)用,但它相對(duì)簡(jiǎn)單,它解決的是平面上前后左右移動(dòng)的問(wèn)題。而像疊衣服、取飲料等動(dòng)作,則屬于更復(fù)雜的空間移動(dòng)。
他提到,物理AI并不限定形態(tài),比如桌面機(jī)械臂、四足機(jī)器人、輪式底盤(pán)加機(jī)械臂,只要涉及空間移動(dòng),就都屬于物理AI的范疇。
在他看來(lái),物理AI的內(nèi)涵要求機(jī)器人完全自主運(yùn)行——自主感知環(huán)境、理解信息、規(guī)劃任務(wù)并執(zhí)行?!斑@四個(gè)環(huán)節(jié)應(yīng)該在機(jī)器人自己的本體完成。一旦有人遙控,肯定不是物理AI,因?yàn)檫b控相當(dāng)于從感知環(huán)境到理解再到執(zhí)行是由人來(lái)做決策。”傳統(tǒng)掃地機(jī)、無(wú)人機(jī)之所以不算物理AI,是因?yàn)樗鼈円蕾?lài)一套固定規(guī)則的基礎(chǔ)算法。
在維他動(dòng)力展臺(tái),“無(wú)遙控”三個(gè)字也被醒目地寫(xiě)在展臺(tái)中央立柱上。在其展臺(tái)體驗(yàn)區(qū),機(jī)器狗會(huì)跟著人自主移動(dòng)。趙哲倫說(shuō),其團(tuán)隊(duì)解決的問(wèn)題就是讓機(jī)器人能夠在任何人類(lèi)可至的環(huán)境中自主移動(dòng),并知道自己要去哪里、該跟隨誰(shuí)。
維他動(dòng)力展臺(tái)上觀眾與機(jī)器狗“大頭”互動(dòng)
他說(shuō),用戶(hù)通過(guò)語(yǔ)音下達(dá)指令,機(jī)器狗在理解物理環(huán)境后自主完成指令,它要做的事情跟人形機(jī)器人沒(méi)有任何區(qū)別。
“這個(gè)難度要高于自動(dòng)駕駛,因?yàn)榻煌▓?chǎng)景雖然速度快、風(fēng)險(xiǎn)高,但受明確的交通規(guī)則約束,相對(duì)有規(guī)律;而人類(lèi)生活空間既無(wú)規(guī)則也更無(wú)序。”趙哲倫補(bǔ)充說(shuō)。
全自主運(yùn)行要與具體業(yè)務(wù)需求結(jié)合
優(yōu)必選現(xiàn)場(chǎng)展示的多臺(tái)人形機(jī)器人全流程協(xié)同作業(yè)場(chǎng)景正是物理AI的生動(dòng)實(shí)踐。
優(yōu)必選首席品牌官譚旻告訴每經(jīng)記者,公司機(jī)器人所有演示場(chǎng)景均為AI驅(qū)動(dòng)。其人形機(jī)器人在工業(yè)智能制造領(lǐng)域的應(yīng)用覆蓋搬運(yùn)、質(zhì)檢、分揀三大場(chǎng)景,目前已進(jìn)入多家汽車(chē)工廠實(shí)訓(xùn)。
“在真實(shí)的汽車(chē)工廠環(huán)境中,車(chē)輛到達(dá)時(shí)間隨時(shí)可能變化,所以無(wú)法預(yù)編程,機(jī)器人必須自主運(yùn)行。如果仍需人工遙控,機(jī)器人進(jìn)廠便失去了應(yīng)用價(jià)值?!闭f(shuō)完,譚旻站到正在往車(chē)上搬箱子的人形機(jī)器人面前,機(jī)器人隨即停了下來(lái)?!翱吹?jīng)]有?機(jī)器人識(shí)別到人或者其他物體時(shí)就會(huì)自主停下,之后它會(huì)重新規(guī)劃路線(xiàn),全程無(wú)需人工干預(yù)?!?/p>
優(yōu)必選展臺(tái)演示機(jī)器人分揀作業(yè)
在科大訊飛機(jī)器人首席科學(xué)家、聆動(dòng)通用CEO季超看來(lái),全自主并非新命題,傳統(tǒng)自動(dòng)化已經(jīng)實(shí)現(xiàn)特定場(chǎng)景的全自主。他對(duì)每經(jīng)記者表示,具身智能時(shí)代的全自主關(guān)鍵在于泛化性的提升。目前的全自主,大家更關(guān)注的還是定義一個(gè)具體任務(wù),針對(duì)這個(gè)任務(wù)去做自主運(yùn)行,本質(zhì)上是系統(tǒng)集成的雛形。
因此,他認(rèn)為,定義全自主的關(guān)鍵要素,首先要有動(dòng)作流,一個(gè)個(gè)動(dòng)作基于時(shí)間序列串成一個(gè)連續(xù)動(dòng)作;在這個(gè)過(guò)程中這些動(dòng)作可以完成一些任務(wù),這就是任務(wù)流;要實(shí)現(xiàn)完全自主,就要把機(jī)器人跟真實(shí)的生產(chǎn)生活結(jié)合起來(lái),這就是業(yè)務(wù)流?!叭绻亲鯞端(商家)方向,機(jī)器人一定是有業(yè)務(wù)流的。業(yè)務(wù)流、任務(wù)流和動(dòng)作流能夠?qū)崿F(xiàn)全流程閉環(huán),它就可以完成一個(gè)自主化的運(yùn)行?!?/p>
季超強(qiáng)調(diào),實(shí)現(xiàn)自動(dòng)化的必要條件是要跟業(yè)務(wù)場(chǎng)景結(jié)合,形成因果驅(qū)動(dòng)的任務(wù)鏈。如果機(jī)器人沒(méi)有場(chǎng)景、沒(méi)有業(yè)務(wù),比如只是希望它往前走一走,往后走一走,但是并沒(méi)有因果關(guān)系,這其實(shí)更多的還是基礎(chǔ)動(dòng)作流的展示。
加速進(jìn)化公司一直在聚焦機(jī)器人足球賽。公司國(guó)際化負(fù)責(zé)人李超逸對(duì)每經(jīng)記者表示,目前該公司所有上場(chǎng)比賽的機(jī)器人均為全自主運(yùn)行,無(wú)需遙控,自主水平也在快速迭代。
談及投入大量資源聚焦機(jī)器人足球賽的原因,他說(shuō),比賽能夠在短時(shí)間內(nèi)高密度地錘煉機(jī)器人的感知(快速識(shí)別動(dòng)態(tài)物體)、定位、導(dǎo)航、避障、穩(wěn)定行走及倒地恢復(fù)等能力。這些能力未來(lái)都可以遷移至家庭、工業(yè)等真實(shí)場(chǎng)景。
自主換電機(jī)器人
模型和數(shù)據(jù)制約具身智能擴(kuò)展至更通用場(chǎng)景
季超提到,隨著大語(yǔ)言模型、多模態(tài)大模型及具身大模型的發(fā)展,機(jī)器人已經(jīng)具備任務(wù)理解與動(dòng)作規(guī)劃、動(dòng)作執(zhí)行能力。
但是,多位受訪(fǎng)者提到,模型和數(shù)據(jù)制約了具身智能擴(kuò)展至更通用場(chǎng)景。
趙哲倫提到,現(xiàn)在的難點(diǎn)在于,如果是機(jī)械臂相關(guān)的操作類(lèi)物理AI,執(zhí)行的成功率可能沒(méi)那么高,效率相對(duì)也會(huì)比較低?!斑@涉及具身智能研發(fā)范式問(wèn)題,即它確實(shí)沒(méi)有非常充分的數(shù)據(jù),使其在某一個(gè)場(chǎng)景下或在通用場(chǎng)景下做得特別好?!?/p>
他進(jìn)一步解釋?zhuān)热缒壳耙灾悄荞{駛為基礎(chǔ)的類(lèi)似VLA(視覺(jué)語(yǔ)言動(dòng)作)的模型,其實(shí)泛化性比較差,因?yàn)闆](méi)有物理環(huán)境的數(shù)據(jù)。就像機(jī)器人疊被子,能疊花被子,但可能疊不了藍(lán)被子。“大家對(duì)機(jī)器人的預(yù)期是它能疊所有的被子,但事實(shí)上它從感知到理解還是有差距的?!?/p>
“當(dāng)然,物理AI在定義上是清晰的,就是要自主?!壁w哲倫說(shuō),但是也要看到,所有物理AI都必須經(jīng)歷從有限場(chǎng)景到無(wú)限場(chǎng)景的擴(kuò)展,就像自動(dòng)駕駛從單車(chē)道到高速公路,再到城市場(chǎng)景的演進(jìn)。
而在模型方面,松延動(dòng)力CFO韓深任對(duì)每經(jīng)記者表示,現(xiàn)在機(jī)器人可以接收視覺(jué)、觸覺(jué)等數(shù)據(jù),但它的自主決策能力不足?!爸饕悄P图軜?gòu)沒(méi)跑通,如何訓(xùn)練、輸出,這些還需要行業(yè)不斷發(fā)展?!?/p>
他認(rèn)為,目前制約模型成熟的因素主要是大家對(duì)模型的認(rèn)知沒(méi)有形成統(tǒng)一范式,或者說(shuō)現(xiàn)在的架構(gòu)不清晰,VLA等主流架構(gòu)能否最終勝出仍不確定。
在韓深任看來(lái),將模型跟數(shù)據(jù)的邏輯跑通,可能需要3~5年,屆時(shí)機(jī)器人才能像真人一樣決策,遇到問(wèn)題會(huì)自行處理,這樣才能走進(jìn)千家萬(wàn)戶(hù)。
完全自主的人形機(jī)器人何時(shí)能夠?qū)崿F(xiàn)?譚旻認(rèn)為,如果要達(dá)到與人類(lèi)同等水平的完全自主,行業(yè)共識(shí)認(rèn)為仍需數(shù)十年,有限自主有望在2030年至2050年實(shí)現(xiàn)。屆時(shí),機(jī)器人可在特定場(chǎng)景下理解自然語(yǔ)言指令并完成任務(wù),例如“從冰箱拿一瓶可樂(lè)”。但復(fù)雜、泛化的家庭服務(wù)仍需長(zhǎng)期迭代。
北京長(zhǎng)木谷醫(yī)療科技股份有限公司的骨科智能手術(shù)機(jī)器人目前處于“人機(jī)協(xié)作”階段,公司董事長(zhǎng)張逸凌對(duì)每經(jīng)記者表示,隨著病例量、應(yīng)用案例的不斷積累,手術(shù)機(jī)器人會(huì)越來(lái)越具備大專(zhuān)家的能力,慢慢從人機(jī)協(xié)作(需要醫(yī)生指導(dǎo))過(guò)渡到半自主,再到純自主?!拔艺J(rèn)為這在未來(lái)5~10年就能實(shí)現(xiàn),我相信下一代的自主型手術(shù)機(jī)器人一定會(huì)在中國(guó)出現(xiàn)。”
本文圖片均由每經(jīng)記者 張蕊 攝
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.