時(shí)令 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
波士頓動力也搞端到端AI了!
這次升級,Atlas不僅可以聽懂自然語言指令,還可以自主規(guī)劃動作和處理意外
只見小哥故意合上蓋子,機(jī)器人仍能識別并打開箱子。
故意挪動箱子位置,它也能精確識別到變化。
即使附近有遺漏的裝置,它也能發(fā)現(xiàn),并準(zhǔn)確放入箱子內(nèi)。
據(jù)介紹,此次更新由波士頓動力與豐田研究院聯(lián)手推出,基于大型行為模型(LBM),帶來了Atlas的全新版本——Atlas MTS。
新成果一出,網(wǎng)友們紛紛叫好,光是官方在YouTube發(fā)布的視頻觀看人數(shù)就突破十萬,點(diǎn)贊超一萬。
另有一批網(wǎng)友則欣慰的表示,膝蓋可以彎曲了,那背部就不會受傷了。
哇哦,點(diǎn)贊數(shù)2.4K說明大家都很關(guān)心機(jī)器人身體健康嘛~
除此之外,關(guān)于全新能力具體實(shí)現(xiàn),官方發(fā)布了詳細(xì)報(bào)告。
給Atlas裝上大腦
報(bào)告指出,端到端的語言條件策略能讓機(jī)器人充分發(fā)揮自身優(yōu)勢,實(shí)現(xiàn)行走、精確放置雙腳、蹲下、轉(zhuǎn)移重心,同時(shí)避免自身碰撞。
這種策略構(gòu)建過程分為以下4個(gè)步驟:
- 收集具身行為數(shù)據(jù);
- 處理、標(biāo)注和整理數(shù)據(jù);
- 訓(xùn)練神經(jīng)網(wǎng)絡(luò);
- 利用測試任務(wù)評估該策略。
更值得關(guān)注的是,此次大型行為模型采用4.5億參數(shù)的擴(kuò)散Transformer模型,并結(jié)合流匹配目標(biāo),能將包括30Hz圖像、人體感覺和自然語言指令等輸入信息轉(zhuǎn)化為控制Atlas活動的動作指令。
說簡單點(diǎn),Transformer像“全局之眼”, 把控整體架構(gòu)和動作細(xì)節(jié)的關(guān)聯(lián)。擴(kuò)散是細(xì)化步驟,將模糊指令轉(zhuǎn)化為精準(zhǔn)動作。流匹配損失則是真實(shí)參照,讓動作既貼合現(xiàn)實(shí),又能靈活適應(yīng)不同場景。
在此過程中,波士頓動力關(guān)鍵的是將Atlas的模型預(yù)測控制器與VR界面結(jié)合,從而覆蓋從手指級精細(xì)操作到全身伸展、移動等各類任務(wù)需求。
這使得遠(yuǎn)程操作員能夠充分發(fā)揮機(jī)器人的性能,將自身動作和感知與機(jī)器人的狀態(tài)保持同步。
除此之外,此次升級最值得關(guān)注的是,Atlas能自主處理意外情況。
當(dāng)出現(xiàn)問題時(shí),比如零件掉在地上或箱蓋未關(guān)閉,Atlas都能智能地做出反應(yīng)。
這簡直就是給Atlas裝上大腦!
不僅如此,官方還稱只要是人能演示的動作,Atlas都可以學(xué)習(xí)它,包括但不限于系繩子、折疊椅子和翻輪胎等。
不得不說,這學(xué)習(xí)能力真的驚到我了。
告別液壓,電驅(qū)機(jī)器人更適合AI
說起波士頓動力機(jī)器人,那不得不提一下Atlas液壓版。
此版本在2024年4月已退役,且在24小時(shí)內(nèi)發(fā)布全電動版本。
畢竟液壓系統(tǒng)不僅成本高,響應(yīng)慢,還難以與AI系統(tǒng)集成。
相比之下,電機(jī)驅(qū)動更精確、能耗低,且天然適配AI學(xué)習(xí)框架。
自波士頓動力轉(zhuǎn)向電驅(qū)動以來,他們也是不斷推出新動作。
去年8月,Atlas在RSS(機(jī)器人頂會)上大秀俯臥撐(當(dāng)時(shí)還是沒有手指的,也可以稱為拳臥撐)
動作那是相當(dāng)標(biāo)準(zhǔn)~
過了兩個(gè)月,它就可以進(jìn)廠打工了,只需告訴Atlas前后搬運(yùn)的位置坐標(biāo),它就能全自動分裝物件。
而在今年5月份,波士頓動力再次升級,讓機(jī)器人具備3D空間感知和實(shí)時(shí)物體追蹤能力,可以自主執(zhí)行更復(fù)雜的工業(yè)任務(wù)。
此次的大型行為模型(LBM),也意味著它正擁抱全新的技術(shù)方向。
看完液壓轉(zhuǎn)電驅(qū)的波士頓,再來了解一下國內(nèi)一直采用電驅(qū)的宇樹。
從四足機(jī)器狗Go系列,到人形機(jī)器人H1、G1、R1,宇樹始終延續(xù)著“小而美”的電驅(qū)哲學(xué),用更快的迭代速度,逐漸在全球打響了名號。
現(xiàn)在,180“芭蕾舞者”都出來了。
未來,隨著電驅(qū)技術(shù)與AI算法的不斷融合,電驅(qū)機(jī)器人的時(shí)代才將真正到來。
[1]https://www.youtube.com/watch?v=HYwekersccY
[2]https://bostondynamics.com/blog/large-behavior-models-atlas-find-new-footing/?wchannelid=7qr7eifvi1
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.