衡宇 發(fā)自 上海
量子位 | 公眾號(hào) QbitAI
好你個(gè)稚暉君,居然搞突襲,一腳踹飛了機(jī)器人二次開發(fā)的高門檻。
在智元機(jī)器人首屆合作伙伴大會(huì)上,智元機(jī)器人聯(lián)合創(chuàng)始人、CTO稚暉君(彭志輝),發(fā)布了機(jī)器人動(dòng)作與表達(dá)創(chuàng)作平臺(tái)靈創(chuàng)平臺(tái)(LinkCraft)。
他首先陳述了一個(gè)當(dāng)下的現(xiàn)象:
大家能看到網(wǎng)上有很多展示機(jī)器人靈活、生動(dòng)、自然表現(xiàn)的視頻,但翻來覆去就那幾段動(dòng)作。
對(duì)此,他的解釋是這樣的——
這些機(jī)器人的開發(fā)門檻太高了,想要讓機(jī)器人實(shí)現(xiàn)這種高動(dòng)態(tài)的全身控制,需要有非常深厚的強(qiáng)化學(xué)習(xí)加模仿學(xué)習(xí)的訓(xùn)練技巧——這都是專業(yè)人士才能做的事情。
所以一般都是由廠商針對(duì)某些問題訓(xùn)得比較好之后,開放OTA升級(jí),升級(jí)一個(gè)動(dòng)作的OTA,機(jī)器人才能多會(huì)一個(gè)動(dòng)作。
因?yàn)橄M幸粋€(gè)方便大家二次開發(fā)機(jī)器人的東西,所以智元推出了靈創(chuàng)平臺(tái)。
它被稚暉君稱為殺手級(jí)應(yīng)用。
靈創(chuàng)平臺(tái)是個(gè)啥?
靈創(chuàng)平臺(tái)定位為一個(gè)AI加持、面向創(chuàng)作者和開發(fā)者的機(jī)器人動(dòng)作與表達(dá)創(chuàng)作平臺(tái),未來愿景是“讓機(jī)器人像人一樣表達(dá),讓創(chuàng)作者像導(dǎo)演一樣自由編排”。
具體來說,你買回來一臺(tái)人形機(jī)器人,想要它有demo視頻中的良好表現(xiàn),或者無痛學(xué)會(huì)新的動(dòng)作技能,不需要再費(fèi)勁訓(xùn)練它。
丟給靈創(chuàng)平臺(tái),像用剪映剪視頻一樣,在3D場(chǎng)景里“剪輯”你想讓機(jī)器人完成的行為。
底層邏輯很清晰——
用AI把機(jī)器人二次開發(fā)復(fù)雜的過程抽象成一個(gè)個(gè)模塊化工具,以此支持機(jī)器人動(dòng)作的自由編排和表達(dá)定制。
稚暉君介紹時(shí)表示:“以往的機(jī)器人動(dòng)作演示需要專業(yè)人員進(jìn)行調(diào)試,操作難度較大,靈創(chuàng)平臺(tái)可以提供各類標(biāo)準(zhǔn)動(dòng)作模板,降低創(chuàng)作者編排調(diào)試機(jī)器人動(dòng)作演示的難度?!?/p>
用戶生成自創(chuàng)機(jī)器人動(dòng)作后,就成了自己的資產(chǎn),不僅能反復(fù)調(diào)用,還可以與他人共享、組合、混剪。
稚暉君介紹,這套玩法背后是智元一整套自研AI模型在底層托舉。
據(jù)悉,靈創(chuàng)平臺(tái)并不是為某一臺(tái)機(jī)器人量身打造的。
當(dāng)前靈創(chuàng)平臺(tái)已經(jīng)適配了智元旗下的人形機(jī)器人靈犀X2,以后將擴(kuò)展至更多形態(tài)的硬件設(shè)備。
今年10月,靈創(chuàng)平臺(tái)將上線beta版本。
所謂“0門檻”,怎么用?
稚暉君在大會(huì)現(xiàn)場(chǎng)展示了靈創(chuàng)平臺(tái)的用法——
在電腦或手機(jī)上打開靈創(chuàng)平臺(tái)官網(wǎng),屏幕分左右兩欄。
左邊有包含動(dòng)作庫、prompt輸入?yún)^(qū)等在內(nèi)的各種選項(xiàng),右邊窗口負(fù)責(zé)預(yù)覽和更精細(xì)調(diào)整機(jī)器人動(dòng)作。
最簡(jiǎn)單的用法,就是在左側(cè)的既定動(dòng)作庫中,選擇你想讓機(jī)器人學(xué)會(huì)的新動(dòng)作,比如打哈欠、揮手、鞠躬、鼓掌……隨點(diǎn)隨看,每一個(gè)動(dòng)作都實(shí)時(shí)在右側(cè)窗口預(yù)覽。
如果你覺得它學(xué)得還ok,就可以給現(xiàn)實(shí)世界里的機(jī)器人安排上了。
有沒有感覺到,照這個(gè)辦法,以前有0代碼編程,現(xiàn)在有0代碼二次開發(fā)機(jī)器人了~
官方介紹也表示,靈創(chuàng)平臺(tái)“可將機(jī)器人二次開發(fā)難度降低到0門檻”。
稚暉君介紹,靈創(chuàng)平臺(tái)動(dòng)作庫中目前已有上百個(gè)標(biāo)準(zhǔn)化動(dòng)作,智元官方還會(huì)繼續(xù)填充動(dòng)作庫。
這里有個(gè)有點(diǎn)意思的玩法,用戶有自己想“教”機(jī)器人的動(dòng)作,可以錄制一段真人演示視頻(不需要任何動(dòng)捕設(shè)備),上傳到靈創(chuàng)平臺(tái),AI會(huì)識(shí)別原視頻中人物肢體動(dòng)作,再由AI作retarget,變成右邊窗口里能預(yù)覽的機(jī)器人成品動(dòng)作效果。
根據(jù)動(dòng)作難度的不同,訓(xùn)練時(shí)間從幾十秒到幾十個(gè)小時(shí)不等。
右側(cè)的窗口里,可以靠拖動(dòng)來增減具體參數(shù),進(jìn)行更精細(xì)的動(dòng)作編輯,對(duì)機(jī)器人動(dòng)作“逐幀雕刻”。
此外,靈創(chuàng)平臺(tái)可以根據(jù)用戶上傳的音頻,自動(dòng)分析其中的語義和情緒,并生成與之匹配的自然動(dòng)作。
比如給它一段悲傷語調(diào)的音頻,靈創(chuàng)平臺(tái)會(huì)生成機(jī)器人耷拉肩膀、低頭的動(dòng)作。
另一個(gè)功能很像“演繹編排”:
在靈創(chuàng)平臺(tái)輸入文本,AI合成語音,然后選定想要的詞語,規(guī)定說該詞語時(shí)對(duì)應(yīng)要做出的動(dòng)作,機(jī)器人就能按部就班地乖乖聽話開始它的“表演”。
One More Thing
大會(huì)現(xiàn)場(chǎng),智元秀出了新款機(jī)器人:
靈犀X2-W。
這是一款收納起來占地不到0.5㎡的輪足式人形機(jī)器人,具備高自由度雙臂及仿生手腕以及靈巧三指手,目前尚處原型階段。
在現(xiàn)場(chǎng)播放的靈犀X2-W展示視頻中,它彎曲“膝蓋”,用手打開了掃地機(jī)器人的開關(guān),掃地機(jī)器人麻溜工作去了。
能理解,為了展示它各個(gè)方面的能力嘛!
但一瞬間幻視迪士尼IP某經(jīng)典畫面:
大家都是狗,但高飛是“人”,得牽狗繩出門遛布魯托(頂鍋蓋跑開)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.