文|邱曉芬
編輯|蘇建勛
若你留心過「逐際動(dòng)力」這幾年在各大展會(huì)的露出,或許會(huì)對(duì)這一幕印象深刻——工作人員和觀眾們猛然抬腿,一次次踹一臺(tái)小型雙足機(jī)器人。機(jī)器人在踉踉蹌蹌中逃竄、又站穩(wěn)。
逐際動(dòng)力雙足機(jī)器人
當(dāng)這臺(tái)機(jī)器人成為他們的流量密碼時(shí),很多人可能會(huì)以為,「逐際動(dòng)力」便是一家只做機(jī)器人腿的公司。這就錯(cuò)了,「逐際動(dòng)力」的創(chuàng)始人張巍認(rèn)為,他們更想做的是,“具身智能領(lǐng)域的英偉達(dá)”。
確實(shí),放眼如今灼熱的具身智能賽道,「逐際動(dòng)力」的定位很獨(dú)特。在一眾廠商講大腦的故事,甚至將VLA當(dāng)做宣傳標(biāo)語(yǔ)時(shí),張巍反而認(rèn)為,當(dāng)前具體模型性能不是最重要的。
在他看來,現(xiàn)在大腦沒有一個(gè)統(tǒng)一的技術(shù)方案,燒錢堆真機(jī)數(shù)據(jù)沒有用,從不同數(shù)據(jù)中提取對(duì)操作任務(wù)有用信息的能力才是關(guān)鍵——張巍將其稱之為,生產(chǎn)具身模型的“工業(yè)母機(jī)”。
基于這種判斷,「逐際動(dòng)力」更希望通過提供本體、小腦、模型開發(fā)工具鏈,幫助下游客戶把大腦做出來。張巍很坦誠(chéng)表示,“我們沒有那個(gè)Know-how去進(jìn)入具體的場(chǎng)景”。因此,「逐際動(dòng)力」在商業(yè)選擇上,相比大多數(shù)機(jī)器人公司像是“后退了一步”。
張巍用三個(gè)字母抽象了他們的目標(biāo)客戶畫像——“IDS”:Innovator,包括科研院所、科技公司;Developer,開發(fā)者,這部分客戶主要根據(jù)現(xiàn)有技術(shù)開發(fā)新功能;System Integrator,系統(tǒng)集成商,把已有的技術(shù)和功能整合到落地方案中。
通過這三類用戶,張巍希望「逐際動(dòng)力」服務(wù)機(jī)器人的創(chuàng)新過程,包括技術(shù)創(chuàng)新、開發(fā)創(chuàng)新、方案創(chuàng)新。
逐際動(dòng)力人形機(jī)器人 Oli
而這種商業(yè)判斷,主要源于張巍對(duì)于機(jī)器人落地現(xiàn)狀的觀察。2025年,落地是懸在大多數(shù)機(jī)器人廠商頭上的劍,大家紛紛在工廠、康養(yǎng)、零售等場(chǎng)景嘗試。張巍卻認(rèn)為,讓機(jī)器人替代人,是一件“容易讓人產(chǎn)生幻覺的事情”。
在他看來,機(jī)器人落地的軟硬件固定投入,只占整個(gè)價(jià)值鏈條的10%-20%,而后續(xù)的部署、維護(hù),才是最大的成本。
不難發(fā)現(xiàn),如今機(jī)器人行業(yè)落地的常態(tài)是,要讓一臺(tái)人形機(jī)器人替代掉一個(gè)工人,往往要“搭上幾個(gè)很牛的、算法的博士”,并且,項(xiàng)目接得越多,公司也賠得越多。張巍直言,“機(jī)器人落地的最后10%,足夠殺死前面的90%!
8月上旬,《智能涌現(xiàn)》與張巍聊了三個(gè)小時(shí)。鮮少露面的他,延續(xù)了一貫犀利的風(fēng)格,喜歡傳遞反共識(shí)的觀點(diǎn),也擅長(zhǎng)將自己的看法做高度抽象概括。
他分享了對(duì)于機(jī)器人落地的觀察、對(duì)機(jī)器人形態(tài)之爭(zhēng)的判斷、以及他對(duì)于現(xiàn)在大火的機(jī)器人大腦的看法。以下是《智能涌現(xiàn)》與張巍的對(duì)話實(shí)錄(略經(jīng)整理)。
OPEX,機(jī)器人最大的幻覺
《智能涌現(xiàn)》:你認(rèn)為機(jī)器人到現(xiàn)在還沒有真正落地,中間的卡點(diǎn)是什么?
張。我現(xiàn)在覺得具身機(jī)器人已經(jīng)落地了,星猿哲、梅卡曼德這些都是AI driven的機(jī)器人公司,人家在廠里干也干了挺長(zhǎng)時(shí)間,雖然很苦,但其實(shí)已經(jīng)落地了,他是有大腦的,只是大腦還不夠好,但他并不是純編程的東西,他有感知、有定位、有決策。
《智能涌現(xiàn)》:在您看來,所謂的落地的標(biāo)準(zhǔn)是什么?
張巍:我們自己有機(jī)器人商業(yè)化落地的判斷。讓機(jī)器人用起來是很簡(jiǎn)單的一件事,但你不要覺得它用起來就是落地了,關(guān)鍵是你要花多少精力才能用起來。更難的是,機(jī)器人能不能真正系統(tǒng)化代替我們?nèi)祟,去?shí)現(xiàn)效率的提升,成本有沒有降下來。
那么,為什么機(jī)器人落地難?原因是,大家看到機(jī)器人好像代替了一個(gè)工人,然后去算機(jī)器人的賬,計(jì)算機(jī)器人替代工人大概幾年能回本。但其實(shí)這只是冰山一角。
我覺得在整個(gè)價(jià)值鏈條里,機(jī)器人代替人,是一個(gè)容易讓人產(chǎn)生幻覺的事情,它只占整個(gè)價(jià)值鏈條的10%-20%。用機(jī)器人的本體和軟件去代替人不難,維護(hù)部署機(jī)器才是最大的成本。
機(jī)器人落地的時(shí)候,大家往往關(guān)注的是CAPEX(Capital Expenditure,資本性支出),就是固定的投入,忘了其實(shí)它的OPEX(Operating Expenditure,經(jīng)營(yíng)性支出)是最大的、是很難的。
《智能涌現(xiàn)》:機(jī)器人具體的OPEX包括什么?
張。對(duì)于維護(hù)運(yùn)營(yíng)這件事需要哪些技術(shù)變量,你要有估計(jì)和預(yù)測(cè),同時(shí)你要對(duì)這個(gè)業(yè)務(wù)非常了解。
但是現(xiàn)實(shí)是,懂業(yè)務(wù)的人不懂技術(shù),懂技術(shù)的人不懂業(yè)務(wù),所以這個(gè)估計(jì)的偏差是很大的,導(dǎo)致大家很容易Underestimate(低估)這件事。
即使機(jī)器人落地已經(jīng)達(dá)到90%了,剩下那10%可能要花一年兩年,甚至更多的時(shí)間。90%聽上去已經(jīng)挺高了,但最后那10%是殺死他的。比如要替掉一個(gè)工人,最后發(fā)現(xiàn),還要搭上幾個(gè)博士才能把他替掉,還是很牛的、懂算法的博士。
我覺得現(xiàn)在的具身大腦,是個(gè)很有價(jià)值的技術(shù)變量,但如果商業(yè)模式?jīng)]有想清楚,落地場(chǎng)景沒有搞明白,說要進(jìn)工廠里用,它連賠錢的資格都還沒有,它不是賺錢的開始,是賠錢的開始。
這是上一代機(jī)器人的教訓(xùn),搭這么多錢去維護(hù)啊,給自己耗進(jìn)去。公司接的項(xiàng)目越多,賠的越多,都是這種狀態(tài)。
和Robotaxi這件事一樣,它不是個(gè)技術(shù)問題,它的商業(yè)本質(zhì)是運(yùn)營(yíng)問題,整個(gè)商業(yè)閉環(huán)是需要很多環(huán)節(jié)的,A B C D E。A再牛,B、C、D、E不成熟也不行。
《智能涌現(xiàn)》:我們能夠看到有一些機(jī)器人公司的商業(yè)化的動(dòng)作,并不是像您提到的找到一個(gè)那么高要求的場(chǎng)景落地,而是沿途下蛋,這也是現(xiàn)在行業(yè)里面的共識(shí)嗎?
張。我覺得這么想的人是有的,但也不是全部。你對(duì)你選的場(chǎng)景的整個(gè)業(yè)務(wù)鏈條,理解要夠深,而不是技術(shù)理解,要了解技術(shù)在每個(gè)鏈條里的成熟度、稀缺性。
我覺得機(jī)器人廠商既做A又做B,各個(gè)領(lǐng)域都落地,是挺難的,因?yàn)樽詈竽且还锸且ㄙM(fèi)大量時(shí)間精力的,背后積累的門檻往往甚至比技術(shù)的門檻還要高。考驗(yàn)著行業(yè)的Know-how、行業(yè)里的地位、模型的優(yōu)勢(shì)。除非你認(rèn)為你自身的核心價(jià)值就在于,對(duì)行業(yè)紅海的深刻理解。
現(xiàn)在機(jī)器人領(lǐng)域能算過來賬的場(chǎng)景,基本都被干到紅海了,你去工廠里,凡是能自動(dòng)化的都自動(dòng)化了,剩下的好像都不是太簡(jiǎn)單的事。
逐際動(dòng)力人形機(jī)器人搬箱子
做機(jī)器人上半身,不是創(chuàng)造
《智能涌現(xiàn)》:基于這樣的商業(yè)認(rèn)知,你們?cè)趺慈ネ七M(jìn)機(jī)器人的落地?怎么應(yīng)對(duì)紅海的競(jìng)爭(zhēng)?
張。人形機(jī)器人目前看不到能立刻落地的應(yīng)用,長(zhǎng)期來講,他沒有太大的效率提升,但我覺得它是一個(gè)很重要的形態(tài),是CAPEX的最優(yōu)解。
因?yàn),任何一個(gè)專項(xiàng)的任務(wù),只要任務(wù)足夠單一、量大,一個(gè)通用的機(jī)械臂就搞定了。而從機(jī)器人誕生的那一天起,從自動(dòng)化到機(jī)器人的變革,就是從專用到通用的一個(gè)變化。
從機(jī)器人的形態(tài)上來講,我們就覺得就四類機(jī)器人:
最簡(jiǎn)單的是只有胳膊的機(jī)械臂;
第二類是,你在展會(huì)上看到的90%都是輪式加兩手臂的輪式雙臂機(jī)器人,我稱之為輪椅上的人;
第三類是真人形機(jī)器人;
第四類是沒有上半身只有腿的機(jī)器人。
輪式雙臂機(jī)器人,解決的是平地移動(dòng)的能力。機(jī)器人的“腿”,解決的是地形上的適應(yīng)能力,從A到B。
《智能涌現(xiàn)》:在形態(tài)上你們選擇的是后兩種,為什么腿那么重要?
張。我們談本體,就要談小腦和運(yùn)控。小腦和本體是耦合在一起的,沒有什么東西比機(jī)器人好做,機(jī)器人比車好做多了,但是大家做不出來的原因在于,我能不能很好地控制他。
80年代的工業(yè)機(jī)器人出來,行業(yè)里就產(chǎn)生了傳統(tǒng)的工業(yè)運(yùn)控算法,誕生了機(jī)器人的四大家族(四大家族為ABB、安川、KUKA、發(fā)那科)。
這套算法模型基于動(dòng)力學(xué)、運(yùn)動(dòng)學(xué)、解算,已經(jīng)很成熟了,套到輪式雙臂上也基本能用,因此,輪式雙臂是不需要小腦的AI化的。
我們覺得,輪式雙臂機(jī)器人和機(jī)械臂的形態(tài)是個(gè)成熟且極其卷的東西,整個(gè)技術(shù)方案是很成熟的,以前能做,現(xiàn)在也能做,只不過現(xiàn)在有這波風(fēng)潮了。這不是創(chuàng)造,而是供應(yīng)鏈邏輯。
為什么我們選擇做腿和人形?因?yàn)橥群腿诵螜C(jī)器人是新的。帶腿的人形必須實(shí)現(xiàn)小腦AI化,因?yàn)橛型刃枰胶,AI化能大大縮短整個(gè)開發(fā)周期。
逐際動(dòng)力人形機(jī)器人 Oli
《智能涌現(xiàn)》:小腦有沒有AI化,有什么樣的差別?
張巍:現(xiàn)在的小腦,無論有沒有AI化,它都是基于模型的,只不過人們使用模型的方式上產(chǎn)生了質(zhì)的變化。
早期機(jī)器人四大家族的時(shí)候,人們使用模型的方式是通過符號(hào)去理解、推導(dǎo)使用模型——人通過對(duì)事情的理解,對(duì)模型的理解,通過符號(hào)的演繹,把控制器設(shè)計(jì)出來。
到了波士頓動(dòng)力這一代,模型的使用方式變成從符號(hào)變成計(jì)算。我需要用一些優(yōu)化的方式把一個(gè)解計(jì)算出來。AI化的本質(zhì),我覺得就是在仿真器里,用模型產(chǎn)生很多的數(shù)據(jù),通過數(shù)據(jù)來去訓(xùn)練出控制器,這個(gè)是它的最本質(zhì)的變化。
現(xiàn)在的機(jī)器人大腦,大家在點(diǎn)狀嘗試各個(gè)場(chǎng)景。人形,是最能發(fā)揮大腦價(jià)值的一個(gè)形態(tài)。
《智能涌現(xiàn)》:你們的客戶是哪些,都有哪些特點(diǎn)?
張巍:我們把它分成了三部分,IDS——Innovator,這部分包括科研院所、科技公司,主要負(fù)責(zé)創(chuàng)造新技術(shù);Developer,這部分人不一般不發(fā)明新模型,他是根據(jù)現(xiàn)有技術(shù),開發(fā)新功能;第三部分是System Integrator,整合各種技術(shù)和功能,把針對(duì)某個(gè)應(yīng)用的方案做出來。
我們不服務(wù)終端用戶,我們服務(wù)的是創(chuàng)新的過程,IDS分別對(duì)應(yīng)的是,技術(shù)創(chuàng)新、開發(fā)創(chuàng)新、方案創(chuàng)新。我們是具身NVIDIA,模型不是我賺錢的方式。
《智能涌現(xiàn)》:IDS 的這套客戶體系是您什么時(shí)候思考出來的?
張巍:今年確定下來的吧。
《智能涌現(xiàn)》:我感覺你們的模式和其他人不太一樣,你們的定位更多是工具型公司。但是大家今年都在弄場(chǎng)景落地,感覺你們對(duì)于落地各個(gè)場(chǎng)景這件事上,好像會(huì)審慎一些?
張巍:不,我們也做,不過做的方式是和我們的IDS一起做。我們是沒這個(gè)Know-how去進(jìn)場(chǎng)景?梢哉f,我們比大多數(shù)機(jī)器人公司,退了一步。
在具身智能機(jī)器人的落地應(yīng)用,我們卡位底層平臺(tái),提供本體、小腦、模型開發(fā)工具鏈,對(duì)應(yīng)的是iPhone、iOS、Xcode,幫助我們的客戶開發(fā)把機(jī)器人用起來的APP,不同的APP完成不同的任務(wù),把開發(fā)者生態(tài)培養(yǎng)起來,賦能千行百業(yè)。
做機(jī)器人,別直接照搬自動(dòng)駕駛
《智能涌現(xiàn)》:現(xiàn)在機(jī)器人行業(yè)對(duì)于數(shù)據(jù)重要性的看法也并未達(dá)成一致,有的人認(rèn)為應(yīng)該在模型確定后再堆數(shù)據(jù),有的人認(rèn)為沒有數(shù)據(jù)就不可能產(chǎn)生好的機(jī)器人模型。您對(duì)于數(shù)據(jù)的判斷是什么?
張。我對(duì)于數(shù)據(jù)的判斷是,假如數(shù)據(jù)足夠多,不用爭(zhēng)論什么端到端,機(jī)器人什么任務(wù)都能做。但問題是:這個(gè)“如果”不成立。
《智能涌現(xiàn)》:這里的數(shù)據(jù),指的是真機(jī)數(shù)據(jù)嗎?
張。是有價(jià)值的數(shù)據(jù)。
《智能涌現(xiàn)》:感覺你們好像不太強(qiáng)調(diào)真機(jī)數(shù)據(jù),反而更關(guān)注仿真數(shù)據(jù)?
張。在真機(jī)上去做強(qiáng)化學(xué)習(xí),是最近比較重要的技術(shù)進(jìn)展。自動(dòng)駕駛就是相對(duì)簡(jiǎn)單的具身智能。自動(dòng)駕駛領(lǐng)域有上千萬輛車在收集數(shù)據(jù),這么多公司、這么多長(zhǎng)時(shí)間收的數(shù)據(jù),還是L2++++。
自動(dòng)駕駛是收集數(shù)據(jù)的典范,有部分人是從那個(gè)自動(dòng)駕駛思維跳過來的,但機(jī)器人不能直接 copy,因?yàn)闄C(jī)器人不是一個(gè)A到B的問題,真機(jī)收集數(shù)據(jù)的話,得雇這么多少人?用多長(zhǎng)時(shí)間?我覺得太笨了。
現(xiàn)在有很多數(shù)采工廠,建一半都不想建了,因?yàn)椴恢肋@個(gè)數(shù)據(jù)給誰,那就先建著唄。大家都是將信將疑的往前做。
我覺得真機(jī)數(shù)據(jù)非常重要,這個(gè)重要性沒有任何分歧,但是它不是未來機(jī)器人落地的變量。從成本上講,我們希望找到的技術(shù)變量是,不需要這么多真機(jī)數(shù)據(jù)。變量在哪?就是仿真數(shù)據(jù)和互聯(lián)網(wǎng)視頻數(shù)據(jù)。我希望找到的是能夠高效使用數(shù)據(jù)的方法。
《智能涌現(xiàn)》:你曾經(jīng)在一次采訪中提到要解決數(shù)據(jù)效率問題,需要把「工業(yè)母機(jī)」做出來,它具體怎么理解?
張。具身智能的核心挑戰(zhàn),其實(shí)就是如何在數(shù)據(jù)上降維打擊,找到更低成本、更高效率的生產(chǎn)模型的路徑。所有算法上的突破,本質(zhì)上都要回到一件事——降低數(shù)據(jù)的成本。
我現(xiàn)在關(guān)注的不僅是模型能做什么,而是如何讓模型以更快的速度、更低的代價(jià)被生產(chǎn)出來。我把這比喻為生產(chǎn)具身模型的“工業(yè)母機(jī)”。
它的核心任務(wù)是把數(shù)據(jù)轉(zhuǎn)化為模型,現(xiàn)在某個(gè)模型的性能跑得好不好不重要,我不著急做一個(gè)模型、去打榜,而是看能不能高效、低成本地持續(xù)生產(chǎn)模型。
在數(shù)據(jù)上,你不能指望靠堆真機(jī)數(shù)據(jù)去開發(fā)模型,那樣效率太低。開發(fā)具身大腦技術(shù),數(shù)據(jù)本身不是本質(zhì),本質(zhì)是數(shù)據(jù)背后的信息。未來潛在的低成本、高效的數(shù)據(jù)來源,一個(gè)是仿真數(shù)據(jù),一個(gè)是視頻數(shù)據(jù)。這其實(shí)是“工業(yè)母機(jī)”提高效率的最大突破口。
《智能涌現(xiàn)》:有的公司對(duì)數(shù)據(jù)有要求,比如要達(dá)到多少小時(shí),數(shù)量如何等等。您對(duì)于機(jī)器人數(shù)據(jù)具體的標(biāo)準(zhǔn)是什么?
張。我們有一個(gè)不糾結(jié)的東西,我們沒有對(duì)立數(shù)據(jù)和傳統(tǒng)的模型,我覺得模型是數(shù)據(jù)的一種蒸餾和抽象。
我的關(guān)注點(diǎn)是,機(jī)器人公司有沒有把視頻數(shù)據(jù)用起來的能力。如果你沒這能力,只會(huì)堆數(shù)據(jù)的次方,那大家都會(huì)堆,差異只是有的只能用第一視角,有的用第三視角,還有的是多視角等等。堆真機(jī)數(shù)據(jù)的要求就更低了。誰能巧妙地把這事干了,這才是我關(guān)心的。
end
end
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.