衡宇 發(fā)自 上海
量子位 | 公眾號(hào) QbitAI
智元機(jī)器人實(shí)現(xiàn)對(duì)A股科創(chuàng)板公司上緯新材63.62%的控股權(quán)后,終于來(lái)了次公開、正式的亮相。
今年3月宣布“智元機(jī)器人董事長(zhǎng)兼CEO”身份的鄧泰華,也在這場(chǎng)智元機(jī)器人首屆合作伙伴大會(huì)上首次公開亮相。
倒也沒(méi)講虛的,一股腦吐出許多外界一直想知道又不知道的東西:
- 融資這事兒智元想融就能融,年底將啟動(dòng)C輪,引入更多國(guó)際產(chǎn)業(yè)方;
- 無(wú)營(yíng)收前提下,現(xiàn)金流能撐三年;
- 今年計(jì)劃出貨幾千臺(tái),明年出貨數(shù)萬(wàn)臺(tái),未來(lái)每年出貨幾十萬(wàn)臺(tái);
- 商業(yè)落地節(jié)奏,先ToB再ToC;
- 落地場(chǎng)景選擇路徑,簡(jiǎn)單環(huán)境+簡(jiǎn)單任務(wù)→簡(jiǎn)單環(huán)境+復(fù)雜任務(wù)→復(fù)雜環(huán)境;
- 當(dāng)前主要在打基礎(chǔ)(能力、產(chǎn)品、團(tuán)隊(duì)),今年起產(chǎn)品成熟度提高,市場(chǎng)與團(tuán)隊(duì)具備基礎(chǔ),開始“逐步踩油門”;
- 智元團(tuán)隊(duì)超1000人,平均年齡31歲;
- 團(tuán)隊(duì)成員75%是研發(fā),其中2/3投入AI,1/3投入本體。
- 未來(lái)三年,投入數(shù)十億資金,孵化50個(gè)早期項(xiàng)目;
- 已投15個(gè)早期項(xiàng)目(70%孵化、30%種子/天使),年化收益8倍;
- 啟動(dòng)“智元A計(jì)劃”,三年內(nèi)打造千億級(jí)產(chǎn)業(yè)生態(tài);
- 過(guò)去銷售以直銷為主,渠道為零;今起以伙伴優(yōu)先,年內(nèi)渠道占比30%,2026年70%以上。
慷慨而談的不只有鄧泰華。
會(huì)前交流時(shí),智元機(jī)器人通用業(yè)務(wù)部總裁王闖、智元機(jī)器人合伙人&具身業(yè)務(wù)部總裁姚卯青也出面回答了許多疑問(wèn)。
我們整理其中精華,分成“吃瓜”“技術(shù)”“合作”三個(gè)板塊,與大家分享。
吃瓜部分
前段時(shí)間收購(gòu)A股上緯新材帶來(lái)一些輿論,對(duì)此有什么回應(yīng)?
姚卯青:外界有外界的解讀,我們也控制不了;其次這是一個(gè)新賽道,新生的事物是全方位需要?jiǎng)?chuàng)新的。
無(wú)論是你技術(shù)創(chuàng)新、應(yīng)用創(chuàng)新、合作模式生態(tài)的創(chuàng)新還是資本層面的創(chuàng)新,而且這個(gè)是目前國(guó)家也支持的方向,A股上市公司也有很多舊產(chǎn)能,或者說(shuō)一些落后的產(chǎn)能需要被更好的標(biāo)的去取代,這也是為什么新國(guó)六條支撐的方向。
我們也是順應(yīng)國(guó)家的引導(dǎo)能夠去更快利用資金和市場(chǎng)支持,能夠讓我們的產(chǎn)品,讓我們的研發(fā)走得更快。
我核心想給大家傳遞一個(gè)理念——經(jīng)常有人會(huì)問(wèn)到我你怎么看智元智能將來(lái)什么節(jié)奏——我最想回答的就一句話:
你不用問(wèn)我這個(gè)行業(yè)怎么看,智元決定這個(gè)行業(yè)將來(lái)發(fā)展的速度和是不是泡沫,我們做得好,這個(gè)行業(yè)就好。
外界知道智元很強(qiáng),但好像沒(méi)有特別令人印象深刻的點(diǎn)?
姚卯青:這個(gè)我來(lái)解釋一下,我們公司因?yàn)槿谫Y也非常順利,基本上不需要PR,創(chuàng)業(yè)公司但凡PR比較多可能都是為了配合自己一些融資的節(jié)奏,這個(gè)也可以理解。
我們比較專注于真正做產(chǎn)品研發(fā)落地,外部不必要的一些發(fā)聲,我們比較少去炒作也是希望這個(gè)行業(yè)大家稍微冷靜、理性一些,不要過(guò)度的膨脹,過(guò)度的去接受不應(yīng)有的熱度。
其實(shí)每個(gè)月現(xiàn)在大家看到各種什么運(yùn)動(dòng)會(huì)、展會(huì),無(wú)論對(duì)智元還是對(duì)其他一些友商都是巨大的資源消耗,投人、投設(shè)備,對(duì)正常一些研發(fā)主線的打斷,我覺(jué)得影響蠻大的,你為了展會(huì)你要做一個(gè)臨時(shí)方案,但也許不是你真正長(zhǎng)線的方案。
另一方面您剛才提到宇樹有很多運(yùn)動(dòng)控制的展示,這個(gè)確實(shí)是宇樹的強(qiáng)項(xiàng),我們公司認(rèn)為核心將來(lái)更大價(jià)值在于上肢的作業(yè)能力而不是簡(jiǎn)單的運(yùn)控,運(yùn)控很重要。
你需要穩(wěn)定的運(yùn)動(dòng)、移動(dòng)才能配合高效作用,但我們覺(jué)得僅僅有這個(gè)是不夠的,我們需要真正把更難問(wèn)題作業(yè)操作的問(wèn)題去解決。
這個(gè)操作問(wèn)題就是一個(gè)比運(yùn)動(dòng)控制難兩個(gè)數(shù)量級(jí),難100倍以上的問(wèn)題,你需要去沉下心來(lái)花很長(zhǎng)時(shí)間從你的硬件到算法到數(shù)據(jù)真正去持續(xù)打磨。
不太可能說(shuō)我每個(gè)月,每幾天就能發(fā)各種Demo,或者說(shuō)買了你機(jī)器的客戶隨便倒騰倒騰就能發(fā)很多Demo,一定是我們要以從基礎(chǔ)設(shè)施、工程、算法、前沿能力,非常完整的團(tuán)隊(duì)沉下心來(lái)花一年,甚至兩年時(shí)間,而且要跟我們的行業(yè)合作伙伴真正懂行業(yè)的伙伴在一起去埋頭打磨的事情。
大家也不用擔(dān)心下半年我們會(huì)陸陸續(xù)續(xù)發(fā)布很多行業(yè)應(yīng)用震撼的展示,真正讓大家看到機(jī)器人不僅僅能夠提供情緒價(jià)值、文娛價(jià)值,它也最終會(huì)解決生產(chǎn)力問(wèn)題。
為什么沒(méi)參加世界機(jī)器人大會(huì)和世界人形機(jī)器人運(yùn)動(dòng)會(huì)?
姚卯青:機(jī)器人行走是為了展示我們產(chǎn)品的穩(wěn)定性和成熟度,因?yàn)楝F(xiàn)在大家也知道包括之前馬拉松比賽,或者是一些運(yùn)動(dòng)會(huì)很容易出現(xiàn)一些機(jī)器人短時(shí)間運(yùn)動(dòng)之后過(guò)溫需要歇息,甚至換機(jī)器的情況。
我們是展示24小時(shí)又是在極端“秋老虎”非常熱的情況下能夠進(jìn)行持續(xù)行走,這充分證明我們是通過(guò)量產(chǎn)的積累已經(jīng)達(dá)到產(chǎn)品相對(duì)成熟穩(wěn)定,可以在真實(shí)場(chǎng)景去持續(xù)作業(yè)的效果。
至于機(jī)器人運(yùn)動(dòng)會(huì)這塊兒:
一方面是我們也在準(zhǔn)備我們的伙伴大會(huì),所有的設(shè)備、人員可能都集中在準(zhǔn)備活動(dòng)中;另一方面,我們也是認(rèn)為應(yīng)該更多展示一些真正在客戶場(chǎng)景可能會(huì)使用到的工況,比如說(shuō)持續(xù)行走等很多。
其實(shí)人形機(jī)器人在客戶現(xiàn)場(chǎng)也做不了跳高,或者說(shuō)去做百米沖刺,這個(gè)也不安全,我們也是更務(wù)實(shí)一些的做法。
技術(shù)部分
遠(yuǎn)征A2 24小時(shí)高溫行走意味著什么?
王闖:技術(shù)層面有幾點(diǎn)突破——
第一,目前我們看到機(jī)器人還是遙控為主,但我們希望機(jī)器人變成無(wú)限的生產(chǎn)力。
變成無(wú)限生產(chǎn)力第一步就是它能夠完全自主,移動(dòng)這方面應(yīng)該能自主,自主移動(dòng)我們已經(jīng)開發(fā)了半年多,這次直播24小時(shí)覆蓋了從白天到黑夜再到白天一個(gè)完整的循環(huán),它有強(qiáng)光環(huán)境、逆光環(huán)境,好多時(shí)候傳感器會(huì)出各種各樣的問(wèn)題,必須把這些問(wèn)題都解決的比較好,機(jī)器人才能在各種不同光線環(huán)境變化下穩(wěn)定的工作。所以自主移動(dòng)帶導(dǎo)航避障是第一點(diǎn)比較有突破的。
第二,我們直播那天室外最高溫度達(dá)到了37℃,地面到61℃。
在這么高的溫度下攝影師還有現(xiàn)場(chǎng)的工作人員都非常難以承受。大家開玩笑說(shuō)如果在室外有個(gè)交警站崗的話可能過(guò)不了多久就得輪班,因?yàn)槟翘鞂?shí)在太熱了。
包括今天也是天氣差不多,機(jī)器人全程24小時(shí)自己獨(dú)立完成的,它沒(méi)有任何休息,中間不停的給它換電,攝影師總共輪換了73人次,每走一會(huì)攝影師已經(jīng)熱的受不了就換人下去休息。我們可以想見一下這個(gè)突破,機(jī)器人在某些極端環(huán)境下的適應(yīng)能力某種意義上超越人了,在這種暴曬高溫下。
酷熱環(huán)境這種極端環(huán)境下,可以在交通崗?fù)げ家恍C(jī)器人做交通的指揮。這些應(yīng)用可以逐漸做起來(lái),在這種嚴(yán)苛的環(huán)境下工作的突破也是其中一個(gè),也是目前大家還沒(méi)有做到的。
第三,我們展示了機(jī)器人的可靠性。
大家也知道人形機(jī)器人要持續(xù)保持穩(wěn)定是非常難的,我們自己在實(shí)驗(yàn)室已經(jīng)測(cè)了連續(xù)行走3千小時(shí),上次批量的測(cè)我們定了一個(gè)標(biāo)準(zhǔn)360小時(shí)沒(méi)有任何摔倒的異常,目前已經(jīng)完成了,現(xiàn)在正在做720小時(shí),這是很多臺(tái)一起做。
今天這個(gè)展示是研發(fā)過(guò)程很小的縮影,我們研發(fā)過(guò)程已經(jīng)跑了360現(xiàn)在正在測(cè)720,24小時(shí)只是它很小的,我們只是拎出了其中兩臺(tái),剪了其中24小時(shí)的縮影給大家看,但敢直播我認(rèn)為這就是一個(gè)突破,因?yàn)槟氵B續(xù)走24個(gè)小時(shí)不知道會(huì)出什么各種各樣的異常,過(guò)程中也有很多小孩干擾它,過(guò)程中晚上還有些貓出現(xiàn),機(jī)器人都能夠運(yùn)行的比較好。
第四,大家都沒(méi)有注意到的,機(jī)器人在走的過(guò)程中有很多講解的任務(wù),機(jī)器人任務(wù)部署特別方便,大概5分鐘可以完成一個(gè)新任務(wù)的部署,而且機(jī)器人講解的臺(tái)詞5分鐘可以隨便改知識(shí)庫(kù)讓機(jī)器人講不同的東西。
這是我們做展廳講解接待對(duì)客戶特別重要的東西,因?yàn)樗v的內(nèi)容還有走的動(dòng)線會(huì)經(jīng)常變,如果這個(gè)門檻很高很難推廣。
世界模型可以多大程度替代真機(jī)訓(xùn)練?
(注:7月27日,智元發(fā)布首個(gè)動(dòng)作驅(qū)動(dòng)世界模型開源平臺(tái)Genie Envisioner)
姚卯青:首先Google的世界模型Genie3,它其實(shí)是現(xiàn)在在一些類似游戲、影視這樣一些行業(yè)應(yīng)用場(chǎng)景里面能夠交互式的生成。
我們的世界模型其實(shí)從打的理念上來(lái)講是差不多的,能夠在用戶指定的提示下去生成一個(gè)非常自洽的符合物理規(guī)律的對(duì)未來(lái)的預(yù)測(cè)。
區(qū)別在于可能大家面向的一些應(yīng)用不大一樣,我們更多是面向機(jī)器人的一些作業(yè)的場(chǎng)景,所以它會(huì)生成很多機(jī)器人自己第一人稱視角的一些畫面,同時(shí)它的畫面里面的一些內(nèi)容是一些機(jī)器人的手部和物體強(qiáng)交互這種操作的過(guò)程。
我們這個(gè)世界模型其實(shí)它是在一些現(xiàn)有的視頻生成類的模型的基礎(chǔ)上,應(yīng)用3000多小時(shí)真實(shí)機(jī)器人作業(yè)數(shù)據(jù)去進(jìn)行二次訓(xùn)練才得到的,所以其實(shí)它也可以從某種程度上理解為就是一個(gè)真機(jī)訓(xùn)練。
它提供和帶來(lái)的能力跟VLA模型里面預(yù)訓(xùn)練是比較相似的,真正我們要做一些特定問(wèn)題和特定任務(wù)的時(shí)候,其實(shí)也要在這個(gè)基礎(chǔ)之上再去采集一定量的后訓(xùn)練的數(shù)據(jù)對(duì)它進(jìn)行最終落地前的第三階段訓(xùn)練。
數(shù)據(jù),現(xiàn)在對(duì)于行業(yè)是什么情況?
姚卯青:行業(yè)現(xiàn)在確實(shí)是在數(shù)據(jù)非常早期的階段,這也是我們當(dāng)時(shí)和杭州灣具身智能創(chuàng)新中心合作非常重要的出發(fā)點(diǎn),希望能夠不僅僅是在智元自己內(nèi)部,而且能夠在全國(guó)各地聯(lián)合很多行業(yè)和地方的合作伙伴,大家把數(shù)據(jù)的規(guī)模、采集、生產(chǎn)、檢驗(yàn)一些標(biāo)準(zhǔn)化動(dòng)作能夠做出來(lái)形成一套非常能夠大規(guī)模復(fù)制產(chǎn)業(yè)化的效應(yīng)。
現(xiàn)階段來(lái)講,我們也確實(shí)看到隨著我們?nèi)ツ昴甑譇giBot World數(shù)據(jù)集的發(fā)布,大家對(duì)數(shù)據(jù)已經(jīng)看到它的重要性,特別是高質(zhì)量數(shù)據(jù)的重要性。
所以陸陸續(xù)續(xù)在過(guò)去的半年中很多一些場(chǎng)景的客戶,一些特定行業(yè)的客戶,他們都在快速的向我們提一些面向真實(shí)場(chǎng)景數(shù)據(jù)的需求。這些需求我覺(jué)得都是代表真實(shí)應(yīng)用案例也非常好能夠幫我們?nèi)ヂ姆e累,我們的數(shù)據(jù)集不斷的擴(kuò)充。
現(xiàn)在像這類數(shù)據(jù)大規(guī)模的標(biāo)準(zhǔn)化生產(chǎn)和檢驗(yàn)標(biāo)注的環(huán)節(jié)也是已經(jīng)充分和創(chuàng)新中心的伙伴一起聯(lián)合往前推進(jìn)。
從這個(gè)角度來(lái)講,我還是比較樂(lè)觀的,我們應(yīng)該是能夠在未來(lái)1-2年時(shí)間之內(nèi)為整個(gè)具身智能產(chǎn)業(yè)去快速積累大量的真實(shí)數(shù)據(jù),在2年內(nèi)我覺(jué)得有希望能夠達(dá)到現(xiàn)在大語(yǔ)言模型他們所應(yīng)用的規(guī)模,真正給我們帶來(lái)具身智能GPT這種涌現(xiàn)時(shí)刻,它需要有這樣一個(gè)數(shù)據(jù)來(lái)做其背后重要的保證。
至于真機(jī)數(shù)據(jù)和仿真數(shù)據(jù),首先我們認(rèn)為對(duì)于機(jī)器人的作業(yè)來(lái)講真實(shí)數(shù)據(jù)一定是價(jià)值最高也是最重要的,因?yàn)槲锢硎澜缡且粋€(gè)復(fù)雜的系統(tǒng),跟不同機(jī)器人本體以及不同物體、資產(chǎn)去交互的話,背后所蘊(yùn)含的物理規(guī)律、物理約束限制是非常豐富,這樣一個(gè)復(fù)雜系統(tǒng)來(lái)講很難被抽象的建模東西去完美的替代。
我們同時(shí)也非常認(rèn)可仿真和生成式AI等等一些能力,能夠把我們有限真實(shí)數(shù)據(jù)去發(fā)揮更大的作用,能夠通過(guò)一些數(shù)據(jù)增廣的手段,從背景、環(huán)境、數(shù)字資產(chǎn)等等,包括光照等維度去做最大限度的泛化。
因?yàn)闄C(jī)器人泛化性是很重要的能力,是區(qū)別于原來(lái)工業(yè)自動(dòng)化的能力,能夠適應(yīng)動(dòng)態(tài)的變化環(huán)境,仿真還有像AIGC的一些能夠把我們真機(jī)采集到的數(shù)據(jù)去做很多維度的增廣。
同時(shí)像仿真的環(huán)境也能原生的讓我們?cè)诶锩嫒ゲ杉芏嗄軌虮贿M(jìn)行模擬,進(jìn)行抽象的動(dòng)作類型,比如說(shuō)一些固體簡(jiǎn)單的抓放、擺放,其實(shí)在很大程度上確實(shí)是可以被模擬的。
但是也有很多作業(yè)過(guò)程,柔性物體,流體,強(qiáng)需要摩擦力、觸覺(jué)、力覺(jué)的反饋,這些相對(duì)來(lái)講現(xiàn)在是很難在仿真引擎里面去精確建模的,這也是當(dāng)今一個(gè)比較前沿,可能還沒(méi)有到完全產(chǎn)業(yè)應(yīng)用,但還是一個(gè)從行業(yè)、從國(guó)家都比較關(guān)注的前沿學(xué)科。
如何做高性能物理仿真器,這也可能是從自主可控角度來(lái)講不會(huì)完全依賴國(guó)外一些技術(shù)。
從技術(shù)的角度來(lái)講異構(gòu)數(shù)據(jù)是可以被共同利用起來(lái)的,而且我們?cè)诮趯W(xué)術(shù)論文上也已經(jīng)充分驗(yàn)證這樣一種可能性。
但現(xiàn)在階段從我們視角來(lái)看數(shù)據(jù)的質(zhì)量問(wèn)題可能是更需要被先解決的。
在大模型技術(shù)背景下面,大家拼的就是數(shù)據(jù)質(zhì)量、數(shù)據(jù)配方、數(shù)據(jù)工程能力,好的數(shù)據(jù)決定模型上限,差的數(shù)據(jù)決定模型會(huì)有比較差的表現(xiàn)。
有個(gè)概念叫數(shù)據(jù)金字塔。
數(shù)據(jù)從它的量、它的質(zhì)量、它的可用性、對(duì)模型的最終價(jià)值來(lái)講,都是存在這樣一個(gè)金字塔效應(yīng)。
底座我們可以定義為是可以大量獲取的低成本的一些數(shù)據(jù),塔尖就是一些高成本獲取的,數(shù)據(jù)量相對(duì)來(lái)講最少的數(shù)據(jù),不同的金字塔的部分對(duì)整個(gè)具身模型的作用也是不同的。
互聯(lián)網(wǎng)的視頻數(shù)據(jù),其實(shí)我們整體來(lái)看是在偏金字塔的中下基座的位置,通過(guò)這些海量的低成本的數(shù)據(jù),確實(shí)可以在第一階段或者是預(yù)訓(xùn)練的階段,確實(shí)可以給視覺(jué)編碼器或者是視覺(jué)語(yǔ)言基礎(chǔ)模型,以及我們一些影視的動(dòng)作理解提供一個(gè)很好的基礎(chǔ)。
這個(gè)也是我們今年3月份發(fā)布的基座模型GO1里提到的一個(gè)概念,我們?cè)谝浑A段的自監(jiān)督生成式預(yù)訓(xùn)練階段用到了互聯(lián)網(wǎng)的數(shù)據(jù),用到了人的第一視角操作數(shù)據(jù),在這些數(shù)據(jù)基礎(chǔ)上我們其實(shí)可以學(xué)成一種通用的對(duì)動(dòng)作的理解和表達(dá),它是一種無(wú)關(guān)人或者機(jī)器人,或者是哪一個(gè)機(jī)器人,對(duì)動(dòng)作的一種通用的描述。
在這個(gè)基礎(chǔ)之上,我們也需要繼續(xù)往塔尖,無(wú)論是仿真里特定機(jī)器人的操作數(shù)據(jù),還是我們?cè)谒獾恼鏅C(jī)的在真實(shí)物理世界里面采集到的機(jī)器人數(shù)據(jù),對(duì)特定場(chǎng)景進(jìn)行最終的微調(diào),走完所謂的最后一公里。
會(huì)不會(huì)摒棄激光雷達(dá)路線,用純視覺(jué)解決所有問(wèn)題?
王闖:不用激光雷達(dá)的原因可能因?yàn)樗杀颈容^高,但在中國(guó)激光雷達(dá)現(xiàn)在越做越便宜,它在機(jī)器人里并不算很貴的零部件。
你可以想象一個(gè)東西,有的汽車裝的安全氣囊更多,有的汽車少一點(diǎn),為什么有的裝更多,可能一輩子都不一定用的到,但它是一個(gè)冗余的安全器件,我覺(jué)得激光雷達(dá)就是這樣一個(gè)冗余的安全器件。
視覺(jué)這個(gè)東西本身沒(méi)有距離的幀值,可能用在汽車上,汽車的任務(wù)就是盡可能不與周圍的東西發(fā)生碰撞,所以距離的誤差大一點(diǎn)也不是什么太大的問(wèn)題,不發(fā)生碰撞就可以了。
但機(jī)器人必須要跟物體發(fā)生接觸,因?yàn)槿祟悓?duì)機(jī)器人的需求要做各種各樣的操作,要跟人貼著相處,跟人貼身相處。
這樣的東西我們希望它本身的感知能力越強(qiáng)越好,尤其對(duì)距離精準(zhǔn)的把握越強(qiáng)越好,激光雷達(dá)畢竟是利用光TOF的原理精確測(cè)量距離,它的距離是一手的信息不是通過(guò)視覺(jué)反算的間接信息。
我們覺(jué)得激光雷達(dá)我現(xiàn)在能看到的不需要把它去掉,從成本上不需要,從安全上有更高的安全維度,所以我們目前不希望把它去掉。
視覺(jué)我們也投入挺大,最開始用激光SLAM,后來(lái)發(fā)現(xiàn)激光SLAM有很多它的劣勢(shì)場(chǎng)景,比如像人遮擋很多的時(shí)候,我們現(xiàn)在有V-SLAM作為補(bǔ)充,這個(gè)月的版本上就上了一些視覺(jué)的SLAM做補(bǔ)充,讓它的定位更穩(wěn)定。
并不是說(shuō)我們用激光雷達(dá)我們?cè)谝曈X(jué)上就不投入,相反我們視覺(jué)和激光雷達(dá)覆蓋得更全。
硬件是不是人形機(jī)器人當(dāng)前的Challenge?
王闖:我不同意說(shuō)硬件不是瓶頸。
我們?nèi)绻涯繕?biāo)定成機(jī)器人要像人一樣有人的能力,那機(jī)器人跟人硬件瓶頸差距太大了。
比如人有全身的觸覺(jué),這是特別有用又非常難的;現(xiàn)在機(jī)器人連手上的觸覺(jué)都沒(méi)有做的非常好,像我們剛剛發(fā)布的剛剛才開始用起來(lái),還沒(méi)有到大規(guī)模應(yīng)用的程度。
比如機(jī)器人各方面硬件的性能我認(rèn)為現(xiàn)在也還是不夠的,比如每個(gè)關(guān)節(jié)都要帶非常靈敏的力的感知,長(zhǎng)時(shí)間使用都是很可靠的,這些方面硬件也都有很多問(wèn)題。
另外像機(jī)器人硬件的安全性,我認(rèn)為很多安全的冗余還有對(duì)周圍環(huán)境、人的防護(hù)硬件上的東西也都還不夠,所以我覺(jué)得硬件上的瓶頸也很多,當(dāng)然軟件算法上的瓶頸也是非常大的。
所以具身智能是你必須把全棧能力建起立,硬件和軟件算法協(xié)同的進(jìn)化而不是某個(gè)方面已經(jīng)夠用了,我們實(shí)際落地的時(shí)候肯定比較務(wù)實(shí),今年它是個(gè)什么水平我們就選什么樣的場(chǎng)景。
我剛才說(shuō)的送到外太空,這是個(gè)理想它還是非常遙遠(yuǎn)的,比如到外太空可能動(dòng)不動(dòng)零下一兩百度,現(xiàn)在的硬件肯定是很大的瓶頸。
現(xiàn)在機(jī)器人能使用的溫度范圍跟汽車比差很大,汽車一般負(fù)40到85度,機(jī)器人全身的零部件大部分都到不了這個(gè)水平,我認(rèn)為硬件上還有很多問(wèn)題。
內(nèi)外部合作
智元內(nèi)部三大業(yè)務(wù)線,彼此獨(dú)立還是存在密切合作和共享?
王闖:我們公司有個(gè)平臺(tái)管理部,平臺(tái)研發(fā)部門對(duì)外露出的比較少,平臺(tái)研發(fā)部像硬件、ID設(shè)計(jì)、關(guān)節(jié)這些東西都放在平臺(tái)做,所以有很多這些能力在復(fù)用,包括后面我們希望更多的東西逐漸能夠復(fù)用性變的非常強(qiáng)。
通用產(chǎn)品線和靈犀產(chǎn)品線都在做人形,一個(gè)大人形一個(gè)小人形,現(xiàn)在復(fù)用率相對(duì)來(lái)說(shuō)更高一點(diǎn),包括內(nèi)部有已經(jīng)開源了的AMRT,還有嵌入式底層搞了一AimIO,可以隨便換一個(gè)芯片都能很快接入進(jìn)來(lái),這些我們都復(fù)用。
復(fù)用的還有任務(wù)編排、客戶端界面、靈巧手。
后面會(huì)讓平臺(tái)化做得越來(lái)越好,提高整體研發(fā)效率。
現(xiàn)在分成各個(gè)業(yè)務(wù)部門因?yàn)槲覀冇胁煌a(chǎn)品的形態(tài),不同的產(chǎn)品形態(tài)總要有人把它設(shè)計(jì)出來(lái),把各種可靠性驗(yàn)證的比較好,同時(shí)也要考慮它的商業(yè)化,它的特點(diǎn)還是不太一樣。
比如大人形和小人形有些場(chǎng)景是一樣的,但也有些場(chǎng)景是不同的,希望這一個(gè)業(yè)務(wù)部門可以從研發(fā)到生產(chǎn)、銷售,到商業(yè)的閉環(huán)整個(gè)業(yè)務(wù)負(fù)責(zé)起來(lái)。
為什么和上市公司密集合作?
(注:杭州灣具身智能創(chuàng)新中心總經(jīng)理殷哲現(xiàn)場(chǎng)回答媒體提問(wèn)時(shí)也談到,智元當(dāng)初選擇和上虞區(qū)作為合作伙伴,原因之一就是因?yàn)檫@個(gè)地區(qū)有21家A股上市的公司)
姚卯青:其實(shí)跟上市公司合作也非常的簡(jiǎn)單,因?yàn)槲覀冎窃€是一家初創(chuàng)企業(yè),我們自己從公司的定位來(lái)講也是在做通用機(jī)器人平臺(tái),無(wú)論是標(biāo)準(zhǔn)的硬件產(chǎn)品,還是通用的應(yīng)用開發(fā)、軟件平臺(tái)、算法基座,這樣一個(gè)定位和公司發(fā)展階段來(lái)講也決定我們不可能自己下場(chǎng)去干所有的行業(yè)。
從頭到尾端到端一條龍自己全部干完,但凡做過(guò)工業(yè),做過(guò)一些行業(yè)應(yīng)用的朋友應(yīng)該深有體會(huì),做項(xiàng)目是一個(gè)非常吃資源、吃人的事情,你一個(gè)項(xiàng)目就有很多人要投進(jìn)去做開發(fā)、集成、交付、售后,這也是為什么我們需要去聯(lián)合伙伴一起做。
上市公司在這里面無(wú)論是本身資金和人才儲(chǔ)備,對(duì)行業(yè)多年的積累,對(duì)行業(yè)的理解,以及很多上市公司希望能夠在人工智能和具身智能時(shí)代做二次曲線去擁抱新質(zhì)生產(chǎn)力的角度來(lái)講,大家是有一個(gè)很好的互補(bǔ)作用。
我覺(jué)得更多是智元能夠把自己標(biāo)準(zhǔn)化產(chǎn)品、硬件打造好,做到能夠在行業(yè)應(yīng)用的穩(wěn)定性、耐久性、一致性。
同時(shí)能夠把我們?nèi)蝾I(lǐng)先的人工智能基座能夠封裝好提供出來(lái),在行業(yè)伙伴應(yīng)用的時(shí)候能夠以一種低門檻、低代碼,很友好的方式。
比如說(shuō)通過(guò)一些行業(yè)數(shù)據(jù)能夠增量去模型進(jìn)行訓(xùn)練,快速的用我們的工具鏈SDK去部署,這樣的方式去行業(yè)落地。
今年出海規(guī)劃?
王闖:我們今年出海主要是兩方面。
一是,以科研教育為主。
科研教育跟北美的合作比較多,前面也發(fā)布了跟英偉達(dá)、Skill AI的一些合作,這主要在數(shù)據(jù)驅(qū)動(dòng)方面,國(guó)外學(xué)術(shù)界的資源還是比較好的,這塊也能夠促進(jìn)具身智能技術(shù)的發(fā)展。
二是,以商業(yè)為主。
商業(yè)我們目前有幾個(gè)重點(diǎn)想做的區(qū)域:東南亞、日韓、中東,現(xiàn)在進(jìn)展比較好的東南亞會(huì)更快一點(diǎn),今天來(lái)簽約的伙伴有個(gè)是馬來(lái)西亞的i-city,它之前是做主題樂(lè)園的,現(xiàn)在希望拿出一個(gè)比較大的廳布各種各樣機(jī)器人的體驗(yàn)還有互動(dòng)游戲。
我們覺(jué)得機(jī)器人今年比較大的機(jī)會(huì)在展廳的講解接待還有文娛表演,我們會(huì)傾向于選擇本來(lái)就有產(chǎn)業(yè)基礎(chǔ)的合作伙伴。
工業(yè)場(chǎng)景里把ROI控制在3以內(nèi)需要多久?
王闖:在綿陽(yáng)可能三年,在上??赡軆赡昃褪栈爻杀?,到海外的話可能一年就收回成本。
我們?yōu)槭裁聪仍诰d陽(yáng),因?yàn)猷囍魅?em>(富臨精工工程中心主任兼事業(yè)部總監(jiān)鄧揚(yáng))那邊和我們關(guān)系是非常好的,大家的配合效率非常高。
剛開始去的時(shí)候我記得今年年初料箱轉(zhuǎn)運(yùn)跑通搬一個(gè)箱子,完成一個(gè)循環(huán)是160秒;去鄧主任那邊是50、60秒,又調(diào)了一個(gè)多月,直播時(shí)40秒。鄧主任說(shuō)工人通常要到30秒以內(nèi)。
大家可以看到這逐步在優(yōu)化,需要配合度很高的客戶和我們一起在現(xiàn)場(chǎng)做各種各樣的優(yōu)化。
我們希望最終能優(yōu)化到比人還要好,同時(shí)它的成本要快速下降,這個(gè)成本像鄧主任說(shuō)的,他們自己生產(chǎn)電關(guān)節(jié),機(jī)器人里最多的就是關(guān)節(jié),一個(gè)機(jī)器人好幾十個(gè)關(guān)節(jié),這個(gè)成本如果能用上富臨的本身成本就控制的比較好,這個(gè)機(jī)器人成本也能下降。
我相信它的發(fā)展速度在未來(lái)一年兩年會(huì)有突飛猛進(jìn)的變化,過(guò)去幾個(gè)月大家可以想象下從160秒逐漸優(yōu)化到40秒的節(jié)拍,而且成功率從最開始只有百分之六七十現(xiàn)在99.9%,希望大家能夠持續(xù)關(guān)注相信它未來(lái)的進(jìn)步。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.