作者:毛爍
人形機(jī)器人的“下一公里”,是單點(diǎn)算力的競(jìng)賽,更是確定性的系統(tǒng)工程!
2025 年,“具身智能”持續(xù)從“展臺(tái)”推向“實(shí)盤(pán)”。Figure AI推出了自研的VLA 模型 Helix,讓人形機(jī)器人具備了端到端的自主推理能力;特斯拉Optimus繼續(xù)高頻迭代,實(shí)測(cè)性能不斷刷新;同時(shí),中國(guó)的“新銳力量”Engine AI也在算法與硬件的深度整合上取得進(jìn)一步突破....
01 黃仁勛的“禮物”:Jetson Thor讓機(jī)器人穩(wěn)健“步入”物理世界
如今,通用人形機(jī)器人產(chǎn)業(yè)離真正意義上的“iPhone 時(shí)刻”又近了一步。但是,與其他通用技術(shù)一樣,越接近“通用化”的最后一公里,技術(shù)鴻溝反而愈發(fā)清晰。物理世界的非結(jié)構(gòu)化場(chǎng)景、多模態(tài)任務(wù)深度耦合,以及推理與控制鏈路上的異構(gòu)延遲,正在把傳統(tǒng)算力架構(gòu)逼向極限。
其實(shí),對(duì)人形機(jī)器人而言,其商業(yè)化落地普及的關(guān)鍵技術(shù)問(wèn)題并不僅僅在于“大模型”,更在于其“身處”多頻域閉環(huán)中,能否“穩(wěn)定”。
用一句從業(yè)者的戲謔:“走都走不穩(wěn),還談什么商用呢?”
所以,人形機(jī)器人要在“穩(wěn)定”這條路站得住腳,才談得上落地應(yīng)用。從背后的實(shí)現(xiàn)上看,在真實(shí)的物理世界中,人形機(jī)器人每一次機(jī)械步伐背后,其實(shí)都隱藏著一套完整的思維鏈閉環(huán)——感知、推理、規(guī)劃、執(zhí)行四個(gè)階段:
在多模態(tài)感知(Perception)階段,人形機(jī)器人的頭部、胸部、腿部的多組攝像頭、激光雷達(dá)、觸覺(jué)傳感器將不斷生成海量異構(gòu)數(shù)據(jù),需要毫秒級(jí)融合,構(gòu)建 360°的全息環(huán)境識(shí)別。
高階推理(Reasoning)階段,要有效處理模糊指令。例如人形機(jī)器人接到“拿一下桌上的紅色蘋(píng)果”這一指令,其就需要調(diào)用大模型來(lái)完成語(yǔ)義解析、視覺(jué)識(shí)別與路徑規(guī)劃。而這一過(guò)程往往是“慢思考”(System2)過(guò)程,需要在數(shù)百毫秒至數(shù)秒內(nèi)完成。
在實(shí)時(shí)規(guī)劃(Planning)階段,人形機(jī)器人理解指令后,其須以每20~50毫秒一次高頻率生成運(yùn)動(dòng)軌跡,保證避障與抓取動(dòng)作的連續(xù)與平穩(wěn)。
而即時(shí)驅(qū)動(dòng)(Actuation)階段,則需要人形機(jī)器人的關(guān)節(jié)電機(jī)的伺服指令,以數(shù)百至上千赫茲下發(fā),支撐行走、抓取等動(dòng)態(tài)動(dòng)作。
從“慢思考”到“快反應(yīng)”(快思考,System1),要想讓人形機(jī)器人滿足“穩(wěn)定”的需求,就需要讓四個(gè)階段在同一算力架構(gòu)上高效并行,實(shí)現(xiàn)毫秒級(jí)確定性,嚴(yán)格控制任何延遲和抖動(dòng)。因?yàn)?,一旦某一環(huán)節(jié)失衡,系統(tǒng)穩(wěn)定性就會(huì)被拖垮,輕則動(dòng)作遲緩、路徑偏移,重則機(jī)器人直接“失能”。
但是,如果把大部分推理過(guò)程都遷移到云端,“云邊通信”的延遲和不穩(wěn)定鏈路所產(chǎn)生風(fēng)險(xiǎn)或?qū)⒊杀斗糯蟆6?,如果在隧道、地下室等弱信?hào)的現(xiàn)實(shí)場(chǎng)景中,人形機(jī)器人甚至將因通信問(wèn)題徹底“癱瘓”。
所以,打造真正面向規(guī)?;虡I(yè)“人形機(jī)器人大腦”,就需要在邊緣側(cè)實(shí)現(xiàn)從大模型推理的毫秒級(jí)控制和全鏈路中確定性的高性能算力支撐。
而就在行業(yè)對(duì)“邊緣確定性”探索陷入瓶頸的當(dāng)口,NVIDIA創(chuàng)始人、CEO黃仁勛在一份禮物的賀卡上,留下一句話——“致機(jī)器人:好好享受你的新大腦吧!”
于是,8月25 日,NVIDIA Jetson AGX Thor(以下稱(chēng)Jetson Thor)開(kāi)發(fā)者套件和量產(chǎn)級(jí)模組,正式發(fā)布,開(kāi)發(fā)者套件售價(jià)為3,499美元。作為專(zhuān)為物理AI和人形機(jī)器人打造的“全棧大腦”,Jetson Thor正通過(guò)底層架構(gòu)的演進(jìn),解決推理與控制的全鏈路問(wèn)題,讓“慢思考”與“快反應(yīng)”協(xié)同并行工作,打造出具身智能效率與穩(wěn)定性的“更優(yōu)解”。
截取自NVIDIA官方微博
黃仁勛表示:“Jetson Thor 專(zhuān)為全球數(shù)百萬(wàn)開(kāi)發(fā)者打造,助力他們構(gòu)建可與物理世界交互、甚至改變物理世界的機(jī)器人系統(tǒng)。它具備無(wú)與倫比的性能與能效,還能夠在邊緣設(shè)備上同時(shí)運(yùn)行多個(gè)生成式AI模型。作為一款卓越的超級(jí)計(jì)算機(jī),Jetson Thor 正致力于推動(dòng)物理 AI 與通用機(jī)器人時(shí)代真正到來(lái)。”
截取自NVIDIA官方微博
02 “雷神”加冕:Jetson Thor塑造人形機(jī)器人“思想副本”
Jetson Thor的命名,源自“雷神索爾”,其性能也確實(shí)是“雷霆萬(wàn)鈞”。相較于上一代廣受好評(píng)的Jetson AGX Orin,Jetson Tho在邊緣AI算力上實(shí)現(xiàn)了“跨代”的躍升。
根據(jù)NVIDIA官網(wǎng)數(shù)據(jù)顯示,Jetson Thor系列模組可提供高達(dá)2070 TFLOPS(FP4)的AI 計(jì)算性能,配備最高128 GB顯存,功率可在40W~130W之間靈活配置。這一性能意味著,Jetson Thor的AI計(jì)算能力比 AGX Orin 提升了7.5 倍,能效提升至3.5 倍,在處理生成式 AI及大型Transformer模型時(shí),擁有了顯著的實(shí)時(shí)處理優(yōu)勢(shì)。
這樣的性能飛躍,進(jìn)一步擴(kuò)展了人形機(jī)器人系統(tǒng)在復(fù)雜環(huán)境下的自主決策和多模態(tài)感知能力,使邊緣AI從“輔助工具”躍升為真正的“智能大腦”。
Jetson Thor(開(kāi)發(fā)者套件)提供Jetson T5000(旗艦級(jí))和Jetson T4000(高階性能)兩款核心模塊。
截取自NVIDIA官網(wǎng)
T5000模塊集成了擁有2560個(gè)CUDA核心和96個(gè)第五代Tensor Core,可提供高達(dá)2070 TFLOPS的AI算力,并與強(qiáng)大的14核Arm Neoverse-V3AE CPU協(xié)同工作。
截取自NVIDIA官網(wǎng)
如此強(qiáng)大的計(jì)算引擎,使其能夠輕松在邊緣側(cè)原生運(yùn)行多模態(tài)的(VLA)基礎(chǔ)模型,為人形機(jī)器人賦予前所未有的自主推理與交互能力。
更關(guān)鍵的是,其多實(shí)例GPU(MIG)技術(shù)可劃分多達(dá)10個(gè)獨(dú)立的硬件分區(qū),這意味著T5000不僅能承載最復(fù)雜的AI“慢思考”任務(wù),還能同時(shí)為多個(gè)毫秒級(jí)的運(yùn)動(dòng)控制“快反應(yīng)”任務(wù)提供硬件級(jí)的確定性保障,是構(gòu)建真正通用、穩(wěn)定的人形機(jī)器人和L5級(jí)自動(dòng)駕駛系統(tǒng)的理想計(jì)算核心。
而Jetson T4000模塊則為高性能機(jī)器人市場(chǎng)提供另一個(gè)極具吸引力的選擇,其在確保適配下一代AI能力的同時(shí),實(shí)現(xiàn)了性能、功耗與成本的精妙平衡。
T4000搭載了1536個(gè)CUDA核心、64個(gè)第五代Tensor Core,以及一顆12核Arm Neoverse-V3AE CPU,可提供超過(guò)1200 TFLOPS(FP4)的AI算力。這一性能足以驅(qū)動(dòng)復(fù)雜的感知、融合與規(guī)劃算法,適用于先進(jìn)的自主移動(dòng)機(jī)器人(AMR)、無(wú)人機(jī)編隊(duì)和智能制造系統(tǒng)。
無(wú)論是選擇T5000還是T4000,開(kāi)發(fā)者都將受益于Jetson Thor平臺(tái)共享的核心優(yōu)勢(shì)——1.57 GHz的GPU最大頻率、128GB LPDDR5X統(tǒng)一高速內(nèi)存、專(zhuān)用硬件加速器集群(PVA、光流、編解碼引擎)、為機(jī)器人設(shè)計(jì)的豐富I/O接口,以及完整的NVIDIA Isaac軟件棧和生態(tài)系統(tǒng)支持。
這種統(tǒng)一性極大地降低了開(kāi)發(fā)門(mén)檻,使得開(kāi)發(fā)者可以在同一個(gè)平臺(tái)上驗(yàn)證算法,而后根據(jù)最終產(chǎn)品的市場(chǎng)定位靈活選擇計(jì)算核心,無(wú)縫地將人形機(jī)器人創(chuàng)新應(yīng)用,從實(shí)驗(yàn)室推向市場(chǎng)。
目前,AgiBot、Engine AI、Galbot、優(yōu)必選(UBTECH)、聯(lián)影智能(United Imaging)、宇樹(shù)科技(Unitree)、萬(wàn)集科技(Vanjee),等企業(yè)已經(jīng)采用了Jetson Thor,行業(yè)覆蓋服務(wù)機(jī)器人、工業(yè)自動(dòng)化、醫(yī)療健康和智慧城市等多個(gè)細(xì)分領(lǐng)域。
03 三臺(tái)計(jì)算機(jī)“協(xié)奏”:落點(diǎn)AGX支撐通用機(jī)器人和自動(dòng)駕駛
“實(shí)現(xiàn)物理AI,需要三臺(tái)計(jì)算機(jī)——DGX、AGX、Omniverse+Cosmos”這是NVIDIA不斷強(qiáng)調(diào)的定位和觀點(diǎn)。其中,Jetson Thor便承擔(dān)了AGX(邊緣部署平臺(tái))“端側(cè)執(zhí)行”的核心角色。
通過(guò)三者協(xié)同,開(kāi)發(fā)者能夠?qū)C(jī)器人開(kāi)發(fā)的全流程——數(shù)據(jù)采集、算法訓(xùn)練、模型驗(yàn)證和落地部署,形成高效閉環(huán)。
在“三臺(tái)計(jì)算機(jī)”的配合下,NVIDIA DGX 平臺(tái)作為機(jī)器人的“訓(xùn)練中心”,支持大模型訓(xùn)練、多模態(tài)數(shù)據(jù)融合以及復(fù)雜環(huán)境下的推理,為機(jī)器人在現(xiàn)實(shí)場(chǎng)景中處理高維數(shù)據(jù)、執(zhí)行復(fù)雜任務(wù)提供計(jì)算基礎(chǔ),其負(fù)責(zé)將海量數(shù)據(jù)轉(zhuǎn)化為可執(zhí)行的智能算法。
NVIDIA Omniverse則是機(jī)器人的“實(shí)驗(yàn)場(chǎng)”。由于真實(shí)環(huán)境測(cè)試成本高、風(fēng)險(xiǎn)大,利用Omniverse可提供虛擬環(huán)境,使開(kāi)發(fā)者能夠生成海量合成數(shù)據(jù),并進(jìn)行數(shù)百萬(wàn)公里級(jí)的虛擬測(cè)試,從而確保算法在部署前的穩(wěn)定性與可靠性。
NVIDIA Jetson Thor便是歸屬AGX落地的機(jī)器人“大腦”。Jetson Thor可將經(jīng)過(guò)DGX的訓(xùn)練、Omniverse的驗(yàn)證后的模型落地,實(shí)現(xiàn)從算法到執(zhí)行的閉環(huán)。
“三臺(tái)計(jì)算機(jī)”依托統(tǒng)一的CUDA架構(gòu)和AI軟件棧,形成了從云到邊緣的無(wú)縫閉環(huán),構(gòu)建出強(qiáng)大的生態(tài)護(hù)城河。自 2014 年推出以來(lái),截至目前,已有超過(guò)200萬(wàn)開(kāi)發(fā)者使用NVIDIA的機(jī)器人技術(shù)棧。
在NVIDIA面向通用機(jī)器人推出Jetson Thor的同時(shí),還宣布面向自動(dòng)駕駛的DRIVE AGX Thor已經(jīng)開(kāi)放預(yù)訂,預(yù)計(jì) 9 月開(kāi)始發(fā)貨。
這一發(fā)布的節(jié)點(diǎn),也契合了一個(gè)業(yè)界共識(shí)——汽車(chē)是機(jī)器人的母形態(tài),是四個(gè)輪子的機(jī)器人。機(jī)器人與自動(dòng)駕駛汽車(chē)在技術(shù)本質(zhì)上都是移動(dòng)智能體,都依賴(lài)高性能的環(huán)境感知、高階決策和實(shí)時(shí)控制能力。
所以,DRIVE AGX Thor與Jetson Thor基于相同底層硬件技術(shù),但在軟件和認(rèn)證標(biāo)準(zhǔn)上有所區(qū)分。
Jetson AGX Thor主要面向通用機(jī)器人、工業(yè)自動(dòng)化、醫(yī)療健康及智慧城市等場(chǎng)景,強(qiáng)調(diào)開(kāi)發(fā)靈活性和生態(tài)開(kāi)放性,支持多種算法和模型落地。
而DRIVE AGX Thor則面向自動(dòng)駕駛汽車(chē),其硬件通過(guò)車(chē)規(guī)級(jí)認(rèn)證,并搭載經(jīng)過(guò)功能安全認(rèn)證的DriveOS操作系統(tǒng),符合汽車(chē)行業(yè)嚴(yán)格的準(zhǔn)入標(biāo)準(zhǔn)。
這種“同芯異構(gòu)”的策略,充分展現(xiàn)了NVIDIA在平臺(tái)復(fù)用上的深厚功力。通過(guò)統(tǒng)一底層架構(gòu),NVIDIA不僅實(shí)現(xiàn)了研發(fā)成本分?jǐn)?,還促進(jìn)了技術(shù)互通,進(jìn)一步鞏固了其在機(jī)器人和自動(dòng)駕駛兩大萬(wàn)億級(jí)市場(chǎng)的領(lǐng)先地位。更提供了將機(jī)器人與“智能移動(dòng)體”的開(kāi)發(fā)從實(shí)驗(yàn)室概念推向可規(guī)?;涞氐默F(xiàn)實(shí)路徑。
Jetson Thor 的發(fā)布,是一次體系化能力的兌現(xiàn),其將人形機(jī)器人所需的算力、延遲控制、生態(tài)適配和規(guī)?;a(chǎn)力,第一次放進(jìn)了可被行業(yè)且能快速“消化”的平臺(tái)。這意味著,長(zhǎng)期停留在實(shí)驗(yàn)室階段的“技術(shù)孤島”正在被打通。
從技術(shù)戰(zhàn)略上看,NVIDIA 正把“通用計(jì)算”推向“通用智能體”。三臺(tái)計(jì)算機(jī)形成的“飛輪”,將在統(tǒng)一架構(gòu)下,讓更多生態(tài)伙伴共享技術(shù)紅利。這種模式的力量在于:一旦底層確定性能力穩(wěn)定攀升,行業(yè)創(chuàng)新就可以從算力焦慮轉(zhuǎn)向場(chǎng)景創(chuàng)新,從“能跑”轉(zhuǎn)向“跑得穩(wěn)、跑得好”。在通用機(jī)器人、自動(dòng)駕駛、智慧醫(yī)療、工業(yè)自動(dòng)化等萬(wàn)億級(jí)市場(chǎng)中,NVIDIA 正在成為“底層秩序的制定者”。
反觀Jetson Thor的發(fā)布,也是對(duì)“確定性智能”的一次宣言。人形機(jī)器人的真正商業(yè)化,不僅在于其是否能回答更復(fù)雜的問(wèn)題,更在是否能在現(xiàn)實(shí)世界的不確定中,持續(xù)、可靠地執(zhí)行。
或許,這正是“物理 AI”時(shí)代的命題,當(dāng)智能被精確地“釘”在每一毫秒的感知、推理、規(guī)劃與執(zhí)行之中,技術(shù)的意義就從“可能性”,轉(zhuǎn)化“必然性”。而Jetson Thor,正在打造一種更優(yōu)的確定性落地方式。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.