網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

給機(jī)器人打造推理大腦！英偉達(dá)開源7B世界基礎(chǔ)模型，還推出兩款全新GPU

2025-08-12 23:35:15　來(lái)源: 智東西

北京舉報(bào)

分享至

智東西
作者 ZeR0
編輯漠影

智東西8月12日?qǐng)?bào)道，今日，全球圖形頂級(jí)會(huì)議SIGGRAPH 2025正式開幕，一如既往，英偉達(dá)連發(fā)多款硬核新品，推出兩款全新工作站GPU、RTX PRO服務(wù)器，以及用于物理AI的NVIDIA Omniverse軟件庫(kù)、NVIDIA Cosmos世界基礎(chǔ)模型和NVIDIA Metropolis平臺(tái)更新。

新發(fā)布的Cosmos模型包括一款70億參數(shù)的全新推理視覺語(yǔ)言模型（VLM）——NVIDIA Cosmos Reason，它能讓機(jī)器人和視覺AI agents能夠像人類一樣利用先驗(yàn)知識(shí)、物理理解和常識(shí)進(jìn)行推理。NVIDIA Cosmos Transfer-2模型可加速?gòu)?D仿真場(chǎng)景或空間控制輸入中生成逼真的合成數(shù)據(jù)，還有針對(duì)速度進(jìn)行進(jìn)一步優(yōu)化的Cosmos Transfers精簡(jiǎn)版。

全新NVIDIA RTX PRO 4000 Blackwell SFF版本和NVIDIA RTX PRO 2000 Blackwell GPU，采用第四代RT Core和第五代Tensor Core，功耗更低，尺寸僅為傳統(tǒng)GPU的一半，將于今年晚些時(shí)候上市。

與上一代架構(gòu)相比，RTX PRO 4000 SFF的AI性能提升多達(dá)2.5倍，光線追蹤性能提升多達(dá)1.7倍，帶寬提升多達(dá)1.5倍，在同樣70W TDP的情況下效率更高。

RTX PRO 2000針對(duì)主流設(shè)計(jì)和AI工作流程進(jìn)行了優(yōu)化，與上一代相比，3D建模速度提高至1.6倍，計(jì)算機(jī)輔助設(shè)計(jì)（CAD）性能提高至1.4倍，渲染速度提高至1.6倍，圖像生成速度提高多達(dá)1.4倍，文本生成速度提高多達(dá)2.3倍。

▲NVIDIA RTX PRO 2000 Blackwell

思科、戴爾科技、HPE、聯(lián)想、超微將提供搭載NVIDIA RTX PRO 6000 Blackwell服務(wù)器版GPU的大容量新型2U主流服務(wù)器，覆蓋多種配置，可加速Agentic AI、內(nèi)容創(chuàng)作、數(shù)據(jù)分析、圖形、科學(xué)模擬、工業(yè)和物理AI的企業(yè)工作負(fù)載。

RTX PRO服務(wù)器系列提供全系列機(jī)架式設(shè)計(jì)，可支持2個(gè)、4個(gè)或8個(gè)NVIDIA RTX PRO 6000 Blackwell GPU，非常適合運(yùn)行使用AI推理模型執(zhí)行復(fù)雜任務(wù)并實(shí)現(xiàn)自動(dòng)化的AI agents。

配備8個(gè)RTX PRO 6000 GPU的4U規(guī)格服務(wù)器現(xiàn)已上市。2U主流RTX PRO服務(wù)器預(yù)計(jì)將于今年晚些時(shí)候上市。

一、全新Omniverse SDK和庫(kù)：無(wú)縫模擬機(jī)器人，3D仿真現(xiàn)實(shí)世界

全新NVIDIA Omniverse軟件開發(fā)套件（SDK）和庫(kù)可用于構(gòu)建和部署工業(yè)AI和機(jī)器人模擬應(yīng)用。

新Omniverse SDK推出了MuJoCo（MJCF）和通用場(chǎng)景描述（OpenUSD）之間的數(shù)據(jù)互操作性，幫助超過(guò)25萬(wàn)名MJCF機(jī)器人學(xué)習(xí)開發(fā)者無(wú)縫模擬各平臺(tái)的機(jī)器人。

新Omniverse NuRec庫(kù)和AI模型引入Omniverse RTX光線追蹤3D高斯濺射（3DGS）技術(shù)。這種渲染技術(shù)可幫助開發(fā)者利用傳感器數(shù)據(jù)，以3D形式捕捉、重建和模擬現(xiàn)實(shí)世界。

NVIDIA Isaac Sim 5.0和NVIDIA Isaac Lab 2.2開源機(jī)器人模擬和學(xué)習(xí)框架已在GitHub上提供。Isaac Sim包括NuRec神經(jīng)渲染和基于OpenUSD的全新機(jī)器人和傳感器模式，可幫助機(jī)器人開發(fā)者彌合仿真與現(xiàn)實(shí)之間的差距。

GitHub地址：github.com/isaac-sim/IsaacSim

Omniverse NuRec渲染已集成到擁有超過(guò)15萬(wàn)名開發(fā)者的開源模擬器CARLA中。波士頓動(dòng)力、Figure AI、Hexagon、RAI Institute、Lightwheel、Skild AI正在采用Omniverse庫(kù)、Isaac Sim和Isaac Lab來(lái)加速其AI機(jī)器人開發(fā)，亞馬遜設(shè)備與服務(wù)公司正在使用它們來(lái)支持新的制造解決方案。

為了幫助開發(fā)者充分利用這些軟件庫(kù)及先進(jìn)技術(shù)，NVIDIA宣布推出為高要求工作負(fù)載而設(shè)計(jì)的AI基礎(chǔ)設(shè)施。

NVIDIA RTX PRO Blackwell服務(wù)器為訓(xùn)練、合成數(shù)據(jù)生成、機(jī)器人學(xué)習(xí)和仿真等各種機(jī)器人開發(fā)工作負(fù)載提供統(tǒng)一架構(gòu)。NVIDIA DGX Cloud現(xiàn)已在微軟Azure Marketplace上提供，為Omniverse開發(fā)提供了一個(gè)全托管平臺(tái)，可簡(jiǎn)化從云端大規(guī)模流式傳輸基于OpenUSD和NVIDIA RTX的應(yīng)用，從而最大限度地減少基礎(chǔ)設(shè)施編排和管理。

二、Cosmos模型下載量超200萬(wàn)次，新增開源7B推理VLM

NVIDIA Cosmos世界基礎(chǔ)模型的下載量已超過(guò)200萬(wàn)次，使開發(fā)者可使用文本、圖像和視頻提示生成用于大規(guī)模訓(xùn)練機(jī)器人的各種數(shù)據(jù)。新發(fā)布的模型在合成數(shù)據(jù)生成速度、準(zhǔn)確性、語(yǔ)言支持和控制等方面取得進(jìn)步。

即將發(fā)布的Cosmos Transfer-2簡(jiǎn)化了提示，并能從地面實(shí)況3D仿真場(chǎng)景或空間控制輸入（如深度、分割、邊緣和高清地圖）中快速生成逼真的合成數(shù)據(jù)。

Cosmos Transfer精簡(jiǎn)版將70個(gè)步驟的蒸餾過(guò)程簡(jiǎn)化成一步，使得在NVIDIA RTX PRO服務(wù)器上運(yùn)行模型的速度大大提升。

Lightwheel、Moon Surgical和Skild AI正在使用Cosmos Transfer通過(guò)大規(guī)模模擬各種條件來(lái)加速物理AI訓(xùn)練。

此前視覺語(yǔ)言模型（VLM）尚無(wú)法解決多步驟任務(wù)，也無(wú)法處理模糊性或新奇的體驗(yàn)。

NVIDIA Cosmos Reason是一款可定制的開源推理VLM，擁有70億參數(shù)，面向用于物理AI和機(jī)器人開發(fā)。

它可以讓機(jī)器人和視覺AI agents像人類一樣推理，利用先驗(yàn)知識(shí)、物理理解和常識(shí)來(lái)理解現(xiàn)實(shí)世界并付諸行動(dòng)，因此可用于數(shù)據(jù)管理、機(jī)器人規(guī)劃和視頻分析等場(chǎng)景。

該模型可用于機(jī)器人和物理AI應(yīng)用，包括：

（1）數(shù)據(jù)管理和注釋，幫助開發(fā)者自動(dòng)對(duì)海量、多樣化的訓(xùn)練數(shù)據(jù)集進(jìn)行高質(zhì)量管理和注釋。

（2）機(jī)器人規(guī)劃和推理，在機(jī)器人VLA模型中充當(dāng)大腦，進(jìn)行有意識(shí)、有條理的決策，使機(jī)器人能解讀環(huán)境，并在收到復(fù)雜命令后，將其分解為任務(wù)，并運(yùn)用常識(shí)執(zhí)行，即使在不熟悉的環(huán)境中。

（3）視頻分析AI agents基于可用于視頻搜索和總結(jié)的NVIDIA Blueprint構(gòu)建，可從海量視頻數(shù)據(jù)中提取有價(jià)值的見解并進(jìn)行根本原因分析。

NVIDIA機(jī)器人團(tuán)隊(duì)和NVIDIA DRIVE團(tuán)隊(duì)正在使用Cosmos Reason進(jìn)行數(shù)據(jù)整理和篩選、注釋以及VLA后訓(xùn)練。Uber正在使用它來(lái)為輔助駕駛訓(xùn)練數(shù)據(jù)添加注釋和字幕。

NVIDIA Cosmos-Reason1-7B模型可在新發(fā)布的RTX PRO 4000 SFF上無(wú)縫運(yùn)行，為邊緣設(shè)備、緊湊型工作站和工業(yè)系統(tǒng)提供出色的物理AI推理能力。

三、NVIDIA Metropolis五連更，讓物理AI應(yīng)用開發(fā)更輕松

NVIDIA Metropolis平臺(tái)簡(jiǎn)化了視頻分析AI agents和服務(wù)從邊緣到云的開發(fā)、部署和擴(kuò)展。開發(fā)者可利用該平臺(tái)更快地為其設(shè)施構(gòu)建視覺感知，以提高生產(chǎn)力，并提高各環(huán)境的安全性。

NVIDIA Metropolis的五項(xiàng)關(guān)鍵更新，有望推進(jìn)開發(fā)者更快、更輕松地構(gòu)建物理AI應(yīng)用。

（1）Cosmos Reason VLM：最新版Cosmos Reason可實(shí)現(xiàn)針對(duì)Metropolis用例的上下文視頻理解和時(shí)間事件推理。小參數(shù)量使其易于從邊緣到云端部署，非常適合自動(dòng)化交通監(jiān)控、公共安全、視覺檢查和智能決策。

（2）VSS Blueprint 2.4：VSS 2.4可輕松快速地通過(guò)Cosmos Reason來(lái)增強(qiáng)現(xiàn)有視覺AI應(yīng)用，具有一組擴(kuò)展應(yīng)用編程接口，為用戶直接提供了更大的靈活性，使其能夠選擇特定的VSS組件和功能來(lái)通過(guò)生成式 AI 增強(qiáng)計(jì)算機(jī)視覺管線。

（3）全新視覺基礎(chǔ)模型：NVIDIA TAO工具套件包括一套全新視覺基礎(chǔ)模型，以及高級(jí)微調(diào)方法、自監(jiān)督學(xué)習(xí)和知識(shí)蒸餾功能，能夠優(yōu)化邊緣與云環(huán)境中的物理AI解決方案部署。NVIDIA DeepStream SDK具備一個(gè)全新推理生成器，可無(wú)縫部署TAO 6模型。

（4）NVIDIA Isaac Sim擴(kuò)展：NVIDIA Isaac Sim參考應(yīng)用中的新擴(kuò)展工具有助于解決視覺AI開發(fā)中的常見挑戰(zhàn)，例如有限的標(biāo)注數(shù)據(jù)和罕見的邊緣場(chǎng)景。這些工具可以模擬人機(jī)交互，生成豐富的目標(biāo)檢測(cè)數(shù)據(jù)集，并創(chuàng)建基于事件的場(chǎng)景和圖像-字幕對(duì)，來(lái)訓(xùn)練VLM并加速開發(fā)，提高AI在現(xiàn)實(shí)世界條件下的性能。

（5）擴(kuò)展硬件支持：所有Metropolis組件均可在NVIDIA RTX PRO Blackwell GPU、NVIDIA DGX Spark桌面超級(jí)計(jì)算機(jī)以及用于物理AI和人形機(jī)器人的NVIDIA Jetson Thor平臺(tái)上運(yùn)行，用戶可從邊緣到云端進(jìn)行開發(fā)與部署。

Cosmos Reason 1和NVIDIA TAO 6.0均已開放下載。

四、展示多項(xiàng)創(chuàng)新研究，覆蓋模擬、AI渲染、3D內(nèi)容生成

NVIDIA研究人員在SIGGRAPH上展示了模擬、AI渲染和3D內(nèi)容生成方面的進(jìn)展，可能有助于虛擬世界創(chuàng)建、機(jī)器人開發(fā)和自動(dòng)駕駛汽車訓(xùn)練。

一篇論文探討了從2D圖像或視頻重建物理感知3D幾何體的挑戰(zhàn)。雖然許多模型可以根據(jù)視頻片段估計(jì)3D物體，但生成的3D形狀通常缺乏結(jié)構(gòu)穩(wěn)定性。即使在視覺上與真實(shí)物體非常接近，生成的形狀也可能存在比例略微不均勻或細(xì)節(jié)缺失的問(wèn)題，從而影響其物理真實(shí)感。

例如，用2D素材構(gòu)建的椅子3D模擬模型，如果放入物理精準(zhǔn)的模擬環(huán)境中，可能會(huì)塌陷，因?yàn)锳I模型是基于視覺估算3D結(jié)構(gòu)，而非實(shí)際測(cè)量結(jié)果。這篇論文介紹的方法有助于確保生成的3D形狀能夠真實(shí)還原現(xiàn)實(shí)世界的物理特性，從而支持創(chuàng)建用于物理AI訓(xùn)練的虛擬世界。

另一篇論文介紹了一種通過(guò)物理上精確的運(yùn)動(dòng)賦予模擬角色生命的技術(shù)。研究人員將運(yùn)動(dòng)生成器與基于物理的跟蹤控制器相結(jié)合，為復(fù)雜的動(dòng)作（例如跑酷運(yùn)動(dòng)員的特技）生成逼真的合成數(shù)據(jù)。這些數(shù)據(jù)可以幫助開發(fā)虛擬角色或訓(xùn)練現(xiàn)實(shí)世界的人形機(jī)器人，使其具有現(xiàn)實(shí)世界訓(xùn)練數(shù)據(jù)中很少見的敏捷運(yùn)動(dòng)技能。

其他論文探討了模擬光和材料的復(fù)雜性。

一個(gè)項(xiàng)目展示了如何創(chuàng)建AI助手來(lái)增強(qiáng)材質(zhì)細(xì)節(jié)。它利用擴(kuò)散模型和基于可微分物理的渲染器，為創(chuàng)作者提供了一種在3D對(duì)象表示上輕松修改材質(zhì)紋理貼圖的方法，使創(chuàng)作者能用簡(jiǎn)單的文本提示創(chuàng)建更豐富、更逼真的虛擬世界。研究團(tuán)隊(duì)演示了如何使用該模型快速添加逼真的物體細(xì)節(jié)，例如風(fēng)化或老化的痕跡。這些細(xì)節(jié)使用傳統(tǒng)渲染方法創(chuàng)建起來(lái)非常耗時(shí)。

在光模擬領(lǐng)域，一篇論文解決了可微分渲染中的挑戰(zhàn)，引入了一種強(qiáng)大的可微分可見性查詢，可以更快、更準(zhǔn)確地從圖像和視頻中重建3D幾何體。一個(gè)示例是將正向渲染和逆向渲染結(jié)合在一起，快速?gòu)奶摂M世界中提取參數(shù)，這些參數(shù)對(duì)于在合成數(shù)據(jù)集上精確訓(xùn)練物理AI模型至關(guān)重要。

結(jié)語(yǔ)：押注物理AI，將信息世界與物理世界打通

NVIDIA正在為其GPU開辟一個(gè)更廣闊的市場(chǎng)，而它嗅到的下一個(gè)風(fēng)向便是將計(jì)算機(jī)圖形和AI能力進(jìn)一步結(jié)合的物理AI。而無(wú)論是圖形和仿真創(chuàng)新，還是加速AI計(jì)算，都是NVIDIA的優(yōu)勢(shì)所在。

物理AI已逐漸成為現(xiàn)代機(jī)器人、自動(dòng)駕駛汽車、智慧城市、設(shè)施和工業(yè)流程的基礎(chǔ)，它依賴于神經(jīng)圖形、合成數(shù)據(jù)生成、基于物理的模擬仿真、強(qiáng)化學(xué)習(xí)和AI推理的融合。

在SIGGRAPH 2025期間，NVIDIA展示了包括NVIDIA Omniverse庫(kù)、NVIDIA Cosmos世界基礎(chǔ)模型、RTX PRO Blackwell GPU及服務(wù)器在內(nèi)的一系列軟硬件基礎(chǔ)設(shè)施如何為物理AI和機(jī)器人工作負(fù)載提供動(dòng)力。

為了幫助機(jī)器人和物理AI開發(fā)者推進(jìn)3D和模擬技術(shù)的采用，NVIDIA還宣布OpenUSD課程和認(rèn)證，以滿足對(duì)USD專業(yè)知識(shí)的需求，并宣布與Lightwheel進(jìn)行開源合作，將機(jī)器人策略訓(xùn)練和評(píng)估框架集成到NVIDIA Isaac Lab中，具備并行強(qiáng)化學(xué)習(xí)訓(xùn)練功能，以及機(jī)器人操作和運(yùn)動(dòng)的基準(zhǔn)測(cè)試和仿真就緒資產(chǎn)。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.