智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影

智東(dong)西8月12日報道(dao),今(jin)日,全球圖形頂級(ji)會議SIGGRAPH 2025正式開幕,一如既往,英偉達連發多款硬(ying)核新品,推出(chu)兩款全新工作(zuo)站(zhan)GPU、RTX PRO服務器,以及用于物理(li)AI的NVIDIA Omniverse軟件庫(ku)、NVIDIA Cosmos世界基礎模型和NVIDIA Metropolis平臺更新。

新發布的Cosmos模型(xing)包括一款(kuan)70億參數(shu)的全新推理視(shi)覺(jue)語言模型(xing)(VLM)——NVIDIA Cosmos Reason,它能讓機器人和視(shi)覺(jue)AI agents能夠像人類一樣利用先(xian)驗知識、物理理解和常識進行(xing)推理。NVIDIA Cosmos Transfer-2模型(xing)可加速從3D仿真(zhen)場景或空間控制(zhi)輸入(ru)中生成逼(bi)真(zhen)的合成數(shu)據,還(huan)有針對速度(du)進行(xing)進一步優化的Cosmos Transfers精簡(jian)版。

全新(xin)NVIDIA RTX PRO 4000 Blackwell SFF版本和(he)NVIDIA RTX PRO 2000 Blackwell GPU,采用第四代(dai)RT Core和(he)第五代(dai)Tensor Core,功耗更(geng)低,尺寸僅為(wei)傳統GPU的一半,將于今年晚些時候上市。

與上一(yi)代(dai)架構相比,RTX PRO 4000 SFF的AI性能(neng)提(ti)升(sheng)多(duo)達(da)2.5倍,光線(xian)追蹤性能(neng)提(ti)升(sheng)多(duo)達(da)1.7倍,帶寬提(ti)升(sheng)多(duo)達(da)1.5倍,在同樣70W TDP的情(qing)況下效率更(geng)高。

RTX PRO 2000針(zhen)對主流設(she)計和AI工作流程(cheng)進行了優(you)化,與上(shang)一代相比,3D建模速(su)(su)(su)度提(ti)(ti)高(gao)至(zhi)(zhi)1.6倍(bei)(bei)(bei),計算機輔助設(she)計(CAD)性能(neng)提(ti)(ti)高(gao)至(zhi)(zhi)1.4倍(bei)(bei)(bei),渲染(ran)速(su)(su)(su)度提(ti)(ti)高(gao)至(zhi)(zhi)1.6倍(bei)(bei)(bei),圖像生成速(su)(su)(su)度提(ti)(ti)高(gao)多(duo)達1.4倍(bei)(bei)(bei),文本生成速(su)(su)(su)度提(ti)(ti)高(gao)多(duo)達2.3倍(bei)(bei)(bei)。

給機器人打造推理大腦!英偉達開源7B世界基礎模型,還推出兩款全新GPU

▲NVIDIA RTX PRO 2000 Blackwell

思科(ke)、戴爾科(ke)技、HPE、聯(lian)想、超微將提供搭載(zai)NVIDIA RTX PRO 6000 Blackwell服務器版GPU的大容量新型2U主流(liu)服務器,覆蓋(gai)多種(zhong)配置,可加速Agentic?AI、內(nei)容創作(zuo)、數據分析、圖形、科(ke)學模擬(ni)、工業和物理AI的企業工作(zuo)負載(zai)。

RTX PRO服務器系列提供全系列機架式設計,可支持2個、4個或8個NVIDIA RTX PRO 6000 Blackwell GPU,非常適合運(yun)行使用AI推理模(mo)型(xing)執(zhi)行復雜(za)任務并實現自動化的(de)AI agents。

配備8個RTX PRO 6000 GPU的(de)4U規格服(fu)(fu)務器現已上市。2U主(zhu)流RTX PRO服(fu)(fu)務器預計將(jiang)于今年晚些時候上市。

一、全新Omniverse SDK和庫:無縫模擬機器人,3D仿真現實世界

全新NVIDIA Omniverse軟件(jian)開發(fa)套件(jian)(SDK)和庫(ku)可用于構建(jian)和部署工(gong)業AI和機(ji)器人模擬(ni)應用。

新Omniverse SDK推出了MuJoCo(MJCF)和通用場景描(miao)述(OpenUSD)之(zhi)間(jian)的(de)(de)數據互操作性,幫助超過25萬名(ming)MJCF機(ji)(ji)器人學習開(kai)發(fa)者無(wu)縫模擬各平臺的(de)(de)機(ji)(ji)器人。

新Omniverse NuRec庫和AI模型引入(ru)Omniverse RTX光線(xian)追(zhui)蹤3D高斯濺(jian)射(3DGS)技(ji)術。這種(zhong)渲染技(ji)術可幫助(zhu)開發者利用傳(chuan)感器數據,以(yi)3D形式捕捉、重建(jian)和模擬現實世(shi)界。

給機器人打造推理大腦!英偉達開源7B世界基礎模型,還推出兩款全新GPU

NVIDIA Isaac Sim 5.0和NVIDIA Isaac Lab 2.2開(kai)源(yuan)機器(qi)人(ren)(ren)模擬和學習框架已在GitHub上提供。Isaac Sim包括NuRec神(shen)經渲染(ran)和基于OpenUSD的(de)全新機器(qi)人(ren)(ren)和傳感器(qi)模式,可幫助機器(qi)人(ren)(ren)開(kai)發者彌合仿真(zhen)與現實之間(jian)的(de)差(cha)距。

GitHub地址(zhi):github.com/isaac-sim/IsaacSim

Omniverse NuRec渲染已集成到擁有超過(guo)15萬名開發者的(de)開源模擬器CARLA中。波(bo)士(shi)頓動力(li)、Figure AI、Hexagon、RAI Institute、Lightwheel、Skild AI正在(zai)采用(yong)(yong)Omniverse庫(ku)、Isaac Sim和(he)Isaac Lab來(lai)加速其AI機器人開發,亞馬遜設備(bei)與(yu)服務公司正在(zai)使(shi)用(yong)(yong)它們來(lai)支持(chi)新(xin)的(de)制造解決(jue)方案。

給機器人打造推理大腦!英偉達開源7B世界基礎模型,還推出兩款全新GPU

為(wei)了幫助開發者充分利(li)用這些軟件庫(ku)及先(xian)進技術,NVIDIA宣布推出為(wei)高要求工作負載而(er)設計的AI基礎設施(shi)。

NVIDIA RTX PRO Blackwell服務器為訓練、合(he)成數據生成、機器人(ren)學習和仿真等各種機器人(ren)開發(fa)工作負載提(ti)(ti)供(gong)統一架(jia)構。NVIDIA DGX Cloud現已在微(wei)軟Azure Marketplace上提(ti)(ti)供(gong),為Omniverse開發(fa)提(ti)(ti)供(gong)了一個全托(tuo)管平臺,可簡化從(cong)(cong)云端(duan)大規(gui)模流式傳(chuan)輸基于OpenUSD和NVIDIA RTX的應用,從(cong)(cong)而(er)最大限度(du)地減少基礎設(she)施編(bian)排和管理。

二、Cosmos模型下載量超200萬次,新增開源7B推理VLM

NVIDIA Cosmos世界基礎模型的下載量已超過200萬次,使開(kai)發(fa)者(zhe)可使用(yong)文(wen)本、圖像和視(shi)頻(pin)提(ti)示生成(cheng)用(yong)于(yu)大規模訓練機器人的各種(zhong)數據。新發(fa)布的模型在合成(cheng)數據生成(cheng)速度、準確性(xing)、語言支持和控制等方面取(qu)得進步。

給機器人打造推理大腦!英偉達開源7B世界基礎模型,還推出兩款全新GPU

即將發布的Cosmos Transfer-2簡(jian)化了提示,并(bing)能從地面(mian)實況3D仿真場景(jing)或空間控制輸入(如深度、分(fen)割、邊緣(yuan)和高(gao)清地圖(tu))中快速生成逼真的合成數據。

Cosmos Transfer精簡版將70個步(bu)驟(zou)的蒸餾過(guo)程簡(jian)化成一(yi)步(bu),使得在NVIDIA RTX PRO服務器(qi)上(shang)運行模型的速度(du)大大提升。

給機器人打造推理大腦!英偉達開源7B世界基礎模型,還推出兩款全新GPU

Lightwheel、Moon Surgical和(he)Skild AI正(zheng)在(zai)使(shi)用Cosmos Transfer通(tong)過大規模(mo)模(mo)擬各(ge)種條件來加速物理(li)AI訓練。

此(ci)前視(shi)覺(jue)語言模型(VLM)尚無(wu)法解決(jue)多步驟任務,也無(wu)法處(chu)理模糊性或新奇的體驗。

NVIDIA Cosmos Reason是一款(kuan)可(ke)定制的(de)開源推理(li)(li)VLM,擁有(you)70億參數,面向用于物(wu)理(li)(li)AI和機器人(ren)開發。

它可(ke)以讓機(ji)器人和視(shi)覺AI agents像人類一樣推理(li)(li)(li),利用先驗知識、物理(li)(li)(li)理(li)(li)(li)解和常識來理(li)(li)(li)解現實世界并付諸行動,因此可(ke)用于數據管理(li)(li)(li)、機(ji)器人規劃和視(shi)頻分析等場景(jing)。

給機器人打造推理大腦!英偉達開源7B世界基礎模型,還推出兩款全新GPU

該模型可用(yong)于機(ji)器人和物(wu)理AI應用(yong),包括:

(1)數據管理和注釋,幫助開發者自動(dong)對海量(liang)(liang)、多(duo)樣化(hua)的訓練數(shu)據集(ji)進(jin)行高質量(liang)(liang)管理(li)和注(zhu)釋(shi)。

(2)機器人規劃和推理,在(zai)機器(qi)人VLA模型(xing)中充當大腦,進行(xing)有意識(shi)、有條理的決策,使(shi)機器(qi)人能(neng)解(jie)讀環境(jing),并在(zai)收到復雜(za)命令后(hou),將其分解(jie)為任(ren)務,并運(yun)用常識(shi)執行(xing),即使(shi)在(zai)不(bu)熟悉的環境(jing)中。

(3)視頻分析AI agents基(ji)于可(ke)用于視頻搜索(suo)和(he)總結的NVIDIA Blueprint構建,可(ke)從(cong)海量視頻數據中(zhong)提取(qu)有價值的見解并(bing)進(jin)行根本原因分(fen)析。

NVIDIA機器人團(tuan)隊(dui)和(he)NVIDIA DRIVE團(tuan)隊(dui)正在使用Cosmos Reason進行數據整理和(he)篩選、注(zhu)釋以(yi)及VLA后訓練。Uber正在使用它來為輔助駕(jia)駛訓練數據添加注(zhu)釋和(he)字(zi)幕。

NVIDIA Cosmos-Reason1-7B模型(xing)(xing)可在(zai)新發布的RTX PRO 4000 SFF上無縫(feng)運行,為邊緣設備、緊湊(cou)型(xing)(xing)工作站和工業系(xi)統提供出色的物理(li)AI推理(li)能力(li)。

三、NVIDIA Metropolis五連更,讓物理AI應用開發更輕松

NVIDIA Metropolis平(ping)(ping)臺(tai)簡化了(le)視(shi)頻分析AI agents和(he)服(fu)務從(cong)邊緣(yuan)到云的開發、部署和(he)擴展(zhan)。開發者可(ke)利用該平(ping)(ping)臺(tai)更快(kuai)地為其設施構建視(shi)覺感知,以提高生產力,并提高各環(huan)境的安全(quan)性。

NVIDIA Metropolis的五項關鍵更(geng)新,有望推(tui)進開發者更(geng)快、更(geng)輕松(song)地構建物理AI應用。

(1)Cosmos Reason VLM:最(zui)新版Cosmos Reason可實(shi)現針對Metropolis用例的上下文視頻理(li)解和時間事件推(tui)理(li)。小參數量使(shi)其(qi)易于從(cong)邊緣到云(yun)端部署,非常適合自動化(hua)交通(tong)監控、公共(gong)安全、視覺檢查和智能(neng)決策。

(2)VSS Blueprint 2.4:VSS 2.4可(ke)輕松快速地(di)通(tong)過(guo)Cosmos Reason來增強現有(you)視(shi)覺(jue)AI應用,具有(you)一(yi)組擴(kuo)展(zhan)應用編程接(jie)口,為用戶直(zhi)接(jie)提供了更大的靈活性,使其能夠選擇特定的VSS組件和功能來通(tong)過(guo)生(sheng)成式 AI 增強計算機視(shi)覺(jue)管線。

(3)全新視覺基礎模型:NVIDIA TAO工具(ju)套件包括一套全新視覺基礎模(mo)型,以及(ji)高級微調方法(fa)、自(zi)監督學習和知識蒸餾功能(neng),能(neng)夠(gou)優(you)化邊緣與云環境(jing)中的物理AI解決方案部(bu)署。NVIDIA DeepStream SDK具(ju)備一個(ge)全新推理生成器(qi),可無縫(feng)部(bu)署TAO 6模(mo)型。

(4)NVIDIA Isaac Sim擴展:NVIDIA Isaac Sim參(can)考應用(yong)中(zhong)的(de)新擴展工具有助于解決視覺AI開發(fa)中(zhong)的(de)常見挑戰,例(li)如有限的(de)標注(zhu)數據和(he)(he)罕見的(de)邊緣場景。這些工具可以模擬人(ren)機交(jiao)互,生成豐富的(de)目標檢(jian)測數據集,并(bing)創建(jian)基于事件(jian)的(de)場景和(he)(he)圖像(xiang)-字幕對,來訓練(lian)VLM并(bing)加速(su)開發(fa),提(ti)高AI在現(xian)實世界條(tiao)件(jian)下的(de)性(xing)能。

(5)擴展硬件支持:所有Metropolis組件均(jun)可(ke)在NVIDIA RTX PRO Blackwell GPU、NVIDIA DGX Spark桌面超級計(ji)算機以及用于物(wu)理AI和人(ren)(ren)形機器人(ren)(ren)的NVIDIA Jetson Thor平臺上運行(xing),用戶可(ke)從邊(bian)緣到云端進行(xing)開(kai)發與部(bu)署(shu)。

Cosmos Reason 1和NVIDIA TAO 6.0均已(yi)開放下載。

四、展示多項創新研究,覆蓋模擬、AI渲染、3D內容生成

NVIDIA研(yan)究(jiu)人員在SIGGRAPH上展(zhan)(zhan)示了模擬、AI渲染和(he)3D內容(rong)生成方(fang)面的進展(zhan)(zhan),可能有(you)助于(yu)虛擬世界創(chuang)建(jian)、機器(qi)人開發和(he)自動(dong)駕駛汽(qi)車訓(xun)練。

給機器人打造推理大腦!英偉達開源7B世界基礎模型,還推出兩款全新GPU

一篇論文探討了從2D圖(tu)像或(huo)視(shi)頻(pin)重建物(wu)(wu)理感知3D幾(ji)何(he)體(ti)(ti)的(de)挑(tiao)戰。雖然許多(duo)模(mo)型(xing)可以根據視(shi)頻(pin)片段估(gu)計3D物(wu)(wu)體(ti)(ti),但生成的(de)3D形狀(zhuang)通(tong)常(chang)缺(que)乏結(jie)構穩定性(xing)。即使在視(shi)覺上與(yu)真實物(wu)(wu)體(ti)(ti)非常(chang)接近,生成的(de)形狀(zhuang)也可能存在比例(li)略微不均勻或(huo)細節缺(que)失(shi)的(de)問題,從而(er)影響其物(wu)(wu)理真實感。

例如(ru),用(yong)2D素材構建(jian)的(de)(de)椅子3D模(mo)擬模(mo)型,如(ru)果(guo)放入物(wu)理精準的(de)(de)模(mo)擬環境中(zhong),可(ke)能會塌(ta)陷,因為(wei)AI模(mo)型是基于視覺(jue)估算3D結構,而非實際測(ce)量結果(guo)。這(zhe)篇論文介紹的(de)(de)方法有助于確保生成的(de)(de)3D形狀能夠真實還原(yuan)現實世界的(de)(de)物(wu)理特性,從而支持創建(jian)用(yong)于物(wu)理AI訓練的(de)(de)虛擬世界。

另(ling)一(yi)篇論(lun)文介紹(shao)了一(yi)種通過物理(li)上精確的(de)運(yun)(yun)動(dong)賦予模擬(ni)角色生命的(de)技(ji)術。研究人(ren)員(yuan)將運(yun)(yun)動(dong)生成器(qi)(qi)與基(ji)于物理(li)的(de)跟(gen)蹤控(kong)制器(qi)(qi)相結合,為復雜的(de)動(dong)作(例如(ru)跑(pao)酷運(yun)(yun)動(dong)員(yuan)的(de)特(te)技(ji))生成逼真的(de)合成數據(ju)。這些數據(ju)可以幫助(zhu)開發虛擬(ni)角色或訓(xun)(xun)練(lian)現實世界(jie)的(de)人(ren)形機器(qi)(qi)人(ren),使其(qi)具有現實世界(jie)訓(xun)(xun)練(lian)數據(ju)中很少見(jian)的(de)敏捷運(yun)(yun)動(dong)技(ji)能。

其他論文(wen)探討了(le)模擬光(guang)和材(cai)料的(de)復雜性。

一(yi)個項目展(zhan)示(shi)了如(ru)何創(chuang)建AI助(zhu)手(shou)來(lai)增強材質細節(jie)(jie)(jie)。它利用擴(kuo)散模型和基(ji)于可微(wei)分物(wu)理的(de)(de)(de)渲(xuan)染器,為(wei)創(chuang)作者提供了一(yi)種在3D對(dui)象表示(shi)上輕松修(xiu)改材質紋理貼(tie)圖的(de)(de)(de)方法,使(shi)(shi)創(chuang)作者能(neng)用簡單的(de)(de)(de)文(wen)本提示(shi)創(chuang)建更豐富(fu)、更逼真(zhen)的(de)(de)(de)虛擬世界。研究團隊演示(shi)了如(ru)何使(shi)(shi)用該模型快(kuai)速添加(jia)逼真(zhen)的(de)(de)(de)物(wu)體細節(jie)(jie)(jie),例如(ru)風化或老化的(de)(de)(de)痕跡。這(zhe)些細節(jie)(jie)(jie)使(shi)(shi)用傳統渲(xuan)染方法創(chuang)建起來(lai)非常耗時(shi)。

在(zai)光模擬領域,一篇(pian)論文解決了可(ke)(ke)微(wei)分(fen)渲(xuan)染(ran)(ran)中的挑戰,引入了一種強大的可(ke)(ke)微(wei)分(fen)可(ke)(ke)見性(xing)查詢,可(ke)(ke)以(yi)更快、更準確地從(cong)圖像和(he)視頻中重建3D幾何體(ti)。一個示(shi)例是將(jiang)正向渲(xuan)染(ran)(ran)和(he)逆向渲(xuan)染(ran)(ran)結合在(zai)一起(qi),快速從(cong)虛擬世界中提取參數(shu),這些(xie)參數(shu)對(dui)于在(zai)合成數(shu)據集上精確訓練物理AI模型至(zhi)關重要。

結語:押注物理AI,將信息世界與物理世界打通

NVIDIA正在為其GPU開辟一(yi)個更廣(guang)闊的(de)(de)市場,而它嗅到的(de)(de)下一(yi)個風向(xiang)便是將計算機圖形和AI能力進(jin)一(yi)步結合(he)的(de)(de)物理AI。而無論是圖形和仿真(zhen)創新,還是加速AI計算,都是NVIDIA的(de)(de)優勢所在。

物理(li)AI已逐漸(jian)成(cheng)(cheng)為現代機器人(ren)、自動駕(jia)駛汽車、智慧(hui)城市、設施和工業流程的(de)基(ji)礎,它依賴于神經圖(tu)形、合成(cheng)(cheng)數據生成(cheng)(cheng)、基(ji)于物理(li)的(de)模(mo)擬(ni)仿真(zhen)、強化學習(xi)和AI推理(li)的(de)融合。

在SIGGRAPH 2025期(qi)間,NVIDIA展示了包括(kuo)NVIDIA Omniverse庫、NVIDIA Cosmos世(shi)界基礎(chu)模型、RTX PRO Blackwell GPU及(ji)服務(wu)器(qi)在內的(de)一系(xi)列軟硬(ying)件基礎(chu)設施如何為物理AI和機器(qi)人工(gong)作負載提供動力。

為了(le)幫助機(ji)器人(ren)和物理AI開發者推進(jin)3D和模擬技術的采用,NVIDIA還(huan)宣布OpenUSD課程和認證,以滿足對USD專業知識(shi)的需求,并宣布與(yu)Lightwheel進(jin)行開源合作,將機(ji)器人(ren)策(ce)略訓練和評(ping)估框架集成到NVIDIA Isaac Lab中,具備(bei)并行強化學習訓練功能,以及(ji)機(ji)器人(ren)操(cao)作和運動的基準(zhun)測(ce)試和仿真就緒資產。