
智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 心緣
智東西美國圣何塞3月18日現場報道,時隔5年,全球頂尖AI計算技術盛會、年度NVIDIA GTC大會重磅回歸線下,就在剛剛,英偉達創始人兼CEO黃仁勛發表長達123分鐘的主題演講,發布AI芯片最新震圈之作——Blackwell GPU,智(zhi)東(dong)西受邀參會(hui)并從現場發來完整(zheng)的干貨報道。
在這(zhe)場(chang)大會(hui)上,英偉達展現出堪稱(cheng)恐怖的(de)行(xing)業(ye)(ye)號(hao)召力,將(jiang)AI圈的(de)頂(ding)尖技術(shu)大牛(niu)和(he)行(xing)業(ye)(ye)精英匯聚在一起。現場(chang)盛況空前,線下參(can)會(hui)者逾萬人。智(zhi)東西此行(xing)遇到許多來自國(guo)(guo)內(nei)的(de)參(can)展商或(huo)觀眾,明顯(xian)感(gan)受到國(guo)(guo)內(nei)企業(ye)(ye)和(he)開發(fa)者對這(zhe)場(chang)AI盛會(hui)的(de)熱情(qing)。
當地時間3月(yue)18日13點,北京19日凌(ling)晨(chen)4點,GTC最重磅的主題演講正式開始,在播放一段AI主題短片后,黃仁(ren)勛穿(chuan)著標志性的黑色皮衣從(cong)圣何塞SAP中心(xin)場館主舞臺登場,與觀眾寒(han)暄。
他首(shou)(shou)先回顧了英偉達30年來(lai)追求加速計(ji)算(suan)旅程的開端,歷數研發革命性(xing)計(ji)算(suan)模式(shi)CUDA、將首(shou)(shou)臺(tai)AI超(chao)級計(ji)算(suan)機DGX交給(gei)OpenAI等一(yi)系列(lie)里程碑事件,然后將話題自(zi)然地聚焦到生成式(shi)AI上。
在宣布與(yu)多家(jia)EDA龍頭的(de)(de)重要(yao)合作(zuo)伙伴(ban)關系(xi)后,他(ta)談到(dao)快速(su)演進的(de)(de)AI模(mo)型帶動訓練算(suan)力需求暴漲,需要(yao)更大的(de)(de)GPU,“加速(su)計(ji)算(suan)已(yi)達到(dao)臨界點,通用計(ji)算(suan)已(yi)失去(qu)動力”,“在每一個行(xing)業,加速(su)計(ji)算(suan)都比通用計(ji)算(suan)有了巨大的(de)(de)提升”。
緊接著,大屏幕上過電影般快速閃現從GPU、超級芯片到超級計算機、集群系統的一系列關鍵組件,然后黃仁勛重磅宣布:全新旗艦AI芯片Blackwell GPU,來了!
這是GPGPU領域最新的震圈(quan)之作,從配置到性能(neng)都將前輩Hopper GPU拍倒在沙灘(tan)上。他舉起雙手(shou)展示了Blackwell和Hopper GPU的對比,Blackwell GPU明顯大了一圈(quan)。
畢竟手(shou)心(xin)手(shou)背都(dou)是肉,對比完后,黃仁(ren)勛馬上開始(shi)安慰:“It’s OK, Hopper. You’re very good, good boy, or good girl.”
但也不能怪老(lao)黃喜新厭(yan)舊,因為Blackwell的性能,實在是(shi)(shi)太(tai)強了(le)!無論(lun)是(shi)(shi)FP8,還是(shi)(shi)全新的FP6、FP4精度,以(yi)及HBM能塞下的模(mo)(mo)型規模(mo)(mo)和HBM帶寬,都做到“倍(bei)殺”前代Hopper。
8年,從Pascal架構到Blackwell架構,英偉達將AI計算性能提升了1000倍!
這還只是開胃小菜,黃仁勛真正的“胃口”,是打造足以優化萬億參數級GPU計算的最強AI基礎設施(shi)。
總體來看,英偉達在本屆GTC大會上連發(fa)6個大招:
1、發布Blackwell GPU:訓練(lian)性(xing)(xing)能(neng)(neng)提升至(zhi)2.5倍(bei),FP4精度推(tui)理性(xing)(xing)能(neng)(neng)提升至(zhi)前(qian)代(dai)FP8的(de)5倍(bei);升級第(di)五代(dai)NVLink,互連速(su)度是Hopper的(de)2倍(bei),可(ke)擴(kuo)展(zhan)到576個(ge)GPU,能(neng)(neng)夠解決萬億參數混合專家模型通信瓶頸。
2、Blackwell平臺“全(quan)家(jia)桶”登(deng)場:既面(mian)向(xiang)萬(wan)億參(can)數級(ji)GPU計(ji)算(suan)優化,推出全(quan)新網(wang)絡交換機(ji)X800系列(lie),吞吐量高(gao)達800Gb/s;又發布GB200超級(ji)芯片、GB200 NVL72系統、DGX B200系統、新一代DGX SuperPOD AI超級(ji)計(ji)算(suan)機(ji)。
3、推出數(shu)十個企業(ye)級生成式AI微(wei)服務,提供一種封裝和交付(fu)軟件的新方(fang)式,方(fang)便企業(ye)和開(kai)發者用GPU部署各(ge)種定制AI模(mo)型。
4、宣布臺積(ji)電、新(xin)思科技將突破性的光(guang)刻計算平臺cuLitho投入生(sheng)產:cuLitho將計算光(guang)刻加速40-60倍(bei),并采(cai)用了增強的生(sheng)成式AI算法,將為2nm及(ji)更先(xian)進制程開發提供“神(shen)助攻”。
5、發布人(ren)形機(ji)(ji)器人(ren)基礎模型Project GR00T、新(xin)款人(ren)形機(ji)(ji)器人(ren)計算機(ji)(ji)Jetson Thor,對Isaac機(ji)(ji)器人(ren)平臺進行重大升級(ji),推(tui)動(dong)具(ju)身智能突破。黃(huang)仁勛還將一對來自迪士尼研究公司的(de)小型英偉達(da)機(ji)(ji)器人(ren)帶上臺互動(dong)。
6、與蘋果強(qiang)強(qiang)聯手,將Omniverse平臺引入蘋果Vision Pro,并(bing)宣布為工業數字孿生軟(ruan)件工具提供Omniverse Cloud API。
不過或許是被(bei)預期到的(de)內容太多,市場情緒并沒有被(bei)刺激到瘋長。截至美(mei)股(gu)收(shou)盤,英偉達最(zui)新(xin)(xin)股(gu)價為884.55美(mei)元/股(gu),漲幅0.70%,最(zui)新(xin)(xin)市值為22114億美(mei)元。
一、AI芯片新皇登場:2080億顆晶體管,2.5倍訓練性能、5倍推理性能
進入(ru)生成(cheng)式(shi)AI新(xin)紀元(yuan),AI計算需求爆發式(shi)增長,而一路演進的英偉達GPU憑借傲視群雄(xiong)的實戰算力(li),令全球AI行業患上“英偉達GPU饑渴癥”,一眾(zhong)AI巨(ju)頭重金難買(mai)黃仁勛點(dian)頭。
當(dang)Hopper GPU還(huan)是AI競(jing)賽爭搶的(de)重點資源,超越(yue)它的(de)繼任者——Blackwell GPU正式發布(bu)!
每一代英(ying)偉(wei)達(da)GPU架(jia)構都會(hui)以一位科(ke)學(xue)(xue)家的(de)名字來命名。新(xin)架(jia)構取名Blackwell是為了(le)致敬美國科(ke)學(xue)(xue)院首位黑人(ren)院士、杰出統計學(xue)(xue)家兼數學(xue)(xue)家David Blackwell。Blackwell擅長將復雜的(de)問題(ti)簡單化,他獨立發明的(de)“動態規劃(hua)”、“更新(xin)定(ding)理”被廣泛多個科(ke)學(xue)(xue)及工程學(xue)(xue)領域。
▲David Blackwell舊照
黃仁勛(xun)說,生成式AI是這個時代的決定性技術,Blackwell是推(tui)動(dong)這場新(xin)工業革(ge)命的引(yin)擎。
Blackwell GPU有(you)6大核心技術:
1、號稱是“世界最強大的芯片”:集成2080億顆晶體管,采用定制臺積電4NP工藝,承襲“拼裝芯片”的思路,采用統一內存架構+雙芯配置,將2個受光刻模板(reticle)限制的GPU die通過10TB/s芯片間NVHyperfuse接口連一個統一GPU,共有192GB HBM3e內存、8TB/s顯存帶寬,單卡AI訓練算力可達20PFLOPS。
跟上一(yi)代Hopper相比(bi),Blackwell因為集成了兩個(ge)die,面積(ji)變大(da),比(bi)Hopper GPU足足多(duo)了1280億個(ge)晶體(ti)管。對比(bi)之下,前代H100只有80GB HBM3內(nei)存、3.35TB/s帶寬,H200有141GB HBM3e內(nei)存、4.8TB/s帶寬。
2、第二代Transformer引擎:將新的微張量縮放支持和先進的動態范圍管理算法與TensorRT-LLM和NeMo Megatron框架結合,使Blackwell具備在FP4精度的AI推理能力,可支持2倍的計算和(he)模型規(gui)模,能在將性(xing)能和(he)效率翻倍的同時(shi)保持混(hun)合專家模型的高精度。
在全新FP4精度下,Blackwell GPU的AI性能達到Hopper的5倍。英偉達并未透露其CUDA核心的性能,有(you)關架構的更多細節還有(you)待揭曉(xiao)。
3、第五代NVLink:為(wei)了加速(su)萬億參數和混合(he)專家模(mo)型(xing)的(de)性能(neng),新一代NVLink為(wei)每個(ge)GPU提供1.8TB/s雙向帶寬,支持多(duo)達576個(ge)GPU間的(de)無縫高速(su)通(tong)信,適用于復雜大語言模(mo)型(xing)。
單顆NVLink Switch芯片(pian)有500億顆晶體管,采(cai)用(yong)臺(tai)積電(dian)4NP工藝,以1.8TB/s連接4個NVLink。
4、RAS引擎:Blackwell GPU包括一個確保可(ke)(ke)靠性(xing)(xing)、可(ke)(ke)用(yong)性(xing)(xing)、可(ke)(ke)維護性(xing)(xing)的(de)專用(yong)引擎(qing),還增加了(le)芯片級功能,可(ke)(ke)利(li)用(yong)基于AI的(de)預(yu)防性(xing)(xing)維護來進(jin)行診斷和預(yu)測可(ke)(ke)靠性(xing)(xing)問題,最大限(xian)度延(yan)長系統的(de)正常運(yun)(yun)行時間,提高大規模(mo)AI部(bu)署(shu)的(de)彈性(xing)(xing),一次可(ke)(ke)不(bu)間斷地(di)運(yun)(yun)行數(shu)周(zhou)甚至數(shu)月,并降低(di)運(yun)(yun)營成本。
5、安全AI:先進的(de)機密(mi)計算功能(neng)可保(bao)護AI模型和客戶數據,而不會(hui)影響性能(neng),支持新的(de)本地(di)接口加(jia)密(mi)協議。
6、解壓縮引擎:支(zhi)持最新格(ge)式,加速數(shu)據(ju)(ju)庫(ku)查詢,以(yi)提(ti)供數(shu)據(ju)(ju)分析和數(shu)據(ju)(ju)科學的最高(gao)性(xing)能(neng)。
AWS、戴爾(er)、谷歌、Meta、微軟、OpenAI、甲骨文、特斯(si)拉、xAI都將采用(yong)Blackwell產(chan)品。特斯(si)拉和(he)xAI共同的(de)CEO馬斯(si)克直言:“目前(qian)在AI領(ling)域,沒有比英(ying)偉達(da)硬件更好的(de)。”
值得(de)注(zhu)意的(de)是,相比(bi)以往強(qiang)調單芯片(pian)的(de)性能表現(xian),此次Blackwell系列發(fa)布更側重在整體系統(tong)性能,并對GPU代號稱(cheng)謂模糊,大部分都統(tong)稱(cheng)為(wei)“Blackwell GPU”。
按此前市場傳言,B100價(jia)格可能大約(yue)是3萬(wan)美元,B200售價(jia)約(yue)為3.5萬(wan)美元,這樣來算(suan),價(jia)格只比(bi)前代提升(sheng)不到50%,訓(xun)練性(xing)能卻提高(gao)2.5倍,性(xing)價(jia)比(bi)明顯更高(gao)。
如果(guo)定(ding)價漲(zhang)幅不大(da),Blackwell系列GPU的(de)市場競爭力將(jiang)強到可怕,性能提升足夠兇猛,性價比相較上一代Hopper變更高,這讓同行怎么打?
二、面向萬億參數級GPU計算優化,推出全新網絡交換機、AI超級計算機
Blackwell平(ping)臺除了基礎的HGX B100外,還包(bao)括NVLink Switch、GB200超級芯(xin)片計算節點、X800系列(lie)網(wang)絡交換機。
其中,X800系列是(shi)專(zhuan)為(wei)大(da)規(gui)模AI量身訂制的全新(xin)網絡(luo)交(jiao)換機(ji),以支(zhi)持新(xin)型AI基礎設施輕松運行萬億參數級(ji)生成式(shi)AI業務。
英偉達Quantum-X800 InfiniBand網絡和Spectrum-X800以太網絡是全球首批端到端吞吐量高達800Gb/s的(de)網(wang)絡(luo)(luo)平臺,交換帶寬容量較前代產品(pin)提高5倍,網(wang)絡(luo)(luo)計算能力(li)通過英(ying)偉達第四(si)代SHARP技術提高了9倍,網(wang)絡(luo)(luo)計算性能達到14.4TFLOPS。早(zao)期(qi)用戶有微軟Azure、甲骨文云(yun)基礎設施、Coreweave等。
Spectrum-X800平臺專為(wei)(wei)多租戶(hu)環境(jing)打造,可實現(xian)每個租戶(hu)的AI工(gong)作(zuo)負(fu)載(zai)的性能隔離(li),為(wei)(wei)生成(cheng)式AI云和大型企業(ye)級用戶(hu)帶來優化的網絡性能。
同時(shi),英(ying)偉達提供(gong)網(wang)絡加速通信庫、軟(ruan)(ruan)件(jian)(jian)(jian)開發套件(jian)(jian)(jian)和管理軟(ruan)(ruan)件(jian)(jian)(jian)等全套軟(ruan)(ruan)件(jian)(jian)(jian)方案(an)。
英偉達稱GB200 Grace Blackwell超級芯片是為萬億參數規模生成式AI設計的處理器。該芯片通過900GB/s第五代NVLink-C2C互連技術將2個Blackwell GPU連接到1個英偉達Grace CPU。但英偉(wei)達并沒有明確Blackwell GPU的(de)具體型號(hao)。
一個GB200超級(ji)芯片計算節點可(ke)內(nei)置2個GB200超級(ji)芯片。一個NVLink交(jiao)換(huan)機(ji)節點可(ke)支(zhi)持2個NVLink交(jiao)換(huan)機(ji),總(zong)帶寬達到14.4TB/s。
一個(ge)Blackwell計(ji)算節點(dian)包含(han)2個(ge)Grace CPU和(he)4個(ge)Blackwell GPU,AI性能達到80PFLOPS。
有了更強的GPU和網絡性能,黃仁勛宣布推出一款全新計算單元——多節點、液冷、機架級系統英偉達GB200 NVL72。
GB200 NVL72像一個“巨型GPU”,能像單卡GPU一樣運作,AI訓練性能達到720PFLOPS,AI推理性能高達1.44EFLOPS,擁有30TB快速顯存,可處理高達27萬(wan)億(yi)個參(can)數的大語(yu)言模(mo)型,是最新DGX SuperPOD的構建模(mo)塊(kuai)。
GB200 NVL72可(ke)組合36個GB200超級芯(xin)片(共有(you)72個B200 GPU和36個Grace CPU),通過第五代NVLink互(hu)連,還包括(kuo)BlueField-3 DPU。
黃仁(ren)勛說,目前(qian)全(quan)球只有幾臺EFLOPS級(ji)的(de)機器,這臺機器由60萬個(ge)(ge)零件組(zu)成,重達3000磅(bang),是一個(ge)(ge)“在單個(ge)(ge)機架上(shang)的(de)EFLOPS AI系統”。
在跑萬(wan)億參數模型(xing)時,GB200經(jing)過多維(wei)度的優化,單個GPU每(mei)秒Tokens吞(tun)吐(tu)量(liang)能多達(da)H200 FP8精度的30倍(bei)。
對于大語言模型推理(li),與相同(tong)數量的H100相比,GB200 NVL72可(ke)提供(gong)30倍的性(xing)能提升,并將成(cheng)本和能耗降低為(wei)前(qian)代的1/25。
AWS、谷歌云、微軟Azure、甲骨文云基礎設施等主流云均支持訪問GB200 NVL72。
此外,英偉達推出用于AI模型訓練、微調和推理的統一AI超級計算平臺DGX B200系統。
DGX B200系統是DGX系列的第六代產品,采用風冷傳統機架式設計,包括8個B200 GPU、2個第五代英特爾至強處理器,在FP4精度下可提供144PFLOPS的AI性能、1.4TB超大容量GPU顯存、64TB/s顯存帶寬,能使萬億參數模型的實時推理速度快至上一代的15倍。
該系統包含(han)帶有8個ConnectX-7網(wang)卡(ka)和2個BlueField-3 DPU的先進網(wang)絡,每(mei)個連接帶寬高達400Gb/s,可通過Quantum-2 InfiniBand和Spectrum-X以太網(wang)網(wang)絡平臺提(ti)供更高AI性(xing)能。
英偉達還推出了采用DGX GB200系(xi)統的下一代(dai)數據中心級AI超(chao)級計(ji)算機DGX SuperDOD,可滿足處理(li)萬(wan)億參數模型,確(que)保超(chao)大(da)規(gui)模生成式AI訓練和推理(li)工(gong)作(zuo)負(fu)載的(de)持續運行(xing)。
新一代DGX SuperPOD由8個或(huo)更多DGX GB200系統(tong)構建(jian)而生,具有全新高效(xiao)液冷(leng)機(ji)(ji)架級(ji)擴展(zhan)架構,在FP4精度下(xia)可提供(gong)11.5EFLOPS的AI算力和240TB快速顯存(cun),并(bing)能通過機(ji)(ji)架來擴展(zhan)性能。
每個DGX GB200系統有36個GB200超級芯片。與H100相比,GB200超(chao)級芯片在跑大語言模型推理(li)的性能可提升高達(da)45倍。
黃仁勛說(shuo),未來數據中心將被認為(wei)(wei)是AI工(gong)廠,整個行業都在為(wei)(wei)Blackwell做(zuo)準備。
三、推出數十個企業級生成式AI微服務,方便企業定制和部署Copilots
硬件是殺手锏,軟件則是護(hu)城河。
今天,英偉達繼續擴大憑借CUDA和生成式AI生態積累的優勢,推出數十個企業級生成式AI微服務,以便開發者(zhe)在英(ying)偉達CUDA GPU安裝基(ji)礎上(shang)創建和部署生(sheng)成式AI Copilots。
黃仁勛(xun)說,生成式(shi)AI改變了應用程序編程方式(shi),企業不再編寫(xie)軟件,而是(shi)組裝(zhuang)AI模型,指定任務,給出工作產品示例,審查計劃和中間結果(guo)。
英(ying)偉達(da)(da)NIM是(shi)英(ying)偉達(da)(da)推理微服務的參考(kao),是(shi)由英(ying)偉達(da)(da)的加速計算庫和生成式AI模(mo)型(xing)(xing)構建的。微服務支持行(xing)業標準的API,在英(ying)偉達(da)(da)大型(xing)(xing)CUDA安裝(zhuang)基(ji)礎上(shang)工作,并針(zhen)對新的GPU進行(xing)優化。
企業可使用這些微服務在自己的平臺上創建和部署自定義應用程序,同時保留對其知識產權的完全所有權和控制權。NIM微服務提供由英偉達推理軟件支持的預構建生產AI容器,使開發人員能夠將部署時間從幾周縮短到幾分鐘。
NIM微服務可用于部署來自英偉達、AI21、Adept、Cohere、Getty Images、Shutterstock的模型,以及來自谷歌、Hugging Face、Meta、微(wei)軟、Mistral AI、Stability AI的開放模型。
用戶將能夠訪問來自(zi)亞馬遜(xun)SageMaker、谷歌Kubernetes引擎(qing)和(he)微軟Azure AI的NIM微服務(wu),并與Deepset、LangChain和(he)LlamaIndex等(deng)流行AI框架集(ji)成。
為加(jia)速AI應用(yong),企業可(ke)使用(yong)CUDA-X微(wei)服務,包括(kuo)定制(zhi)語(yu)音(yin)和(he)翻譯AI的(de)(de)英偉(wei)達(da)Riva、用(yong)于(yu)路(lu)徑優(you)化的(de)(de)英偉(wei)達(da)cuOpt、用(yong)于(yu)高分辨率氣候和(he)天氣模擬(ni)的(de)(de)英偉(wei)達(da)Earth-2等。一系列用(yong)于(yu)定制(zhi)模型(xing)開發的(de)(de)英偉(wei)達(da)NeMo微(wei)服務即將推出(chu)。
開發者可在(zai)ai.nvidia.com免費試用英偉達(da)(da)微服(fu)務。企(qi)業可使用英偉達(da)(da)AI Enterprise 5.0部署生(sheng)產級NIM微服(fu)務。
四、推生成式AI算法,聯手兩大芯片界頂流,英偉達要掀起光刻計算新革命!
在去年的(de)(de)GTC大(da)會上,英(ying)偉達面向(xiang)芯(xin)片制造行業甩出一項秘密(mi)研發4年的(de)(de)大(da)招:通過突破性的(de)(de)光刻(ke)計(ji)算(suan)庫cuLitho,將計(ji)算(suan)光刻(ke)加速(su)(su)40-60倍,加速(su)(su)突破生產2nm及更先進芯(xin)片的(de)(de)物理極限。()
這(zhe)個項目的合作者,都是芯(xin)片產業鏈最(zui)鼎盛的存在——全球最(zui)大AI芯(xin)片巨頭(tou)英(ying)偉達(da)、全球最(zui)大晶(jing)圓代工商(shang)臺積電、全球最(zui)大EDA巨頭(tou)新思科技(ji)。
計算光刻技術是芯片制造的基石。今天,在cuLitho加速流程的基礎上,通過生(sheng)成式AI算法將工作流的速度又(you)提升了2倍(bei)。
具體(ti)來說,晶(jing)圓廠工藝的許(xu)多(duo)變化(hua)需修正OPC(光(guang)學鄰近校(xiao)正),會增加計算(suan)量,造成(cheng)開發瓶頸。cuLitho提供(gong)的加速計算(suan)和生(sheng)成(cheng)式AI則能緩解(jie)這些(xie)問題。應用生(sheng)成(cheng)式AI可創建近乎完美的反掩(yan)模(mo)(mo)或向解(jie)決方案來解(jie)決光(guang)衍射問題,然后再通過傳統(tong)的物理(li)嚴(yan)格方法推導(dao)出最終的光(guang)掩(yan)模(mo)(mo),從而將(jiang)整個OPC過程(cheng)加快2倍。
在(zai)芯片(pian)制(zhi)造過程(cheng)中,計算(suan)光(guang)刻是計算(suan)最密集的工作負載(zai),每年在(zai)CPU上消耗(hao)數百(bai)億(yi)小時。相比(bi)基于(yu)CPU的方法,基于(yu)GPU加(jia)速計算(suan)光(guang)刻的庫cuLitho能夠大(da)大(da)改進了(le)芯片(pian)制(zhi)造工藝。
通過加速計算,350個英偉達H100系統可取代40000個CPU系(xi)統(tong),大(da)幅提高(gao)了吞吐量,加快生產,降低成本(ben)、空間和功(gong)耗。
“我們正在將英偉達cuLitho在臺積(ji)電投入(ru)生(sheng)產。”臺積(ji)電總裁魏哲家(jia)(jia)說(shuo),雙方合作將GPU加速(su)計算整(zheng)合到臺積(ji)電的工(gong)作流(liu)程(cheng)中,實現了(le)性能的巨(ju)大飛躍。在共(gong)享(xiang)工(gong)作流(liu)程(cheng)上(shang)測(ce)試cuLitho時,兩(liang)家(jia)(jia)公司共(gong)同實現了(le)曲線(xian)流(liu)程(cheng)45倍的加速(su)以及傳統曼哈(ha)頓(dun)流(liu)程(cheng)近60倍的改進。
五、全新人形機器人基礎模型、計算機來了!?Isaac機器人平臺重大更新
除了生成式AI,英偉達還相當看好具身智能,并發布了人形機器人通用基礎模型Project GR00T、基于Thor SoC的新型人形機器人計算機Jetson Thor。
黃仁(ren)勛說:“開發通用(yong)人形機器人基礎模型是當今AI領域中最(zui)令人興奮(fen)的課題之(zhi)一。”
GR00T驅動的機器(qi)人(ren)能理解自(zi)然(ran)語言(yan),并通過觀察人(ren)類行為來模(mo)仿(fang)快速(su)學(xue)習協調、靈活性(xing)和(he)其它(ta)技能,以適應現(xian)實世界(jie)并與之互(hu)動。黃(huang)仁勛展示了多臺這樣的機器(qi)人(ren)是如何完成各種任務的。
Jetson Thor具有針對性能、功耗(hao)和(he)尺寸優(you)化的模(mo)塊化架構(gou)。該SoC包括一個帶有Transformer引擎的下一代Blackwell GPU,以運行GR00T等多模(mo)態(tai)生(sheng)成式AI模(mo)型。
英偉達正(zheng)為領先的(de)人(ren)形機器人(ren)公司開(kai)發一個綜合的(de)AI平臺,如1X、Agility Robotics、Apptronik、波士頓動力、Figure AI、傅利葉(xie)智能(neng)、Sanctuary AI、宇(yu)樹科技和小鵬鵬行等(deng)。
此外,英偉達對Isaac機器人平臺進行了重大升級,包括生成式AI基礎模型和仿真工具、AI工作流基礎設施。新功(gong)能將在下個(ge)季度推出(chu)。
英(ying)偉達還發布了一系列(lie)機器人預訓(xun)練模型、庫和(he)參考(kao)硬件(jian)。比(bi)如(ru)Isaac Manipulator,為(wei)機械臂提供了靈活性和(he)模塊化AI功(gong)(gong)能,以及一系列(lie)基礎(chu)模型和(he)GPU加速庫;Isaac Perceptor,提供了先進的(de)多(duo)攝像頭(tou)、3D重建、深度感(gan)知等功(gong)(gong)能。
六、Omniverse平臺新進展:挺進蘋果Vision Pro,發布云API
英偉達(da)宣布將Omniverse平(ping)臺引入(ru)蘋(pin)果Vision Pro。
面向工業數字孿生應用,英偉達將以API形式提供Omniverse Cloud。開發人員可借助該API將交互式工業(ye)數字孿(luan)生流(liu)傳輸到VR頭(tou)顯中。
通(tong)過使用API,開發者能輕松地將(jiang)Omniverse的核心技術直接集(ji)(ji)成到現有的數(shu)字孿(luan)生(sheng)設計(ji)與自(zi)動化(hua)軟件應用中,或是集(ji)(ji)成到用于測試和驗(yan)證機器人或自(zi)動駕駛汽車(che)等自(zi)主(zhu)機器的仿(fang)真工作流中。
黃仁(ren)勛相信所有制(zhi)造出來的產品都將擁有數(shu)(shu)字(zi)孿生,Omniverse是(shi)一個可以構建(jian)并操(cao)作(zuo)(zuo)物(wu)理(li)真實的數(shu)(shu)字(zi)孿生的操(cao)作(zuo)(zuo)系(xi)統。他認(ren)為:“Omniverse和(he)生成(cheng)式(shi)AI都是(shi)將價值高達50萬億美元的重工業市場進行數(shu)(shu)字(zi)化所需的基(ji)礎技術。”
5款全新Omniverse Cloud API既可單獨使用,又可組合使用:USD Render(生成OpenUSD數據的全光線追蹤RTX渲染),USD Write(讓用戶能夠修改OpenUSD數據并與之交互),USD Query(支持場景查詢和交互式場景),USD Notify(追蹤USD變化并提供更新信息),Omniverse Channel(連接用戶、工具和世界(jie),實現跨場景協作)。
Omniverse Cloud API將于今(jin)年晚些時候在微軟Azure上(shang)以(yi)英偉達A10 GPU上(shang)的自托(tuo)管(guan)API,或是部署(shu)在英偉達OVX上(shang)的托(tuo)管(guan)服務的形式提供。
結語:重頭戲結束了,但好戲才剛剛開始
除(chu)了上述重要發(fa)布外,黃仁(ren)勛(xun)還在演講(jiang)中分享了這些(xie)進(jin)展:
在(zai)電(dian)信領域,英(ying)偉達推出6G研究云平臺(tai),這是(shi)一個生成式AI和Omniverse驅動(dong)的(de)平臺(tai),旨在(zai)推進無線通信技術(shu)開發。
英偉(wei)達(da)的(de)地球(qiu)氣候數字孿生云平(ping)臺Earth-2現已可(ke)用,可(ke)實現交互式(shi)高(gao)分辨率模擬,以加速(su)氣候和天氣預(yu)測。
黃仁勛(xun)認為,AI的最(zui)大影響將(jiang)是在醫療健康領域(yu),英偉達已經(jing)在成(cheng)像(xiang)系統、基(ji)因測序(xu)儀器和與領先的手術機器人公司合(he)作,并正(zheng)在推出一種新型生物軟件。
在汽(qi)車(che)行業,全(quan)球最(zui)大的自動駕駛汽(qi)車(che)公司比亞迪未來(lai)電(dian)動汽(qi)車(che)將(jiang)搭(da)載(zai)英偉達采用Blackwell架構(gou)新一代自動駕駛汽(qi)車(che)(AV)處理器DRIVE Thor。DRIVE Thor預計(ji)最(zui)早將(jiang)于(yu)明(ming)年開始(shi)量產(chan),性能高達1000TFLOPS。
黃仁勛說(shuo):“英偉達的靈魂是計算機圖形學、物理學和人(ren)工(gong)(gong)智能的交集。”在演講結束時,他劃(hua)了5個重點:新工(gong)(gong)業、Blackwell平臺(tai)、NIM微服務、NEMO和AI代工(gong)(gong)廠、Omniverse和Isaac機器人(ren)。
今天(tian),英(ying)偉達再度刷新AI硬(ying)件和軟(ruan)件天(tian)花板,并帶來了一(yi)場圍繞AI、大模型(xing)、元宇宙、機器人、智能駕(jia)駛、醫療健康、量子計算等前沿科(ke)技的饕餮盛(sheng)宴(yan)。
黃仁勛的主題演講無(wu)(wu)疑(yi)是GTC大會(hui)的重頭戲,但對于現場(chang)和遠(yuan)程的參(can)會(hui)者(zhe)來(lai)說(shuo),精彩(cai)才剛(gang)(gang)剛(gang)(gang)拉開序幕!接下來(lai),超1000場(chang)圍繞英(ying)偉達(da)最(zui)新進展(zhan)以及熱門(men)前沿技術的演講、對話(hua)、培(pei)訓(xun)和圓(yuan)桌討論將展(zhan)開。多位參(can)會(hui)觀眾表達(da)了對“分(fen)身乏術”的無(wu)(wu)奈,他們(men)不(bu)得(de)不(bu)在有限的時間(jian)里(li)精挑細選(xuan),忍(ren)痛割愛(ai),沒法一(yi)口氣(qi)參(can)與所有感興趣的內容。
作為AI產業的重要風向標,GTC 2024為技(ji)術(shu)交(jiao)流搭建了一(yi)(yi)個空(kong)前(qian)盛大的平臺(tai),期間的新品發布和技(ji)術(shu)分享有望給學術(shu)研究和相關產業鏈帶來積極影響。新一(yi)(yi)代Blackwell架構的更多(duo)技(ji)術(shu)細節還有待進一(yi)(yi)步挖掘。智東(dong)西和芯(xin)東(dong)西將從現(xian)場持(chi)續(xu)發來一(yi)(yi)手報道,敬請關注。