黄仁勋甩出最强AI核弹！GPU新架构性能暴涨30倍，首发人形机器人大模型，联手苹果闯MR

智東西（公眾號：zhidxcom）
作者 | ZeR0
編輯 | 心緣

智東西美國圣何塞3月18日現場報道，時隔5年，全球頂尖AI計算技術盛會、年度NVIDIA GTC大會重磅回歸線下，就在剛剛，英偉達創始人兼CEO黃仁勛發表長達123分鐘的主題演講，發布AI芯片最新震圈之作——Blackwell GPU，智(zhi)東(dong)西受邀參會(hui)并從現場發來完整(zheng)的干貨報道。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

在這(zhe)場(chang)大會(hui)上，英偉達展現出堪稱(cheng)恐怖的(de)行(xing)業(ye)(ye)號(hao)召力，將(jiang)AI圈的(de)頂(ding)尖技術(shu)大牛(niu)和(he)行(xing)業(ye)(ye)精英匯聚在一起。現場(chang)盛況空前，線下參(can)會(hui)者逾萬人。智(zhi)東西此行(xing)遇到許多來自國(guo)(guo)內(nei)的(de)參(can)展商或(huo)觀眾，明顯(xian)感(gan)受到國(guo)(guo)內(nei)企業(ye)(ye)和(he)開發(fa)者對這(zhe)場(chang)AI盛會(hui)的(de)熱情(qing)。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

當地時間3月(yue)18日13點，北京19日凌(ling)晨(chen)4點，GTC最重磅的主題演講正式開始，在播放一段AI主題短片后，黃仁(ren)勛穿(chuan)著標志性的黑色皮衣從(cong)圣何塞SAP中心(xin)場館主舞臺登場，與觀眾寒(han)暄。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

他首(shou)(shou)先回顧了英偉達30年來(lai)追求加速計(ji)算(suan)旅程的開端，歷數研發革命性(xing)計(ji)算(suan)模式(shi)CUDA、將首(shou)(shou)臺(tai)AI超(chao)級計(ji)算(suan)機DGX交給(gei)OpenAI等一(yi)系列(lie)里程碑事件，然后將話題自(zi)然地聚焦到生成式(shi)AI上。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

在宣布與(yu)多家(jia)EDA龍頭的(de)(de)重要(yao)合作(zuo)伙伴(ban)關系(xi)后，他(ta)談到(dao)快速(su)演進的(de)(de)AI模(mo)型帶動訓練算(suan)力需求暴漲，需要(yao)更大的(de)(de)GPU，“加速(su)計(ji)算(suan)已(yi)達到(dao)臨界點，通用計(ji)算(suan)已(yi)失去(qu)動力”，“在每一個行(xing)業，加速(su)計(ji)算(suan)都比通用計(ji)算(suan)有了巨大的(de)(de)提升”。

緊接著，大屏幕上過電影般快速閃現從GPU、超級芯片到超級計算機、集群系統的一系列關鍵組件，然后黃仁勛重磅宣布：全新旗艦AI芯片Blackwell GPU，來了！

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

這是GPGPU領域最新的震圈(quan)之作，從配置到性能(neng)都將前輩Hopper GPU拍倒在沙灘(tan)上。他舉起雙手(shou)展示了Blackwell和Hopper GPU的對比，Blackwell GPU明顯大了一圈(quan)。

畢竟手(shou)心(xin)手(shou)背都(dou)是肉，對比完后，黃仁(ren)勛馬上開始(shi)安慰：“It’s OK, Hopper. You’re very good, good boy, or good girl.”

但也不能怪老(lao)黃喜新厭(yan)舊，因為Blackwell的性能，實在是(shi)(shi)太(tai)強了(le)！無論(lun)是(shi)(shi)FP8，還是(shi)(shi)全新的FP6、FP4精度，以(yi)及HBM能塞下的模(mo)(mo)型規模(mo)(mo)和HBM帶寬，都做到“倍(bei)殺”前代Hopper。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

8年，從Pascal架構到Blackwell架構，英偉達將AI計算性能提升了1000倍！

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

這還只是開胃小菜，黃仁勛真正的“胃口”，是打造足以優化萬億參數級GPU計算的最強AI基礎設施(shi)。

總體來看，英偉達在本屆GTC大會上連發(fa)6個大招：

1、發布Blackwell GPU：訓練(lian)性(xing)(xing)能(neng)(neng)提升至(zhi)2.5倍(bei)，FP4精度推(tui)理性(xing)(xing)能(neng)(neng)提升至(zhi)前(qian)代(dai)FP8的(de)5倍(bei)；升級第(di)五代(dai)NVLink，互連速(su)度是Hopper的(de)2倍(bei)，可(ke)擴(kuo)展(zhan)到576個(ge)GPU，能(neng)(neng)夠解決萬億參數混合專家模型通信瓶頸。

2、Blackwell平臺“全(quan)家(jia)桶”登(deng)場：既面(mian)向(xiang)萬(wan)億參(can)數級(ji)GPU計(ji)算(suan)優化，推出全(quan)新網(wang)絡交換機(ji)X800系列(lie)，吞吐量高(gao)達800Gb/s；又發布GB200超級(ji)芯片、GB200 NVL72系統、DGX B200系統、新一代DGX SuperPOD AI超級(ji)計(ji)算(suan)機(ji)。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

3、推出數(shu)十個企業(ye)級生成式AI微(wei)服務，提供一種封裝和交付(fu)軟件的新方(fang)式，方(fang)便企業(ye)和開(kai)發者用GPU部署各(ge)種定制AI模(mo)型。

4、宣布臺積(ji)電、新(xin)思科技將突破性的光(guang)刻計算平臺cuLitho投入生(sheng)產：cuLitho將計算光(guang)刻加速40-60倍(bei)，并采(cai)用了增強的生(sheng)成式AI算法，將為2nm及(ji)更先(xian)進制程開發提供“神(shen)助攻”。

5、發布人(ren)形機(ji)(ji)器人(ren)基礎模型Project GR00T、新(xin)款人(ren)形機(ji)(ji)器人(ren)計算機(ji)(ji)Jetson Thor，對Isaac機(ji)(ji)器人(ren)平臺進行重大升級(ji)，推(tui)動(dong)具(ju)身智能突破。黃(huang)仁勛還將一對來自迪士尼研究公司的(de)小型英偉達(da)機(ji)(ji)器人(ren)帶上臺互動(dong)。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

6、與蘋果強(qiang)強(qiang)聯手，將Omniverse平臺引入蘋果Vision Pro，并(bing)宣布為工業數字孿生軟(ruan)件工具提供Omniverse Cloud API。

不過或許是被(bei)預期到的(de)內容太多，市場情緒并沒有被(bei)刺激到瘋長。截至美(mei)股(gu)收(shou)盤，英偉達最(zui)新(xin)(xin)股(gu)價為884.55美(mei)元/股(gu)，漲幅0.70%，最(zui)新(xin)(xin)市值為22114億美(mei)元。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

一、AI芯片新皇登場：2080億顆晶體管，2.5倍訓練性能、5倍推理性能

進入(ru)生成(cheng)式(shi)AI新(xin)紀元(yuan)，AI計算需求爆發式(shi)增長，而一路演進的英偉達GPU憑借傲視群雄(xiong)的實戰算力(li)，令全球AI行業患上“英偉達GPU饑渴癥”，一眾(zhong)AI巨(ju)頭重金難買(mai)黃仁勛點(dian)頭。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

當(dang)Hopper GPU還(huan)是AI競(jing)賽爭搶的(de)重點資源，超越(yue)它的(de)繼任者——Blackwell GPU正式發布(bu)！

每一代英(ying)偉(wei)達(da)GPU架(jia)構都會(hui)以一位科(ke)學(xue)(xue)家的(de)名字來命名。新(xin)架(jia)構取名Blackwell是為了(le)致敬美國科(ke)學(xue)(xue)院首位黑人(ren)院士、杰出統計學(xue)(xue)家兼數學(xue)(xue)家David Blackwell。Blackwell擅長將復雜的(de)問題(ti)簡單化，他獨立發明的(de)“動態規劃(hua)”、“更新(xin)定(ding)理”被廣泛多個科(ke)學(xue)(xue)及工程學(xue)(xue)領域。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR ▲David Blackwell舊照

黃仁勛(xun)說，生成式AI是這個時代的決定性技術，Blackwell是推(tui)動(dong)這場新(xin)工業革(ge)命的引(yin)擎。

Blackwell GPU有(you)6大核心技術：

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

1、號稱是“世界最強大的芯片”：集成2080億顆晶體管，采用定制臺積電4NP工藝，承襲“拼裝芯片”的思路，采用統一內存架構+雙芯配置，將2個受光刻模板（reticle）限制的GPU die通過10TB/s芯片間NVHyperfuse接口連一個統一GPU，共有192GB HBM3e內存、8TB/s顯存帶寬，單卡AI訓練算力可達20PFLOPS。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

跟上一(yi)代Hopper相比(bi)，Blackwell因為集成了兩個(ge)die，面積(ji)變大(da)，比(bi)Hopper GPU足足多(duo)了1280億個(ge)晶體(ti)管。對比(bi)之下，前代H100只有80GB HBM3內(nei)存、3.35TB/s帶寬，H200有141GB HBM3e內(nei)存、4.8TB/s帶寬。

2、第二代Transformer引擎：將新的微張量縮放支持和先進的動態范圍管理算法與TensorRT-LLM和NeMo Megatron框架結合，使Blackwell具備在FP4精度的AI推理能力，可支持2倍的計算和(he)模型規(gui)模，能在將性(xing)能和(he)效率翻倍的同時(shi)保持混(hun)合專家模型的高精度。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

在全新FP4精度下，Blackwell GPU的AI性能達到Hopper的5倍。英偉達并未透露其CUDA核心的性能，有(you)關架構的更多細節還有(you)待揭曉(xiao)。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

3、第五代NVLink：為(wei)了加速(su)萬億參數和混合(he)專家模(mo)型(xing)的(de)性能(neng)，新一代NVLink為(wei)每個(ge)GPU提供1.8TB/s雙向帶寬，支持多(duo)達576個(ge)GPU間的(de)無縫高速(su)通(tong)信，適用于復雜大語言模(mo)型(xing)。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

單顆NVLink Switch芯片(pian)有500億顆晶體管，采(cai)用(yong)臺(tai)積電(dian)4NP工藝，以1.8TB/s連接4個NVLink。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

4、RAS引擎：Blackwell GPU包括一個確保可(ke)(ke)靠性(xing)(xing)、可(ke)(ke)用(yong)性(xing)(xing)、可(ke)(ke)維護性(xing)(xing)的(de)專用(yong)引擎(qing)，還增加了(le)芯片級功能，可(ke)(ke)利(li)用(yong)基于AI的(de)預(yu)防性(xing)(xing)維護來進(jin)行診斷和預(yu)測可(ke)(ke)靠性(xing)(xing)問題，最大限(xian)度延(yan)長系統的(de)正常運(yun)(yun)行時間，提高大規模(mo)AI部(bu)署(shu)的(de)彈性(xing)(xing)，一次可(ke)(ke)不(bu)間斷地(di)運(yun)(yun)行數(shu)周(zhou)甚至數(shu)月，并降低(di)運(yun)(yun)營成本。

5、安全AI：先進的(de)機密(mi)計算功能(neng)可保(bao)護AI模型和客戶數據，而不會(hui)影響性能(neng)，支持新的(de)本地(di)接口加(jia)密(mi)協議。

6、解壓縮引擎：支(zhi)持最新格(ge)式，加速數(shu)據(ju)(ju)庫(ku)查詢，以(yi)提(ti)供數(shu)據(ju)(ju)分析和數(shu)據(ju)(ju)科學的最高(gao)性(xing)能(neng)。

AWS、戴爾(er)、谷歌、Meta、微軟、OpenAI、甲骨文、特斯(si)拉、xAI都將采用(yong)Blackwell產(chan)品。特斯(si)拉和(he)xAI共同的(de)CEO馬斯(si)克直言：“目前(qian)在AI領(ling)域，沒有比英(ying)偉達(da)硬件更好的(de)。”

值得(de)注(zhu)意的(de)是，相比(bi)以往強(qiang)調單芯片(pian)的(de)性能表現(xian)，此次Blackwell系列發(fa)布更側重在整體系統(tong)性能，并對GPU代號稱(cheng)謂模糊，大部分都統(tong)稱(cheng)為(wei)“Blackwell GPU”。

按此前市場傳言，B100價(jia)格可能大約(yue)是3萬(wan)美元，B200售價(jia)約(yue)為3.5萬(wan)美元，這樣來算(suan)，價(jia)格只比(bi)前代提升(sheng)不到50%，訓(xun)練性(xing)能卻提高(gao)2.5倍，性(xing)價(jia)比(bi)明顯更高(gao)。

如果(guo)定(ding)價漲(zhang)幅不大(da)，Blackwell系列GPU的(de)市場競爭力將(jiang)強到可怕，性能提升足夠兇猛，性價比相較上一代Hopper變更高，這讓同行怎么打？

二、面向萬億參數級GPU計算優化，推出全新網絡交換機、AI超級計算機

Blackwell平(ping)臺除了基礎的HGX B100外，還包(bao)括NVLink Switch、GB200超級芯(xin)片計算節點、X800系列(lie)網(wang)絡交換機。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

其中，X800系列是(shi)專(zhuan)為(wei)大(da)規(gui)模AI量身訂制的全新(xin)網絡(luo)交(jiao)換機(ji)，以支(zhi)持新(xin)型AI基礎設施輕松運行萬億參數級(ji)生成式(shi)AI業務。

英偉達Quantum-X800 InfiniBand網絡和Spectrum-X800以太網絡是全球首批端到端吞吐量高達800Gb/s的(de)網(wang)絡(luo)(luo)平臺，交換帶寬容量較前代產品(pin)提高5倍，網(wang)絡(luo)(luo)計算能力(li)通過英(ying)偉達第四(si)代SHARP技術提高了9倍，網(wang)絡(luo)(luo)計算性能達到14.4TFLOPS。早(zao)期(qi)用戶有微軟Azure、甲骨文云(yun)基礎設施、Coreweave等。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

Spectrum-X800平臺專為(wei)(wei)多租戶(hu)環境(jing)打造，可實現(xian)每個租戶(hu)的AI工(gong)作(zuo)負(fu)載(zai)的性能隔離(li)，為(wei)(wei)生成(cheng)式AI云和大型企業(ye)級用戶(hu)帶來優化的網絡性能。

同時(shi)，英(ying)偉達提供(gong)網(wang)絡加速通信庫、軟(ruan)(ruan)件(jian)(jian)(jian)開發套件(jian)(jian)(jian)和管理軟(ruan)(ruan)件(jian)(jian)(jian)等全套軟(ruan)(ruan)件(jian)(jian)(jian)方案(an)。

英偉達稱GB200 Grace Blackwell超級芯片是為萬億參數規模生成式AI設計的處理器。該芯片通過900GB/s第五代NVLink-C2C互連技術將2個Blackwell GPU連接到1個英偉達Grace CPU。但英偉(wei)達并沒有明確Blackwell GPU的(de)具體型號(hao)。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

黃仁勛拿起GB200超級芯片展示，說這是同類計算機中第一個做到在這么小空間里容納如此多的計算，因此內存相連，它們“就像個快樂的大家庭，一起開發一個應用程序”。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

一個GB200超級(ji)芯片計算節點可(ke)內(nei)置2個GB200超級(ji)芯片。一個NVLink交(jiao)換(huan)機(ji)節點可(ke)支(zhi)持2個NVLink交(jiao)換(huan)機(ji)，總(zong)帶寬達到14.4TB/s。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

一個(ge)Blackwell計(ji)算節點(dian)包含(han)2個(ge)Grace CPU和(he)4個(ge)Blackwell GPU，AI性能達到80PFLOPS。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

有了更強的GPU和網絡性能，黃仁勛宣布推出一款全新計算單元——多節點、液冷、機架級系統英偉達GB200 NVL72。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

GB200 NVL72像一個“巨型GPU”，能像單卡GPU一樣運作，AI訓練性能達到720PFLOPS，AI推理性能高達1.44EFLOPS，擁有30TB快速顯存，可處理高達27萬(wan)億(yi)個參(can)數的大語(yu)言模(mo)型，是最新DGX SuperPOD的構建模(mo)塊(kuai)。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

GB200 NVL72可(ke)組合36個GB200超級芯(xin)片（共有(you)72個B200 GPU和36個Grace CPU），通過第五代NVLink互(hu)連，還包括(kuo)BlueField-3 DPU。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

黃仁(ren)勛說，目前(qian)全(quan)球只有幾臺EFLOPS級(ji)的(de)機器，這臺機器由60萬個(ge)(ge)零件組(zu)成，重達3000磅(bang)，是一個(ge)(ge)“在單個(ge)(ge)機架上(shang)的(de)EFLOPS AI系統”。

據他分享，以前用H100訓練GPT-MoE-1.8T大模型需要90天、消耗大約8000個GPU、15MW的電力。而現在用GB200 NVL72只需要2000個GPU、4MW的電力。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

在跑萬(wan)億參數模型(xing)時，GB200經(jing)過多維(wei)度的優化，單個GPU每(mei)秒Tokens吞(tun)吐(tu)量(liang)能多達(da)H200 FP8精度的30倍(bei)。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

對于大語言模型推理(li)，與相同(tong)數量的H100相比，GB200 NVL72可(ke)提供(gong)30倍的性(xing)能提升，并將成(cheng)本和能耗降低為(wei)前(qian)代的1/25。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

AWS、谷歌云、微軟Azure、甲骨文云基礎設施等主流云均支持訪問GB200 NVL72。

此外，英偉達推出用于AI模型訓練、微調和推理的統一AI超級計算平臺DGX B200系統。

DGX B200系統是DGX系列的第六代產品，采用風冷傳統機架式設計，包括8個B200 GPU、2個第五代英特爾至強處理器，在FP4精度下可提供144PFLOPS的AI性能、1.4TB超大容量GPU顯存、64TB/s顯存帶寬，能使萬億參數模型的實時推理速度快至上一代的15倍。

該系統包含(han)帶有8個ConnectX-7網(wang)卡(ka)和2個BlueField-3 DPU的先進網(wang)絡，每(mei)個連接帶寬高達400Gb/s，可通過Quantum-2 InfiniBand和Spectrum-X以太網(wang)網(wang)絡平臺提(ti)供更高AI性(xing)能。

英偉達還推出了采用DGX GB200系(xi)統的下一代(dai)數據中心級AI超(chao)級計(ji)算機DGX SuperDOD，可滿足處理(li)萬(wan)億參數模型，確(que)保超(chao)大(da)規(gui)模生成式AI訓練和推理(li)工(gong)作(zuo)負(fu)載的(de)持續運行(xing)。

新一代DGX SuperPOD由8個或(huo)更多DGX GB200系統(tong)構建(jian)而生，具有全新高效(xiao)液冷(leng)機(ji)(ji)架級(ji)擴展(zhan)架構，在FP4精度下(xia)可提供(gong)11.5EFLOPS的AI算力和240TB快速顯存(cun)，并(bing)能通過機(ji)(ji)架來擴展(zhan)性能。

每個DGX GB200系統有36個GB200超級芯片。與H100相比，GB200超(chao)級芯片在跑大語言模型推理(li)的性能可提升高達(da)45倍。

黃仁勛說(shuo)，未來數據中心將被認為(wei)(wei)是AI工(gong)廠，整個行業都在為(wei)(wei)Blackwell做(zuo)準備。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

三、推出數十個企業級生成式AI微服務，方便企業定制和部署Copilots

硬件是殺手锏，軟件則是護(hu)城河。

今天，英偉達繼續擴大憑借CUDA和生成式AI生態積累的優勢，推出數十個企業級生成式AI微服務，以便開發者(zhe)在英(ying)偉達CUDA GPU安裝基(ji)礎上(shang)創建和部署生(sheng)成式AI Copilots。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

黃仁勛(xun)說，生成式(shi)AI改變了應用程序編程方式(shi)，企業不再編寫(xie)軟件，而是(shi)組裝(zhuang)AI模型，指定任務，給出工作產品示例，審查計劃和中間結果(guo)。

英(ying)偉達(da)(da)NIM是(shi)英(ying)偉達(da)(da)推理微服務的參考(kao)，是(shi)由英(ying)偉達(da)(da)的加速計算庫和生成式AI模(mo)型(xing)(xing)構建的。微服務支持行(xing)業標準的API，在英(ying)偉達(da)(da)大型(xing)(xing)CUDA安裝(zhuang)基(ji)礎上(shang)工作，并針(zhen)對新的GPU進行(xing)優化。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

企業可使用這些微服務在自己的平臺上創建和部署自定義應用程序，同時保留對其知識產權的完全所有權和控制權。NIM微服務提供由英偉達推理軟件支持的預構建生產AI容器，使開發人員能夠將部署時間從幾周縮短到幾分鐘。

NIM微服務可用于部署來自英偉達、AI21、Adept、Cohere、Getty Images、Shutterstock的模型，以及來自谷歌、Hugging Face、Meta、微(wei)軟、Mistral AI、Stability AI的開放模型。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

用戶將能夠訪問來自(zi)亞馬遜(xun)SageMaker、谷歌Kubernetes引擎(qing)和(he)微軟Azure AI的NIM微服務(wu)，并與Deepset、LangChain和(he)LlamaIndex等(deng)流行AI框架集(ji)成。

為加(jia)速AI應用(yong)，企業可(ke)使用(yong)CUDA-X微(wei)服務，包括(kuo)定制(zhi)語(yu)音(yin)和(he)翻譯AI的(de)(de)英偉(wei)達(da)Riva、用(yong)于(yu)路(lu)徑優(you)化的(de)(de)英偉(wei)達(da)cuOpt、用(yong)于(yu)高分辨率氣候和(he)天氣模擬(ni)的(de)(de)英偉(wei)達(da)Earth-2等。一系列用(yong)于(yu)定制(zhi)模型(xing)開發的(de)(de)英偉(wei)達(da)NeMo微(wei)服務即將推出(chu)。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

開發者可在(zai)ai.nvidia.com免費試用英偉達(da)(da)微服(fu)務。企(qi)業可使用英偉達(da)(da)AI Enterprise 5.0部署生(sheng)產級NIM微服(fu)務。

四、推生成式AI算法，聯手兩大芯片界頂流，英偉達要掀起光刻計算新革命！

在去年的(de)(de)GTC大(da)會上，英(ying)偉達面向(xiang)芯(xin)片制造行業甩出一項秘密(mi)研發4年的(de)(de)大(da)招：通過突破性的(de)(de)光刻(ke)計(ji)算(suan)庫cuLitho，將計(ji)算(suan)光刻(ke)加速(su)(su)40-60倍，加速(su)(su)突破生產2nm及更先進芯(xin)片的(de)(de)物理極限。（）

這(zhe)個項目的合作者，都是芯(xin)片產業鏈最(zui)鼎盛的存在——全球最(zui)大AI芯(xin)片巨頭(tou)英(ying)偉達(da)、全球最(zui)大晶(jing)圓代工商(shang)臺積電、全球最(zui)大EDA巨頭(tou)新思科技(ji)。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

計算光刻技術是芯片制造的基石。今天，在cuLitho加速流程的基礎上，通過生(sheng)成式AI算法將工作流的速度又(you)提升了2倍(bei)。

具體(ti)來說，晶(jing)圓廠工藝的許(xu)多(duo)變化(hua)需修正OPC（光(guang)學鄰近校(xiao)正），會增加計算(suan)量，造成(cheng)開發瓶頸。cuLitho提供(gong)的加速計算(suan)和生(sheng)成(cheng)式AI則能緩解(jie)這些(xie)問題。應用生(sheng)成(cheng)式AI可創建近乎完美的反掩(yan)模(mo)(mo)或向解(jie)決方案來解(jie)決光(guang)衍射問題，然后再通過傳統(tong)的物理(li)嚴(yan)格方法推導(dao)出最終的光(guang)掩(yan)模(mo)(mo)，從而將(jiang)整個OPC過程(cheng)加快2倍。

在(zai)芯片(pian)制(zhi)造過程(cheng)中，計算(suan)光(guang)刻是計算(suan)最密集的工作負載(zai)，每年在(zai)CPU上消耗(hao)數百(bai)億(yi)小時。相比(bi)基于(yu)CPU的方法，基于(yu)GPU加(jia)速計算(suan)光(guang)刻的庫cuLitho能夠大(da)大(da)改進了(le)芯片(pian)制(zhi)造工藝。

通過加速計算，350個英偉達H100系統可取代40000個CPU系(xi)統(tong)，大(da)幅提高(gao)了吞吐量，加快生產，降低成本(ben)、空間和功(gong)耗。

“我們正在將英偉達cuLitho在臺積(ji)電投入(ru)生(sheng)產。”臺積(ji)電總裁魏哲家(jia)(jia)說(shuo)，雙方合作將GPU加速(su)計算整(zheng)合到臺積(ji)電的工(gong)作流(liu)程(cheng)中，實現了(le)性能的巨(ju)大飛躍。在共(gong)享(xiang)工(gong)作流(liu)程(cheng)上(shang)測(ce)試cuLitho時，兩(liang)家(jia)(jia)公司共(gong)同實現了(le)曲線(xian)流(liu)程(cheng)45倍的加速(su)以及傳統曼哈(ha)頓(dun)流(liu)程(cheng)近60倍的改進。

五、全新人形機器人基礎模型、計算機來了！?Isaac機器人平臺重大更新

除了生成式AI，英偉達還相當看好具身智能，并發布了人形機器人通用基礎模型Project GR00T、基于Thor SoC的新型人形機器人計算機Jetson Thor。

黃仁(ren)勛說：“開發通用(yong)人形機器人基礎模型是當今AI領域中最(zui)令人興奮(fen)的課題之(zhi)一。”

GR00T驅動的機器(qi)人(ren)能理解自(zi)然(ran)語言(yan)，并通過觀察人(ren)類行為來模(mo)仿(fang)快速(su)學(xue)習協調、靈活性(xing)和(he)其它(ta)技能，以適應現(xian)實世界(jie)并與之互(hu)動。黃(huang)仁勛展示了多臺這樣的機器(qi)人(ren)是如何完成各種任務的。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

Jetson Thor具有針對性能、功耗(hao)和(he)尺寸優(you)化的模(mo)塊化架構(gou)。該SoC包括一個帶有Transformer引擎的下一代Blackwell GPU，以運行GR00T等多模(mo)態(tai)生(sheng)成式AI模(mo)型。

英偉達正(zheng)為領先的(de)人(ren)形機器人(ren)公司開(kai)發一個綜合的(de)AI平臺，如1X、Agility Robotics、Apptronik、波士頓動力、Figure AI、傅利葉(xie)智能(neng)、Sanctuary AI、宇(yu)樹科技和小鵬鵬行等(deng)。

此外，英偉達對Isaac機器人平臺進行了重大升級，包括生成式AI基礎模型和仿真工具、AI工作流基礎設施。新功(gong)能將在下個(ge)季度推出(chu)。

英(ying)偉達還發布了一系列(lie)機器人預訓(xun)練模型、庫和(he)參考(kao)硬件(jian)。比(bi)如(ru)Isaac Manipulator，為(wei)機械臂提供了靈活性和(he)模塊化AI功(gong)(gong)能，以及一系列(lie)基礎(chu)模型和(he)GPU加速庫；Isaac Perceptor，提供了先進的(de)多(duo)攝像頭(tou)、3D重建、深度感(gan)知等功(gong)(gong)能。

六、Omniverse平臺新進展：挺進蘋果Vision Pro，發布云API

英偉達(da)宣布將Omniverse平(ping)臺引入(ru)蘋(pin)果Vision Pro。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

面向工業數字孿生應用，英偉達將以API形式提供Omniverse Cloud。開發人員可借助該API將交互式工業(ye)數字孿(luan)生流(liu)傳輸到VR頭(tou)顯中。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

通(tong)過使用API，開發者能輕松地將(jiang)Omniverse的核心技術直接集(ji)(ji)成到現有的數(shu)字孿(luan)生(sheng)設計(ji)與自(zi)動化(hua)軟件應用中，或是集(ji)(ji)成到用于測試和驗(yan)證機器人或自(zi)動駕駛汽車(che)等自(zi)主(zhu)機器的仿(fang)真工作流中。

黃仁(ren)勛相信所有制(zhi)造出來的產品都將擁有數(shu)(shu)字(zi)孿生，Omniverse是(shi)一個可以構建(jian)并操(cao)作(zuo)(zuo)物(wu)理(li)真實的數(shu)(shu)字(zi)孿生的操(cao)作(zuo)(zuo)系(xi)統。他認(ren)為：“Omniverse和(he)生成(cheng)式(shi)AI都是(shi)將價值高達50萬億美元的重工業市場進行數(shu)(shu)字(zi)化所需的基(ji)礎技術。”

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

5款全新Omniverse Cloud API既可單獨使用，又可組合使用：USD Render（生成OpenUSD數據的全光線追蹤RTX渲染），USD Write（讓用戶能夠修改OpenUSD數據并與之交互），USD Query（支持場景查詢和交互式場景），USD Notify（追蹤USD變化并提供更新信息），Omniverse Channel（連接用戶、工具和世界(jie)，實現跨場景協作）。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

Omniverse Cloud API將于今(jin)年晚些時候在微軟Azure上(shang)以(yi)英偉達A10 GPU上(shang)的自托(tuo)管(guan)API，或是部署(shu)在英偉達OVX上(shang)的托(tuo)管(guan)服務的形式提供。

結語：重頭戲結束了，但好戲才剛剛開始

除(chu)了上述重要發(fa)布外，黃仁(ren)勛(xun)還在演講(jiang)中分享了這些(xie)進(jin)展：

在(zai)電(dian)信領域，英(ying)偉達推出6G研究云平臺(tai)，這是(shi)一個生成式AI和Omniverse驅動(dong)的(de)平臺(tai)，旨在(zai)推進無線通信技術(shu)開發。

英偉(wei)達(da)的(de)地球(qiu)氣候數字孿生云平(ping)臺Earth-2現已可(ke)用，可(ke)實現交互式(shi)高(gao)分辨率模擬，以加速(su)氣候和天氣預(yu)測。

黃仁勛(xun)認為，AI的最(zui)大影響將(jiang)是在醫療健康領域(yu)，英偉達已經(jing)在成(cheng)像(xiang)系統、基(ji)因測序(xu)儀器和與領先的手術機器人公司合(he)作，并正(zheng)在推出一種新型生物軟件。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

在汽(qi)車(che)行業，全(quan)球最(zui)大的自動駕駛汽(qi)車(che)公司比亞迪未來(lai)電(dian)動汽(qi)車(che)將(jiang)搭(da)載(zai)英偉達采用Blackwell架構(gou)新一代自動駕駛汽(qi)車(che)（AV）處理器DRIVE Thor。DRIVE Thor預計(ji)最(zui)早將(jiang)于(yu)明(ming)年開始(shi)量產(chan)，性能高達1000TFLOPS。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

黃仁勛說(shuo)：“英偉達的靈魂是計算機圖形學、物理學和人(ren)工(gong)(gong)智能的交集。”在演講結束時，他劃(hua)了5個重點：新工(gong)(gong)業、Blackwell平臺(tai)、NIM微服務、NEMO和AI代工(gong)(gong)廠、Omniverse和Isaac機器人(ren)。

黃仁勛甩出最強AI核彈！GPU新架構性能暴漲30倍，首發人形機器人大模型，聯手蘋果闖MR

今天(tian)，英(ying)偉達再度刷新AI硬(ying)件和軟(ruan)件天(tian)花板，并帶來了一(yi)場圍繞AI、大模型(xing)、元宇宙、機器人、智能駕(jia)駛、醫療健康、量子計算等前沿科(ke)技的饕餮盛(sheng)宴(yan)。

黃仁勛的主題演講無(wu)(wu)疑(yi)是GTC大會(hui)的重頭戲，但對于現場(chang)和遠(yuan)程的參(can)會(hui)者(zhe)來(lai)說(shuo)，精彩(cai)才剛(gang)(gang)剛(gang)(gang)拉開序幕！接下來(lai)，超1000場(chang)圍繞英(ying)偉達(da)最(zui)新進展(zhan)以及熱門(men)前沿技術的演講、對話(hua)、培(pei)訓(xun)和圓(yuan)桌討論將展(zhan)開。多位參(can)會(hui)觀眾表達(da)了對“分(fen)身乏術”的無(wu)(wu)奈，他們(men)不(bu)得(de)不(bu)在有限的時間(jian)里(li)精挑細選(xuan)，忍(ren)痛割愛(ai)，沒法一(yi)口氣(qi)參(can)與所有感興趣的內容。

作為AI產業的重要風向標，GTC 2024為技(ji)術(shu)交(jiao)流搭建了一(yi)(yi)個空(kong)前(qian)盛大的平臺(tai)，期間的新品發布和技(ji)術(shu)分享有望給學術(shu)研究和相關產業鏈帶來積極影響。新一(yi)(yi)代Blackwell架構的更多(duo)技(ji)術(shu)細節還有待進一(yi)(yi)步挖掘。智東(dong)西和芯(xin)東(dong)西將從現(xian)場持(chi)續(xu)發來一(yi)(yi)手報道，敬請關注。

久久婷婷五月综合97色直播,日本日本熟妇中文在线视频,精品国精品自拍自在线,7777精品伊人久久久大香线蕉,男人用嘴添女人下身免费视频

一、AI芯片新皇登場：2080億顆晶體管，2.5倍訓練性能、5倍推理性能

二、面向萬億參數級GPU計算優化，推出全新網絡交換機、AI超級計算機

三、推出數十個企業級生成式AI微服務，方便企業定制和部署Copilots

四、推生成式AI算法，聯手兩大芯片界頂流，英偉達要掀起光刻計算新革命！

五、全新人形機器人基礎模型、計算機來了！?Isaac機器人平臺重大更新

六、Omniverse平臺新進展：挺進蘋果Vision Pro，發布云API

結語：重頭戲結束了，但好戲才剛剛開始

相關推薦