
智東西(公眾號:zhidxcom)
作者 | 李水青
編輯 | 心緣
智東西(xi)8月19日銀川報道,昨日,由工業和信息化部、寧夏(xia)回族自治區政府主辦的2023中國(guo)算力大會在寧夏(xia)銀川舉辦。
大會期間,作為頭(tou)部算力(li)基礎設施提供(gong)商,聯想推出兩(liang)款全新(xin)AI服(fu)務(wu)器產品——聯想問(wen)天(tian)WA7780 G3 AI大模型(xing)訓(xun)練(lian)服(fu)務(wu)器、聯想問(wen)天(tian)WA5480 G3 AI訓(xun)推一體服(fu)務(wu)器,為大模型(xing)AI訓(xun)練(lian)和推理提供(gong)新(xin)的基礎設施。
▲“算力中國”創新成果展上的聯(lian)想兩款(kuan)AI服務器產品展示
同(tong)時(shi),聯(lian)想(xiang)首次對外發(fa)布(bu)“普慧”AI算力戰略(lve),提出(chu)將100%算力基(ji)礎(chu)設施(shi)(shi)產(chan)品(pin)(pin)支(zhi)持(chi)AI,50%基(ji)礎(chu)設施(shi)(shi)研發(fa)投入在AI領域等戰略(lve)舉措,并(bing)推出(chu)了聯(lian)想(xiang)智算中心解決(jue)方案(an)和服務核心產(chan)品(pin)(pin)。
聯(lian)想集團副總裁、中國(guo)區基(ji)礎設(she)施業務群服務器事業部(bu)總經理陳振寬說:“全(quan)新推出的(de)兩款聯(lian)想問天(tian)AI服務器,秉承‘AI賦(fu)智(zhi),綠色(se)賦(fu)能’的(de)兩大戰(zhan)略特征(zheng),通過領(ling)先的(de)AI技術,覆蓋全(quan)域應(ying)用,打(da)造全(quan)面的(de)AI導向基(ji)礎設(she)施。”
▲聯想集團(tuan)副總裁、中國區(qu)基礎設施業(ye)務群服務器(qi)事業(ye)部總經理陳振寬(kuan)
會議期間,智(zhi)東西與少數媒(mei)體對(dui)陳振寬,以及聯(lian)想(xiang)集團副總裁、中國(guo)區方案服務業務群總經理戴煒進(jin)行(xing)了深度采訪。
AI服(fu)務器(qi)的(de)(de)交付時間(jian)是產業關(guan)注的(de)(de)一大焦點問題。對(dui)此,陳振(zhen)寬告(gao)訴智(zhi)東西,目前AI服(fu)務器(qi)呈現供不應(ying)求的(de)(de)態勢。今天正式對(dui)外(wai)宣布兩款的(de)(de)AI服(fu)務器(qi),目前訂單(dan)數(shu)量(liang)火爆(bao),一些訂單(dan)甚(shen)至要排到明年。
當下眾多中國廠商發布了大模(mo)型(xing),聯(lian)想在(zai)此(ci)是(shi)否已有布局(ju)?
戴煒告訴(su)智東西,聯(lian)想(xiang)目前沒有(you)自研通(tong)用超(chao)大規模模型,而是聚焦于智能基礎設施服務方面,基于百行業的客戶應用需求(qiu)、圍繞行業場景去布局(ju)。
▲聯(lian)想集團副總裁、中國區方案服務業務群總經(jing)理(li)戴煒
當談到大(da)(da)(da)模型(xing)對東數西算(suan)(suan)工程的影響(xiang),戴煒認(ren)為(wei),大(da)(da)(da)模型(xing)的興起或許能為(wei)以寧夏為(wei)代(dai)表(biao)的西部算(suan)(suan)力樞(shu)(shu)紐(niu)帶(dai)來新(xin)機遇。離客(ke)戶(hu)(hu)場景(jing)較(jiao)近的大(da)(da)(da)模型(xing)推理可以放在東部算(suan)(suan)力樞(shu)(shu)紐(niu),離客(ke)戶(hu)(hu)場景(jing)較(jiao)遠的大(da)(da)(da)模型(xing)訓練(lian)則(ze)可放在西部算(suan)(suan)力樞(shu)(shu)紐(niu)。
而帶(dai)動(dong)“東數(shu)西算(suan)”工程(cheng)的落地,需要智(zhi)能(neng)計算(suan)技術、應用需求、人才(cai)生態等多方(fang)面因素共同(tong)作用。
一、聯想副總裁陳振寬:50%基礎設施研發投入在AI領域
隨著(zhu)算(suan)力(li)(li)成(cheng)為(wei)各(ge)國科技戰略布局重點,聯(lian)想提出將“普(pu)慧(hui)算(suan)力(li)(li)”作為(wei)算(suan)力(li)(li)發展的(de)戰略方向。
陳振寬說,“普”代表(biao)普適(shi),希(xi)望算力像水和(he)電一樣,人(ren)(ren)人(ren)(ren)可(ke)得(de)、人(ren)(ren)人(ren)(ren)可(ke)用(yong)、人(ren)(ren)人(ren)(ren)適(shi)用(yong);“慧”代表(biao)智慧,意味著自(zi)(zi)適(shi)應(ying)、自(zi)(zi)學習、自(zi)(zi)進化,用(yong)戶可(ke)以隨需使(shi)用(yong)。
陳(chen)振寬(kuan)說,聯想的“普慧(hui)”AI算力戰略有兩大特征(zheng):一(yi)是(shi)AI賦智,二(er)是(shi)綠色賦能。
在AI賦智方面,聯想提出將100%算力基礎設施產品支持AI,50%基礎設施研發投入在AI領域,全面AI技術覆蓋全域AI應用。在綠色賦能方面,聯想提出全面布局和引領液冷技術,打造液冷技術和液冷集群方案燈塔,持續創新引領未來技術。
▲聯想要提供全(quan)面的AI技術與服務
追溯聯想(xiang)AI算力(li)戰略的背后(hou)邏輯(ji),聯想(xiang)“AI賦智,綠色賦能”如(ru)何促進“普慧”AI算力(li)實現?
陳振寬告訴智東西,聯(lian)想通過(guo)“全棧智能”的(de)(de)方式實現戰(zhan)略方向(xiang)的(de)(de)落地,體現在三個(ge)方面:AI內嵌的(de)(de)智能終端(duan)、AI導向(xiang)的(de)(de)基(ji)礎設施、AI原(yuan)生的(de)(de)方案(an)服務。
在AI導向的基礎設施(shi)方面,聯想已(yi)推出了“聯想ThinkSystem”和“聯想問天”雙品牌,目前在AI方面已(yi)有60多(duo)款產品。
其中(zhong)聯(lian)想ThinkSystem系列產品(pin)主打“全球智(zhi)慧+本地交付”,新的聯(lian)想問天品(pin)牌則主打“本地創(chuang)新+敏捷高效”,基于本地的創(chuang)新、生態(tai)位(wei)中(zhong)國客戶實現(xian)更加靈活定制的個性化(hua)方案。
▲聯想(xiang)智能算力基(ji)礎設(she)施采取雙品牌戰略(lve)
二、推出兩大AI服務器產品,大模型訓練提速近10倍
以AI為導向的基(ji)礎設(she)施要依據(ju)AI數(shu)據(ju)和(he)算法(fa)的特(te)性而設(she)計(ji)和(he)優化(hua)(hua),包(bao)括AI數(shu)據(ju)的“向量、矩陣(zhen)或(huo)多維數(shu)組的形式”、“數(shu)據(ju)噪音多”等特(te)征,以及AI算法(fa)“巨大(da)規(gui)模并行(xing)計(ji)算和(he)矩陣(zhen)計(ji)算”、“容忍低精度浮(fu)點或(huo)量化(hua)(hua)整數(shu)”等特(te)征,都需要被(bei)考慮在內。
本次,聯(lian)想推出的兩大AI服(fu)務(wu)器產(chan)品聯(lian)想問天(tian)WA7780 G3 AI大模型(xing)訓練服(fu)務(wu)器、聯(lian)想問天(tian)WA5480 G3 AI訓推一(yi)體服(fu)務(wu)器,正是其全新AI算(suan)力戰略(lve)理念的展現。
1、AI大模型訓練服務器:算力達32P FLOPS,大模型AI訓練速度提升9倍
今年(nian)年(nian)初,聯(lian)(lian)想(xiang)(xiang)(xiang)發布了聯(lian)(lian)想(xiang)(xiang)(xiang)服(fu)務器的首個本地化品牌“聯(lian)(lian)想(xiang)(xiang)(xiang)問(wen)(wen)天(tian)”,聯(lian)(lian)想(xiang)(xiang)(xiang)問(wen)(wen)天(tian)WA7780 G3是一款專為AI大模(mo)型訓練所打造的服(fu)務器。
▲聯(lian)想問天(tian)WA7780 G3 AI大模型(xing)訓練(lian)服務器
(1)AI算力提升超3倍,AI推理速度提升達30倍
聯(lian)想問天WA7780 G3 AI大模型訓練(lian)服務器(qi)基(ji)于第四代英特爾(er)至強可(ke)擴展處理(li)器(qi)。NVIDIA HGX H800系統配備8顆H800 NVLink GPU,擁有高達(da)640GB的(de)HBM3高速顯存,通過NVLink,GPU間(jian)互聯(lian)帶寬(kuan)高達(da)400GB/s。據稱其將AI算力(li)提(ti)升了3.44倍,至高可(ke)達(da)32P FLOPS AI算力(li)。
NVIDIA H800 GPU匹(pi)配第(di)四代Tensor Core配合Transformer引擎(qing)(FP8精度),與上(shang)一代產品相比,可(ke)為大(da)模型AI訓(xun)練速度帶來高(gao)(gao)達9倍(bei)提(ti)升,可(ke)將(jiang)大(da)模型AI推(tui)理速度提(ti)升高(gao)(gao)達30倍(bei)。
▲聯想問天WA7780 G3 AI大模型訓練服務器的算(suan)力(li)指標情(qing)況(kuang)
(2)快速低延遲互聯,支持按需配比和擴展不同算力
聯(lian)想問天WA7780 G3 AI大模型(xing)(xing)訓(xun)(xun)練服務器支(zhi)持IB、RoCE等多種對外網絡連接方案。其最高(gao)可以支(zhi)持8張RDMA高(gao)速網卡,提供3.2Tb/s聚合帶寬(kuan),充(chong)分(fen)滿足(zu)了超大模型(xing)(xing)訓(xun)(xun)練并行(xing)計算(suan)時(shi),跨節(jie)點的通信需求。
同時(shi),在本(ben)地存儲的(de)(de)設計上,聯想(xiang)問天WA7780 G3采用GPU Direct Storage (GDS)技術。通過GDS技術,GPU與NVMe實現了(le)快速低延遲互聯,能夠有效提高訓(xun)練(lian)數據(ju)載入的(de)(de)速度,提升(sheng)大模型訓(xun)練(lian)的(de)(de)性能。
▲聯想問天WA7780 G3 AI大(da)模型(xing)訓練服(fu)務器的靈活架構
(3)創新散熱設計:功耗降低約10%,PUE值有望低于1.1
聯想問天(tian)WA7780 G3 AI大(da)模型訓(xun)練服(fu)(fu)務器,在產品(pin)設計中采(cai)用了三重獨立風(feng)(feng)道設計,針對不同(tong)部(bu)件的(de)(de)散熱(re)特征,進行了系統(tong)性(xing)的(de)(de)優化,有效(xiao)降低(di)了由風(feng)(feng)扇帶來的(de)(de)散熱(re)功耗(hao)(hao)。據稱,相比同(tong)級別產品(pin),聯想問天(tian)WA7780 G3 AI大(da)模型訓(xun)練服(fu)(fu)務器功耗(hao)(hao)降低(di)約10%。
同時(shi),為了(le)滿(man)足未來(lai)智算中心對PUE值(zhi)更低的要求,本產品預(yu)留了(le)液冷(leng)(leng)冷(leng)(leng)板設計,未來(lai)將(jiang)支持液冷(leng)(leng),這將(jiang)大幅度節(jie)省在AI大模型訓練過程中,因系統(tong)散(san)熱帶(dai)來(lai)的額外能耗,PUE值(zhi)有(you)望低于(yu)1.1。
▲聯想(xiang)問天WA7780 G3 AI大模(mo)型訓練(lian)服(fu)務(wu)器能耗(hao)情況
2、AI訓推一體服務器:支持多種場景、多元算力
再來(lai)看(kan)看(kan)聯想問天WA5480 G3 AI訓推一體服(fu)務器。這(zhe)是聯想問天品牌中的(de)一款4U機架(jia)式(shi)AI服(fu)務器,支持多(duo)元的(de)算力(li)和豐富的(de)生態(tai)。
▲聯想問天(tian)WA5480 G3 AI訓推一體服(fu)務器
(1)最多支持10張NVIDIA H800,支持多款AI加速卡
聯(lian)想(xiang)問(wen)天WA5480 G3 AI訓(xun)推一體服務器采用2顆第四代(dai)英特爾至(zhi)強可(ke)擴(kuo)展處理(li)器,支(zhi)持最新PCIe 5.0。通過PCIe擴(kuo)展,其最多可(ke)以(yi)支(zhi)持10張包括最新NVIDIA H800 GPU在內的,多類型(xing)、多品牌(pai)AI加(jia)速卡。聯(lian)想(xiang)問(wen)天WA5480 G3可(ke)以(yi)靈活應用于AI通用模型(xing)訓(xun)練、大模型(xing)推理(li)、AI生成、云游戲、科(ke)學計算等多種應用場景。
▲聯(lian)想問天(tian)WA5480 G3 AI訓推一體服務器支持多元算(suan)力
(2)靈活拓撲,不同組合滿足多種AI場景需求
聯(lian)想問天WA5480 G3 AI訓推一體服務器在(zai)CPU-GPU互聯(lian)的(de)硬(ying)件設計(ji)(ji)上采用靈活多(duo)變的(de)設計(ji)(ji)理(li)念。其基于不(bu)同(tong)AI工作(zuo)負載,可以為客戶提供包(bao)括直通、Balance、Common多(duo)種(zhong)CPU-GPU互聯(lian)方式(shi),避(bi)免了因為CPU-GPU數據通信方式(shi)單一與工作(zuo)負載不(bu)匹配(pei),帶來的(de)潛在(zai)性能瓶頸(jing)和系統(tong)效率(lv)下降(jiang)。結合不(bu)同(tong)種(zhong)類,不(bu)同(tong)數量的(de)加速卡選(xuan)擇(ze),其可實現對AI各種(zhong)復雜(za)場景的(de)完美(mei)匹配(pei)。
▲聯想問(wen)天(tian)WA5480 G3 AI訓推一(yi)體服務器支持豐富生態
(3)充分考慮設計冗余,確保無間斷運行
聯想問天WA5480 G3 AI訓(xun)推(tui)一體服務(wu)(wu)器(qi)充(chong)分考(kao)慮了設計冗余(yu),支持(chi)電(dian)(dian)源(yuan)N+N冗余(yu),節點內(nei)電(dian)(dian)源(yuan)間(jian)互(hu)為備份,對外可以連(lian)接雙(shuang)路市電(dian)(dian),從(cong)而保(bao)障服務(wu)(wu)器(qi)24小時在線運行。該產品支持(chi)CPU、GPU、內(nei)存(cun)等(deng)關鍵部件的功耗監測,整(zheng)機功耗封頂(ding)調控,動態保(bao)障服務(wu)(wu)器(qi)運行在合理的功耗區間(jian),保(bao)證性能的穩定,以及風(feng)扇N+1冗余(yu)等(deng)多種安全(quan)設計保(bao)障高環溫(wen)無間(jian)斷運行。
▲聯想(xiang)問(wen)天WA5480 G3 AI訓推一體服務器的穩定(ding)性
陳振寬告(gao)訴(su)智(zhi)東西,在(zai)AI算力、智(zhi)算方面,這應(ying)該是一個變革式(shi)的(de)推(tui)出(chu),循序漸進式(shi)的(de)不大(da)(da)可以滿足智(zhi)算的(de)需(xu)求。所以在(zai)智(zhi)算方面,聯想這次(ci)推(tui)出(chu)的(de)這兩款產品還是比較偏(pian)向于大(da)(da)規(gui)模(mo)的(de)推(tui)理和大(da)(da)規(gui)模(mo)的(de)訓練,就是大(da)(da)規(gui)模(mo)和超大(da)(da)規(gui)模(mo)。
三、推出智算中心方案,三種交付方式支持三類算力場景
當下(xia),混(hun)合架構模式在智算(suan)中心(xin)的建設中已成(cheng)為行(xing)業趨勢。
戴(dai)煒認為,智(zhi)能算(suan)(suan)力(li)(li)(li)場景(jing)持續推動算(suan)(suan)力(li)(li)(li)需求(qiu)的不斷升級,智(zhi)算(suan)(suan)中(zhong)心(xin)(xin)建設需要滿(man)足千行百業對混合(he)算(suan)(suan)力(li)(li)(li)的要求(qiu),包(bao)括公有云和私有云的混合(he),國產算(suan)(suan)力(li)(li)(li)及(ji)通用(yong)算(suan)(suan)力(li)(li)(li)的混合(he),以及(ji)普(pu)算(suan)(suan)、超算(suan)(suan)和智(zhi)算(suan)(suan),企業智(zhi)算(suan)(suan)中(zhong)心(xin)(xin)和區(qu)域智(zhi)算(suan)(suan)中(zhong)心(xin)(xin)都顯(xian)現出(chu)復雜性(xing)。
智(zhi)算中心(xin)的(de)復(fu)雜性需要(yao)領(ling)先的(de)技術(shu)框架和陪伴服務。為(wei)此(ci),聯想推(tui)出端(duan)到(dao)端(duan)的(de)智(zhi)算中心(xin)方案,以及全周期陪伴式(shi)服務能(neng)力。
▲戴煒講解智算中心方案及陪伴服務
聯想智(zhi)算中(zhong)(zhong)心(xin)解(jie)決(jue)方(fang)案(an)(an),是其(qi)AI原生(sheng)的方(fang)案(an)(an)服(fu)務的重(zhong)要部分。AI原生(sheng)的方(fang)案(an)(an)服(fu)務包(bao)括聯想智(zhi)算中(zhong)(zhong)心(xin)解(jie)決(jue)方(fang)案(an)(an)、聯想混合云(yun)解(jie)決(jue)方(fang)案(an)(an)、聯想大腦嵌入的解(jie)決(jue)方(fang)案(an)(an)和(he)端到端全周(zhou)期的聯想智(zhi)算中(zhong)(zhong)心(xin)服(fu)務和(he)臻算服(fu)務。
▲聯想智(zhi)算中(zhong)心解決方(fang)案
戴煒說:“針聯想(xiang)方案(an)服務將(jiang)以三種交付方式(混合(he)云(yun)、臻算(suan)服務2.0訂閱(yue)式和一站式)支持三類算(suan)力場景(普算(suan)、智算(suan)、超算(suan))的(de)混合(he)計算(suan)需求。”
結語:大模型落地行業,推動AI算力需求爆發
隨(sui)著大模型向(xiang)千行(xing)百業落(luo)地(di),AI算力已(yi)成為(wei)(wei)(wei)算力基(ji)礎設施(shi)的(de)(de)重要發展方向(xiang)。知名行(xing)研(yan)機構IDC報告顯示,隨(sui)著生(sheng)成式人(ren)工智能應(ying)用(yong)的(de)(de)爆發,各行(xing)業對智算的(de)(de)需求首次超過通用(yong)算力,AI算力已(yi)成為(wei)(wei)(wei)算力發展的(de)(de)主要方向(xiang),也(ye)成為(wei)(wei)(wei)“東數西算”發展的(de)(de)新的(de)(de)強勁動力。
乘此東風,IDC的(de)數據顯示(shi)聯(lian)想集團是2022增(zeng)長最快的(de)AI硬件基(ji)礎設施(服(fu)(fu)務器和(he)存儲)提供(gong)商(shang),同比(bi)增(zeng)長139%,全球排名第三。本次(ci),隨著(zhu)聯(lian)想推出多款(kuan)面向AI大(da)模型時代的(de)服(fu)(fu)務器,并加速推進AI賦(fu)智(zhi)、綠色賦(fu)能的(de)“普慧”戰略,其有望為我(wo)國(guo)大(da)模型的(de)研(yan)發和(he)落地提供(gong)新(xin)的(de)動力(li)。