智東西(公眾號:zhidxcom)
文 |?季瑜生

導語:用十秒,Atlas 900就能從20萬顆星星中找到你的那一顆。

智(zhi)(zhi)東(dong)西9月18日上海(hai)消息,今(jin)日早晨,華為(wei)在上海(hai)世博中心舉行了(le)2019華為(wei)全聯接大(da)會,智(zhi)(zhi)東(dong)西帶來現場一手干(gan)貨報道。

會上,華為輪值董事長胡厚崑發表了《共創智能新高度》的演講,同時還發布了由數千顆昇騰910組成,只需60秒就可以完成典型網絡的訓練的全球最快AI集群Atlas 900

此外,胡厚崑還首次從架構創新、產品布局、商業策略、開放生態四個角度全面對外公開了華為的整體計算戰略

最后(hou),胡(hu)厚崑還(huan)透露出幾個數據,2023年,全球計算產業市場空間將達(da)兩萬億美元,到2025年,AI計算將占算力總量80%以(yi)上。

一、華為很好,就像上海的天氣,秋高氣爽、云淡風輕

上場(chang)伊始,華為輪值董事(shi)長胡厚崑先向在場(chang)的(de)所有朋友們(men)親切的(de)打了招呼。

胡厚崑:華為很好,云淡風輕,還發布了全球最快AI訓練集群Atlas 900

他表示,今年的(de)全聯接大會(hui)上比去(qu)年的(de)人來的(de)更多(duo),而(er)且也有很(hen)多(duo)老(lao)朋友的(de)出席,這說明大家對于華為都(dou)是(shi)非常(chang)關(guan)心。

緊接著(zhu)他表示,“今天一早,很多朋友問我你們還好(hao)嗎?你們還不錯吧?”

對此,胡厚崑回應:過去半年頂著巨大的(de)壓力走過來,不(bu)過華為現在過的(de)還(huan)不(bu)錯,就像今天上(shang)海的(de)天氣,秋高(gao)氣爽、云(yun)淡(dan)風輕。而且華為一(yi)定不(bu)會(hui)讓所有人失望的(de)!

胡厚崑:華為很好,云淡風輕,還發布了全球最快AI訓練集群Atlas 900

二、華為整體計算戰略首次公開:將5年投入15億美元構建開放生態

剛一(yi)上場,胡厚崑就向我(wo)們強調了兩個詞語“計(ji)算(suan)”與“聯(lian)(lian)接”。基(ji)于華為兩年前(qian)發布的(de)新(xin)愿景——構建萬物(wu)互(hu)聯(lian)(lian)的(de)智能(neng)世界(jie),計(ji)算(suan)與聯(lian)(lian)接是其中(zhong)最(zui)重(zhong)要的(de)兩個孿生兄弟。長期(qi)以來,哪里有聯(lian)(lian)接,哪里就有計(ji)算(suan)。

胡厚崑:華為很好,云淡風輕,還發布了全球最快AI訓練集群Atlas 900

此外,胡厚崑也表(biao)示(shi),向來以通信行業巨頭形象出現在我們面前的華為,其實對(dui)計算的投入已經超(chao)過十年的時間。

長期以來,計(ji)算模式一直在發生著變化(hua),從基于規則的計(ji)算到基于統計(ji)的計(ji)算,再到如今計(ji)算進入(ru)智能時代(dai)。

而在智(zhi)(zhi)能(neng)時代(dai),有幾(ji)個(ge)因素不可忽略,此外(wai),胡(hu)厚(hou)崑還提出一(yi)個(ge)趨勢預判——智(zhi)(zhi)能(neng)時代(dai),具(ju)備三大特征(zheng):

胡厚崑:華為很好,云淡風輕,還發布了全球最快AI訓練集群Atlas 900

(1)端(duan)邊云高效聯動的協同(tong)計算(suan)將成為未來(lai)的最大趨勢(shi)。

(2)計算將無處不在(zai)(zai),在(zai)(zai)終(zhong)端側、邊(bian)緣(yuan)側、中心側都將存在(zai)(zai),甚至(zhi)在(zai)(zai)智能手機、智能眼鏡、智能耳機都應該有計算能力(li)。

(3)基(ji)于中心節點對通用模型進行訓練量(liang)、計算(suan)量(liang)極大的暴力計算(suan)將無(wu)處不在。

緊接著胡厚崑公布(bu)了幾個數字:2023年(nian),全(quan)球(qiu)計算(suan)產業市(shi)場空(kong)間(jian)將達兩萬億美(mei)元,到2025年(nian),AI計算(suan)將占算(suan)力總(zong)量(liang)80%以上。

胡厚崑:華為很好,云淡風輕,還發布了全球最快AI訓練集群Atlas 900

基于(yu)這一認知,華(hua)為也(ye)首次公布了其在(zai)智能計算領域的整(zheng)體戰略(lve),借(jie)此來讓所有人了解(jie)華(hua)為的想法(fa)與戰略(lve),共同將市場(chang)做(zuo)大。

華為智能計算的戰略整體分為四部分:架構創新、產品布局、商業策略、開放生態

1、架(jia)(jia)構(gou)創新。華為這(zhe)些年一(yi)直在長期投資基礎研究,打造出了(le)達(da)芬奇架(jia)(jia)構(gou),重點解決全場(chang)景智能的架(jia)(jia)構(gou)問題。達(da)芬奇架(jia)(jia)構(gou)是(shi)全行業唯一(yi)一(yi)個覆蓋端(duan)邊云全場(chang)景的架(jia)(jia)構(gou)。

胡厚崑:華為很好,云淡風輕,還發布了全球最快AI訓練集群Atlas 900

2、投資(zi)全場(chang)景(jing)處理器(qi)族。包(bao)括面(mian)向(xiang)通用計算的鯤鵬系列(lie)(lie),面(mian)向(xiang)AI的昇騰(teng)系列(lie)(lie),面(mian)向(xiang)智能終端的麒(qi)麟系列(lie)(lie),以(yi)及面(mian)向(xiang)智慧屏(ping)的鴻鵠系列(lie)(lie),將來(lai)還有一系列(lie)(lie)處理器(qi),面(mian)向(xiang)更多的場(chang)景(jing)。

胡厚崑:華為很好,云淡風輕,還發布了全球最快AI訓練集群Atlas 900

3、商業策略-有所為有所不為。胡厚崑重點強調,華為處理器不直接對外銷售,而是會以云服務和部件為主面向客戶,并開放硬件框架、數據庫、AI計算框架部件給合作伙伴,優先支持合作伙伴發展整機。在這一過程中,華為有三個堅持:堅持硬件開放、堅持軟件開源、堅持使能應用開發和遷移。在這一過程中,華為不做應用,而(er)是幫(bang)助合作(zuo)伙伴(ban)做應用。

4、構建開放生態。未來5年,繼續投入15億美元,匯聚500萬開發者,使能全球合作伙伴開發(fa)應用及解決方案。

胡厚崑:華為很好,云淡風輕,還發布了全球最快AI訓練集群Atlas 900

關于華為的生態構建以及選擇,在會后的媒體專訪中,華為方面向包括智東西在內的媒體進一步闡釋了為什么鯤鵬處理器選擇ARM架構的原因:

鯤鵬之所以兼容ARM架構,是因為客戶有多樣性的需求與選擇。ARM架構在新的時代有它的優勢所在,華為選擇ARM是為了客戶需求考慮,而不是為了不同而不同。

此外,一(yi)個(ge)(ge)計算產(chan)業的成功不只是靠一(yi)個(ge)(ge)好的架(jia)構,很(hen)多(duo)企(qi)業有了好的架(jia)構還(huan)是走了彎路最后失敗。架(jia)構只是基礎,要成功還(huan)需要開(kai)放生態、務(wu)實(shi)的商業策略。

比如華為剛剛在會上(shang)宣(xuan)布的新(xin)的開放生態構建計(ji)劃,以及不做應用(yong)等(deng)策略,這都是華為緊緊圍(wei)繞上(shang)面兩(liang)點(dian)所做出的探索。

另外需要補充的一(yi)點是,此前,ARM處(chu)理(li)器一(yi)直被認為具有非常好的終端以(yi)及應用但(dan)(dan)是不適(shi)合在(zai)中(zhong)心側(ce)進行計算,但(dan)(dan)是到(dao)了今天,邊(bian)緣側(ce)的優(you)勢(shi)將會向中(zhong)心側(ce)延伸,性能問題(ti)也已經(jing)能夠很好的解決。比如華為鯤(kun)鵬920在(zai)SPEC?benchmark測(ce)試成績超(chao)過(guo)930分,位居第(di)一(yi),超(chao)越(yue)業界主流CPU25%。

此外,胡厚崑也宣布了華為面向通用計算(suan)領域的最新(xin)業務策(ce)略。依舊(jiu)是從(cong)產品創新(xin)、產品生(sheng)態、開放生(sheng)態、商業策(ce)略四個方面進行(xing)解讀(du)。

1、打造有競爭力的通用計算處理器。長期以來,華為一直持續投入鯤鵬生態,借此來打造最有(you)競爭力的產品。

2、投資板卡、服務器、操作系統、數據庫、編譯器等關鍵技術和產品,打通生態全鏈條,完成系統級驗證,幫助合作伙伴更好地銷售整機

3、目前鯤鵬生態已落地北京、上海、重慶、深圳、成都等城市,在平臺(tai)搭建、人才(cai)培(pei)養、應用示范等領域全面開展(zhan)合(he)(he)作(zuo)。華為將持(chi)續與伙(huo)伴合(he)(he)作(zuo)共(gong)同打造鯤鵬產業生(sheng)態基(ji)地,與各(ge)地的政府、合(he)(he)作(zuo)伙(huo)伴一起(qi),結合(he)(he)當(dang)地的優勢,打造鯤鵬計(ji)算(suan)產業的創新基(ji)地和孵(fu)化平臺(tai)。以(yi)平臺(tai)為載體,聚合(he)(he)生(sheng)態伙(huo)伴,開展(zhan)應用示范,培(pei)養產業人才(cai),孵(fu)化產業標準。

4、上市節奏,基于鯤鵬處理器的系列產品、解決方案和服務,將面向全球市場;當前先聚焦中國市場,后續將基于客戶需求、生態建設等有節(jie)奏在其(qi)他不同區域、國家/地區逐步上市。

關于AI計算,胡厚崑也向我們宣布了華為的最新進展。他表示,華為的全棧全場景AI解決方案已經全面落地。

胡厚崑:華為很好,云淡風輕,還發布了全球最快AI訓練集群Atlas 900

去年全聯接(jie)大會上,華為(wei)發布了(le)全棧全場景(jing)的AI解決方案。不(bu)過胡厚崑也坦言,“當(dang)時我們只交付了(le)用(yong)于推理的昇騰(teng)310處理器和(he)ModelArts應用(yong)開(kai)發平臺(tai)。”

但是今年,華為(wei)用于訓練(lian)的(de)昇騰處(chu)理(li)器和AI計(ji)算框(kuang)架MindSpore都已(yi)經發(fa)布了。至(zhi)此(ci),華為(wei)的(de)全(quan)棧全(quan)場景AI解決方案全(quan)面落地。

最后,胡厚崑(kun)表示:“大(da)家可以放心地和(he)我們來開(kai)展合作(zuo)!”

三、最快AI訓練集群Atlas 900發布:60秒完成典型網絡訓練

在大型數(shu)據集上(shang)進(jin)行訓練的神(shen)經網(wang)絡(luo)(luo)架構涵蓋從圖像識別、自然語言處理(li)、視(shi)頻實時分析和智能(neng)推薦系統(tong)等各個方面,訓練這些神(shen)經網(wang)絡(luo)(luo)模型需(xu)要大量浮點計算能(neng)力。

近年來單個AI處理器算力和訓練方法上均取得了重大進步,但是在單一機器上,AI訓練所需要的時間仍然長得不切實際,因此需要借助大規模分布式AI集群環境來提升神經網絡訓練系統的浮點計算能力

基于這一認知,作為本(ben)場大會最大的驚喜——胡(hu)厚崑(kun)發布了全(quan)球最快AI訓練集(ji)群Atlas 900。

胡厚崑:華為很好,云淡風輕,還發布了全球最快AI訓練集群Atlas 900

根據現場(chang)解讀(du),Atlas 900由數千(qian)顆昇騰910組成(cheng),總算力達256-1024PFLOPS@FP16,相當于50萬臺PC的計算力。

胡厚崑:華為很好,云淡風輕,還發布了全球最快AI訓練集群Atlas 900

昇(sheng)(sheng)騰910 AI有多強?每顆(ke)昇(sheng)(sheng)騰910 AI處理器(qi)內(nei)置32個達(da)芬奇(qi)AI Core,單芯片就(jiu)可以提供(gong)比(bi)業界(jie)高一(yi)倍的算力(256TFLOPS@FP16)。而AI訓練集(ji)群Atlas 900,則(ze)直接(jie)將數千顆(ke)昇(sheng)(sheng)騰910 AI處理器(qi)互聯,打造出了業界(jie)第一(yi)的算力集(ji)群。

值得關注的是,昇騰910 AI處(chu)理器采(cai)用(yong)的是SoC設計(ji),集(ji)成(cheng)了“AI算力、通(tong)用(yong)算力、高速大帶寬I/O”,可以大幅度(du)卸載Host CPU的數據預處(chu)理任務(wu),充分(fen)提升訓練效(xiao)率(lv)。

那么它到底有多(duo)快?只(zhi)需59.8秒就可以完成基于ImageNet數據集訓練(lian)ResNet-50模型,在(zai)同(tong)等精度下比第2名(70.2秒)快15%。

胡厚崑:華為很好,云淡風輕,還發布了全球最快AI訓練集群Atlas 900

這是什么概念(nian),基(ji)于(yu)這種(zhong)測試,就像頂尖(jian)的(de)短跑選手測試,區別在于(yu)第一名沖線還喝了瓶水,第二名才姍姍來(lai)遲。

除(chu)了超快之外,Atlas 900還具(ju)備最佳(jia)集(ji)群網絡、系(xi)統級調優、優秀(xiu)散熱系(xi)統兩(liang)大特(te)性。

1、最佳集群網絡。Atlas 900整合了“HCCS、PCle4.0、100G以太”三類高速互聯方式。通過百TB全互聯無阻塞專屬參數同步網絡,降低網絡時延,梯度同步時延縮短10~70%

通過華為自(zi)研HCCS片間(jian)互聯240Gbps單端口速(su)(su)率業界領先;最新(xin)的PCIE4.0接口則(ze)在(zai)速(su)(su)率上達到(dao)了(le)當(dang)前業界的2倍;100G RoCE高(gao)速(su)(su)集群互聯網絡進一步讓傳輸速(su)(su)率一快(kuai)再快(kuai)。

在(zai)AI服務器(qi)內部,昇(sheng)騰(teng)(teng)910 AI處(chu)理(li)器(qi)之(zhi)間(jian)通(tong)過(guo)HCCS高速(su)(su)總線(xian)互(hu)聯;昇(sheng)騰(teng)(teng)910 AI處(chu)理(li)器(qi)和CPU之(zhi)間(jian)以最新的(de)(de)(de)PCIe 4.0(速(su)(su)率(lv)16Gb/s)技術互(hu)聯,其速(su)(su)率(lv)是業界主流采用的(de)(de)(de)PCIe 3.0(8.0Gb/s)技術的(de)(de)(de)兩倍,使(shi)得數據傳輸更加快速(su)(su)和高效(xiao)。

在集(ji)群(qun)層面,采用面向(xiang)數據中心的CloudEngine 8800系(xi)列交換機,提供單端口100Gbps的交換速(su)率,將(jiang)集(ji)群(qun)內的所(suo)有(you)AI服務器接入(ru)高速(su)交換網絡。

此外(wai),華(hua)為還獨(du)創了(le)iLossless 智能無(wu)損交換算法,對集群內的(de)網絡(luo)流量進行實時的(de)學習訓練(lian),實現網絡(luo)0丟包與E2E μs級時延(yan)。

2、Atlas 900系統級調優。通過HCCL通信庫+網絡拓撲+訓練算法級調優,可實現線性度大于80%

3、散熱。華為方面表示,Atlas 900還具備業界頂尖的散熱系統。Atlas 900采用的(de)是(shi)大于95%的(de)液冷占比,可以大幅(fu)減少對外散熱。高效節能也是(shi)Atlas 900的(de)一(yi)大特(te)性,單(dan)液冷柜支持50KW超(chao)高散熱,實現PUE小于1.1。

那么通過Atlas 900的強(qiang)大算力究竟能做什(shen)么?

胡厚崑(kun)表示,Atlas 900可廣(guang)泛應用(yong)于科學研究(jiu)與(yu)商(shang)業創新。比如天文(wen)探(tan)索、氣象預測(ce)、自(zi)動(dong)駕駛、石油勘(kan)探(tan)等(deng)領域,這些(xie)領域都需要(yao)進行龐大的(de)數據計算和處理,原(yuan)來可能花費好(hao)幾(ji)個月的(de)工作(zuo),現在交給Atlas 900,就是(shi)幾(ji)秒鐘(zhong)的(de)事情(qing)。

緊接(jie)著,胡(hu)厚崑分享了一個天文探索的(de)案(an)例,這(zhe)是華為聯合上海天文臺與SKA共(gong)同打造的(de)。天文研究(jiu)高(gao)度依(yi)賴于海量(liang)的(de)數(shu)據分析和計算,離(li)不開(kai)超強的(de)算力(li)支持。

以下是(shi)一張南(nan)半球的(de)星(xing)空圖(tu),這(zhe)張圖(tu)上有20萬顆星(xing)星(xing),用(yong)人眼是(shi)看不(bu)見(jian)這(zhe)么多星(xing)星(xing)的(de),這(zhe)些(xie)畫(hua)面來(lai)自于SKA射電(dian)望遠鏡的(de)數(shu)據。

胡厚崑:華為很好,云淡風輕,還發布了全球最快AI訓練集群Atlas 900

當前(qian)條件下(xia),天文學(xue)家要(yao)從這20萬顆星(xing)星(xing)中(zhong),找出某種特(te)征(zheng)的星(xing)體(ti),相(xiang)當困難,需(xu)要(yao)169天的工作量。現在用(yong)(yong)上Atlas 900,只用(yong)(yong)10秒,就從20萬顆星(xing)星(xing)中(zhong)檢索出了相(xiang)應特(te)征(zheng)的星(xing)體(ti)。

胡厚崑:華為很好,云淡風輕,還發布了全球最快AI訓練集群Atlas 900

最(zui)后,胡厚崑表(biao)示,為(wei)了讓所(suo)有人能(neng)夠盡(jin)快用上Atlas 900的超強算力,華為(wei)已經把它(ta)部(bu)署到華為(wei)云上,并以極優惠的價(jia)格向全球科研機構和大學開放。

結語:華為的管道與水庫,左手5G,右手云邊端計算

如果說長期以來,我們對于華(hua)(hua)為的(de)(de)定義還只是一個能(neng)做手(shou)機的(de)(de)通信設備巨頭(tou),那(nei)么這十年多來華(hua)(hua)為在計算領域的(de)(de)發力逐漸(jian)浮出水面,則讓我們重新定義了這個全行業的(de)(de)商(shang)業巨無(wu)霸。

左手是風頭(tou)無兩的5G與領(ling)先的6G,建立起了(le)數據傳輸的最大管道。

右(you)手是(shi)聯(lian)接到管(guan)道兩(liang)端的水庫與毛細(xi)血管(guan)。在(zai)云端,華為是(shi)Atlas 900集群與鯤(kun)鵬生態,在(zai)邊緣側昇(sheng)騰(teng)生態則構(gou)建起了(le)毛細(xi)血管(guan)層面(mian)的計算。

隨著AI與5G的雙重催化,計算與聯接已經成為全行業所共通必須的基礎設施。不過如何共同推進整個產業的發展,華為在做好黑土地之后,還需要更多的產業應用角色參與其中。或許正如胡厚崑所言“這是計算產業新的大航海時代,我們期待的是千帆競發,而不是獨舟奮進。