
芯東西(公眾號:aichip001)
作者 | ?高歌
編輯 | ?云鵬
芯(xin)東西4月13日(ri)報道,今日(ri),被(bei)英特爾收購的(de)知名以色列AI芯(xin)片(pian)公司(si)Habana Labs在(zai)(zai)北京分享了其云端芯(xin)片(pian)在(zai)(zai)超(chao)算(suan)領域的(de)最新落地進(jin)展:其AI訓練(lian)芯(xin)片(pian)及推理芯(xin)片(pian)將被(bei)搭載(zai)于美(mei)國加(jia)州大學圣地亞哥分校(xiao)圣地亞哥超(chao)級(ji)計(ji)算(suan)機(ji)中心(xin)(SDSC)的(de)Voyager超(chao)級(ji)計(ji)算(suan)機(ji),計(ji)劃在(zai)(zai)2021年秋季投入(ru)使用。
期間,Habana Labs中(zhong)國區(qu)總經理于(yu)明揚與芯東(dong)西等媒(mei)體進行(xing)深入交(jiao)流。除了披露更多(duo)此次落(luo)地(di)進展的細節外(wai),于(yu)明揚還回應了被英(ying)特(te)爾收購后的業務(wu)路(lu)線變化,并透露下一代云端訓(xun)練芯片的性能(neng)表現。
一、美國超算中心采用,打入科研領域
Habana Labs創立于2016年,總(zong)部(bu)位于以色列特(te)拉維夫,2019年被英特(te)爾(er)以20億美元收購,成為英特(te)爾(er)數據產品集團獨(du)立運(yun)營的業務部(bu)門(men)。
此前(qian),其自研云(yun)端AI推(tui)理芯片(pian)Goya和云(yun)端AI訓(xun)練芯片(pian)Gaudi已被云(yun)計算巨頭亞馬遜(xun)AWS應用。
如今,兩(liang)款(kuan)(kuan)芯片(pian)迎來新(xin)的(de)落地(di)進展,加州大學圣地(di)亞(ya)(ya)哥分校的(de)圣地(di)亞(ya)(ya)哥超(chao)級計(ji)算(suan)機(ji)中心(SDSC)將在其Voyager超(chao)級計(ji)算(suan)機(ji)中采(cai)用這(zhe)兩(liang)款(kuan)(kuan)芯片(pian),這(zhe)也是Habana Labs在科研(yan)領域的(de)一次突破(po)。
Voyager超算由美國國家科學(xue)基金(jin)(NSF)資助,從事天文學(xue)、氣候(hou)科學(xue)、化學(xue)、粒(li)子物(wu)理學(xue)等(deng)跨學(xue)科和工(gong)程領域的AI研究。例(li)如在天文學(xue),AI可(ke)以被用(yong)于對(dui)比(bi)外太空圖像和判斷是否(fou)有(you)新的太空物(wu)質出(chu)現(xian)。
而(er)Habana Labs的(de)訓練及推(tui)理(li)芯片將為(wei)這些研(yan)究起到加速計算的(de)作(zuo)用(yong)。
Voyager集(ji)群采(cai)用(yong)(yong)了336片Gaudi芯(xin)片用(yong)(yong)于AI訓練,每(mei)個(ge)訓練節點使(shi)用(yong)(yong)了6個(ge)400GbE RoCE的高速互聯,推理預測(ce)采(cai)用(yong)(yong)了16片Goya芯(xin)片,預計今年10月可供研究(jiu)人員使(shi)用(yong)(yong)。
據(ju)于明揚分享,Gaudi和Goya提升了Voyager超算AI工作(zuo)的性能(neng)和效率,使(shi)研究(jiu)人(ren)員能(neng)夠使(shi)用可編程張(zhang)量處理器(qi)內(nei)核和內(nei)核庫定制模型。
其(qi)中(zhong),Gaudi內(nei)置集成了10個支持RoCE v2(RDMA over Converged Ethernet)100G以(yi)太網端(duan)口,可以(yi)提升(sheng)擴(kuo)展的(de)靈活性,避(bi)免(mian)擴(kuo)展能力受于(yu)限吞(tun)吐(tu)量。如(ru)果搭配(pei)Habana的(de)SynapseAI軟件平臺,使用者操作起來將更加便捷。
于(yu)明揚提到,作為一家初創(chuang)公司(si),Habana Labs的產(chan)品細(xi)節還(huan)有待提升,其市(shi)場戰略基本是(shi)選擇主流的云廠(chang)商進(jin)行(xing)合作,通(tong)過與有代表性的用戶進(jin)行(xing)合作,來打磨、完善(shan)產(chan)品。
二、背靠英特爾生態,仍獨立運營
在被問到與(yu)英(ying)(ying)特爾相關(guan)的(de)問題時(shi),于明(ming)揚回應,Habana Labs仍然作為(wei)(wei)一家獨立公(gong)司運營,其(qi)市(shi)場(chang)戰略依舊(jiu)比較獨立,也(ye)可以及時(shi)對用戶的(de)問題進行反饋。英(ying)(ying)特爾為(wei)(wei)Habana Labs提供(gong)了(le)很(hen)多(duo)客戶資源,也(ye)使(shi)Habana Labs在業內(nei)的(de)口碑(bei)有所上升。
同(tong)時,客戶在(zai)選(xuan)擇AI芯片時,往往優先選(xuan)擇符合其處理(li)器架構的(de)(de)芯片。在(zai)英特爾收購Habana Labs后,雙方在(zai)生(sheng)態上有所協同(tong),英特爾的(de)(de)x86處理(li)器也為(wei)Habana Labs帶來了(le)部分用戶。
Habana Labs在被收購(gou)后,其技(ji)術路線(xian)圖也(ye)沒(mei)有發生太大的改(gai)變,其軟件生態(tai)也(ye)會在模型、工(gong)具等方面有很大的進步,還將(jiang)提(ti)供預處(chu)理等新功能。
于(yu)明揚還特別講到,因為英特爾(er)的代工業務(wu)剛(gang)(gang)剛(gang)(gang)起步(bu),所以近兩(liang)年Habana Labs暫時(shi)不會選擇英特爾(er)代工,雙方(fang)會逐步(bu)開展更多的合(he)作。
三、預告下一代訓練芯片,性能提升超2倍
此前,在(zai)AI芯片的訓練端,英偉達旗下的GPU(圖形處(chu)理器(qi))可謂一家獨大(da)。而Habana Labs的Gaudi則(ze)對這(zhe)一現(xian)狀發(fa)起(qi)了(le)挑戰。
于明揚稱,Habana Labs的(de)Gaudi芯片與英偉達(da)的(de)旗艦(jian)GPU A100相比(bi)(bi),雖然性能上(shang)還(huan)略有不如(ru),但是在(zai)性價比(bi)(bi)上(shang)已經實現了(le)超越。他提到(dao),Habana Gaudi基本上(shang)已經能夠達(da)到(dao)A100 70%的(de)性能,而價格(ge)則(ze)只有A100的(de)一半(ban),這使得很多客戶在(zai)實際(ji)體驗后選擇(ze)了(le)Habana Gaudi。
Habana Labs預計將于明年上半年推出下一代(dai)AI芯片(pian),代(dai)號(hao)為Gaudi 2,將采(cai)用臺(tai)積電7nm制程工藝。與現有(you)的Gaudi芯片(pian)相比,Gaudi 2將會有(you)兩倍(bei)以上的性能提升。
最后,于(yu)明揚談到了未(wei)(wei)來AI芯(xin)片的(de)(de)發展(zhan)趨勢。他(ta)認為,異構計算將(jiang)會(hui)是未(wei)(wei)來芯(xin)片的(de)(de)發展(zhan)方向,GPU、FPGA、ASIC等各(ge)類芯(xin)片將(jiang)會(hui)根據特點不同,在(zai)計算集群中擔任不同的(de)(de)任務。而未(wei)(wei)來的(de)(de)挑(tiao)戰就是如(ru)何將(jiang)不同的(de)(de)任務,部署到最合適(shi)的(de)(de)架構上。
結語:背靠英特爾,提升市場競爭力
在(zai)(zai)加入英(ying)特(te)爾(er)的(de)(de)(de)整(zheng)個生態(tai)體系后,Habana Labs的(de)(de)(de)客戶資(zi)源得(de)到(dao)了提升(sheng),在(zai)(zai)產品(pin)性價比不錯的(de)(de)(de)前提下,為當今(jin)的(de)(de)(de)AI芯片市場(chang)提供(gong)了一(yi)種新的(de)(de)(de)選擇。而英(ying)特(te)爾(er)也借此(ci)豐(feng)富了自(zi)(zi)己的(de)(de)(de)武器庫,加強了自(zi)(zi)己在(zai)(zai)AI芯片領域(yu)的(de)(de)(de)實(shi)力。在(zai)(zai)于明揚看來,SDSC作為美國(guo)少數超(chao)算中(zhong)心之一(yi),選擇Habana Gaudi、Goya,某種程(cheng)度上說明SDSC看好ASIC芯片在(zai)(zai)超(chao)算集(ji)群中(zhong)的(de)(de)(de)應用前景(jing),也證明Habana Labs的(de)(de)(de)產品(pin)在(zai)(zai)科研(yan)領域(yu)有(you)一(yi)定的(de)(de)(de)發展潛力。
隨著Habana Labs產品細節(jie)的(de)完善,其AI芯(xin)片的(de)市場(chang)競(jing)爭力也在不斷(duan)提升,可(ke)能會對英偉(wei)達在AI訓練等領(ling)域的(de)地(di)位發起挑(tiao)戰(zhan)。