
芯東西(公眾號:aichip001)
作者 | ?GTIC峰會
芯東西8月26日(ri)報道,今日(ri),GTIC 2022全球AI芯片峰會在(zai)深圳市南(nan)山區正式開幕!
這場(chang)高規格(ge)產業會議由芯東西與(yu)智東西公(gong)開課(ke)聯合(he)主辦,以“不負芯光(guang) 智算未來”為(wei)主題,匯集了來自國內外AI芯片領(ling)域(yu)的產學研專(zhuan)家及創(chuang)業先鋒代表,暢談前沿技術(shu)創(chuang)新與(yu)最新落地(di)進展。
經過(guo)一天精彩的干貨分享與思想交(jiao)鋒,峰會全(quan)場座(zuo)無(wu)虛席,人氣爆棚(peng),現場交(jiao)流氛圍熱烈,全(quan)網(wang)直(zhi)播(bo)人數(shu)高達100萬+人次。
深圳市南山區科技創(chuang)新(xin)局黨組書(shu)記、局長(chang)曹環出席峰會(hui)開(kai)幕(mu)式并致辭(ci)。北京(jing)大學(xue)(xue)集(ji)成電(dian)路學(xue)(xue)院(yuan)院(yuan)長(chang)蔡一茂教授分享(xiang)了(le)存(cun)算一體與類腦計算芯片的創(chuang)新(xin)路徑(jing)與技術挑(tiao)戰。
值得一(yi)提(ti)的是,在(zai)峰會現場,上(shang)海交通(tong)大(da)學計算(suan)機(ji)科學與工程系教授梁曉峣(yao)宣布,正式(shi)推出第一(yi)代(dai)開(kai)源GPU——“青花瓷”架構,打造(zao)開(kai)源通(tong)用智能算(suan)力(li)芯片平(ping)臺,“做人(ren)人(ren)都(dou)用得起的GPU”。
本屆峰會覆蓋當前AI芯片(pian)產(chan)業的核心(xin)議題,涉及領域專(zhuan)用架構、通用GPU、存算一(yi)體(ti)、類腦計算、光子(zi)計算、量(liang)子(zi)計算等(deng)技術路(lu)線和(he)EDA工具(ju)、Chiplet等(deng)上游技術創新,并縱覽云端數據中心(xin)、車路(lu)協同(tong)、自(zi)動駕駛、邊(bian)緣計算、智能(neng)家居等(deng)主流的落(luo)地應(ying)用場景。
在上午的AI芯片高峰論壇(tan)期間(jian),NVIDIA、壁仞(ren)科技解讀了最新旗艦(jian)通用GPU的架構創(chuang)新;瀚博半導體、地平(ping)線、后摩(mo)智能分享了用AI芯片助力車路(lu)協同與(yu)自動駕(jia)駛的心得;智一科技聯(lian)合(he)創(chuang)始(shi)人、總編輯(ji)張國仁現場(chang)對(dui)話臨(lin)芯投資董事長(chang)李亞軍、和利(li)資本董事總經理肖鵬、天數智芯CTO呂堅(jian)平(ping),暢聊對(dui)AI芯片企業創(chuang)新與(yu)生存的思考。
在(zai)下(xia)午的(de)云(yun)端(duan)AI芯片(pian)專題論壇上,Graphcore、墨芯人工智能(neng)、昆侖芯科技、鯤云(yun)科技從(cong)不同維度分(fen)享了在(zai)技術創新與量(liang)產(chan)落地的(de)經驗之談,芯行(xing)紀、奇異摩爾分(fen)別從(cong)EDA創新和(he)3DIC Chiplet角度探討了破解高性(xing)能(neng)計算挑戰的(de)思路。
下面,我們來看看AI芯片峰會首日的(de)演講精華。
一、開幕致辭:聚焦集成電路與人工智能有機結合的最前領域
在開幕式上,深圳市南山區(qu)科技(ji)創新局(ju)(ju)黨(dang)組書記、局(ju)(ju)長(chang)曹(cao)環發表致辭:“AI芯(xin)片峰會交(jiao)流聚焦的(de)邊緣計(ji)算、存算一體芯(xin)片等主題代表著集成電路和人工智(zhi)能有機結合(he)的(de)最前領(ling)域(yu),與(yu)深圳市南山區(qu)的(de)戰略(lve)新興產業的(de)布(bu)局(ju)(ju)高度契(qi)合(he)。”
▲深圳市南山區(qu)科技創新局黨組書記、局長(chang)曹環(huan)
曹環談(tan)道,南山(shan)區(qu)在具有(you)雄厚的(de)集(ji)成(cheng)電路產(chan)業(ye)(ye)基礎和突出的(de)創立優勢,2021年(nian)南山(shan)區(qu)的(de)集(ji)成(cheng)電路企業(ye)(ye)超(chao)過200家,年(nian)銷售額超(chao)過700億元,同比增長逾68%,培育了(le)中興(xing)微電子、國(guo)微集(ji)團、奧比中光等一批行業(ye)(ye)領軍(jun)企業(ye)(ye)。未來,南山(shan)區(qu)將繼續(xu)全力推動集(ji)成(cheng)電路產(chan)業(ye)(ye)集(ji)群的(de)高質量(liang)發展。
智一(yi)科技聯合創(chuang)(chuang)始人(ren)、CEO龔倫常代表主(zhu)辦方為本次峰會(hui)致辭。在(zai)簡要(yao)(yao)復(fu)盤了近年中(zhong)(zhong)國(guo)半導體行業面臨的(de)(de)挑戰(zhan)后,他指出挑戰(zhan)的(de)(de)另一(yi)面是機遇,中(zhong)(zhong)國(guo)是全球最大的(de)(de)單一(yi)市場(chang),改革開放的(de)(de)戰(zhan)略(lve)并未(wei)改變,同時(shi)在(zai)全面推進產業升級和(he)生產生活的(de)(de)數字化(hua),需(xu)求并不會(hui)因人(ren)為的(de)(de)限制(zhi)而消失,企業在(zai)砥礪奮進中(zhong)(zhong)創(chuang)(chuang)新、創(chuang)(chuang)造至關重要(yao)(yao)。
▲智一(yi)科技聯合創(chuang)始人(ren)、CEO龔倫常(chang)
創新(xin)需要(yao)(yao)良好的產(chan)業環(huan)境,這也是今年AI芯片峰會選址深(shen)圳(zhen)南山的重(zhong)要(yao)(yao)考量。深(shen)圳(zhen)是創新(xin)之(zhi)都,南山則是深(shen)圳(zhen)這片創新(xin)熱土的核心區,在研(yan)發投入、硬科技(ji)數量、獨角獸和(he)投資機(ji)構數量等方面都居深(shen)圳(zhen)之(zhi)首。龔倫常希望(wang)AI芯片峰會成為前沿技(ji)術交(jiao)流和(he)產(chan)業落地對(dui)接的重(zhong)要(yao)(yao)平臺。
今年(nian)是智一(yi)科技(ji)(ji)成立的(de)第6個年(nian)頭(tou)。智一(yi)科技(ji)(ji)堅(jian)持技(ji)(ji)術和產業(ye)雙輪驅動,聚焦(jiao)以(yi)人(ren)工(gong)智能(neng)、集成電路為代表的(de)前(qian)沿技(ji)(ji)術及其(qi)行業(ye)應用,構(gou)建產業(ye)媒體與(yu)企業(ye)服務兩(liang)大業(ye)務體系。
智(zhi)(zhi)一科技擁有以芯東西(xi)、智(zhi)(zhi)東西(xi)、車東西(xi)為代表的產(chan)業(ye)媒體(ti)(ti)(ti)矩(ju)陣(zhen),已成為國內(nei)定位獨特(te)且具(ju)有較高影響(xiang)力和公信力的產(chan)業(ye)媒體(ti)(ti)(ti);同(tong)時(shi)針對產(chan)業(ye)升級(ji)需求,發展出以智(zhi)(zhi)東西(xi)公開課(ke)為核(he)心的企(qi)業(ye)服(fu)務體(ti)(ti)(ti)系,與產(chan)業(ye)優(you)秀公司、全球頂(ding)級(ji)高校的專家學者(zhe)合作(zuo),舉辦(ban)系列talk及新青年(nian)講座,并與國內(nei)外(wai)頂(ding)級(ji)企(qi)業(ye)合作(zuo)舉辦(ban)定制公開課(ke),截至目前(qian)已完成的課(ke)程超過(guo)600節,收獲良(liang)好口碑。
二、北京大學蔡一茂:新型存儲器是AI芯片的重要助推器
隨著AI技術逐漸獲得廣(guang)泛(fan)應(ying)用,智(zhi)能(neng)計(ji)算(suan)正(zheng)呈現從提高(gao)性能(neng)到(dao)降低能(neng)耗、從計(ji)算(suan)密(mi)集(ji)(ji)型(xing)到(dao)數據(ju)(ju)密(mi)集(ji)(ji)型(xing)、從結構(gou)(gou)化(hua)數據(ju)(ju)到(dao)半結構(gou)(gou)化(hua)或(huo)非(fei)結構(gou)(gou)化(hua)數據(ju)(ju)的趨勢。進入軟硬(ying)件(jian)并(bing)進時代的AI,對硬(ying)件(jian)提出高(gao)算(suan)力(li)、高(gao)并(bing)行、低功耗等需求。
在上(shang)午舉辦的(de)AI芯(xin)片(pian)高(gao)峰論壇期間,北(bei)京大學集(ji)成(cheng)電(dian)路學院(yuan)院(yuan)長(chang)蔡一(yi)茂教授分(fen)享道,新型存儲(chu)(chu)(chu)器(qi)(qi)與先進封(feng)裝技術(shu)是AI芯(xin)片(pian)的(de)重要助推器(qi)(qi),其中大容量、高(gao)速、高(gao)帶寬存儲(chu)(chu)(chu)器(qi)(qi)是瓶頸,AI時(shi)代正(zheng)帶動存儲(chu)(chu)(chu)器(qi)(qi)接(jie)口標準的(de)持續創新。
▲北(bei)京(jing)大學(xue)集成電(dian)路學(xue)院院長(chang)蔡(cai)一茂(mao)教授
基于存算分離架構的(de)(de)傳統智能芯(xin)片受制于器件、架構、能耗(hao)瓶頸(jing),存在低(di)(di)效率(lv)、高功(gong)耗(hao)的(de)(de)問題,而存算一體(ti)芯(xin)片能消除數(shu)據搬運造成的(de)(de)算力瓶頸(jing),顯著降(jiang)低(di)(di)功(gong)耗(hao),提(ti)高計(ji)算能效。
借鑒人類大腦(nao)體系結(jie)構的類腦(nao)仿(fang)生芯片(pian),同樣采用(yong)新型(xing)存儲器,通(tong)過片(pian)間互連(lian)運行(xing)大規模的脈沖(chong)神經網絡是(shi)一個重(zhong)要的智能(neng)(neng)芯片(pian)技術。蔡(cai)一茂(mao)教(jiao)授認為,相(xiang)比(bi)采用(yong)傳統(tong)器件,采用(yong)RRAM憶阻器等(deng)神經形態(tai)器件的類腦(nao)仿(fang)生芯片(pian)具有多重(zhong)優勢,是(shi)突破算力瓶頸與(yu)實(shi)現更高智能(neng)(neng)的重(zhong)要技術,但目前還面臨(lin)工藝不成熟(shu)和(he)底層器件性能(neng)(neng)有待提高,集成密度受限等(deng)挑戰(zhan)。
目前,北(bei)京(jing)大學(xue)研發的類腦計算芯片已具備高(gao)集(ji)成(cheng)度、高(gao)擴展性、高(gao)通用性等特征,支(zhi)持運行圖像(xiang)識(shi)別(bie)、音頻識(shi)別(bie)、人臉識(shi)別(bie)與跟蹤(zong)等常見DNN/BNN模型。
三、上海交大梁曉峣:推出通用智能算力芯片平臺,宣布首個開源GPU架構
上海交通大(da)學(xue)計算機科學(xue)與工程(cheng)系(xi)教授(shou)梁曉峣在會(hui)上宣(xuan)布(bu),正(zheng)式推(tui)出開(kai)源通用智(zhi)能算力芯片平臺,將第一代(dai)GPU架構“青花瓷”免(mian)費(fei)開(kai)源,“做人人都(dou)用得起的GPU”。
“青花瓷”的(de)架(jia)構和指(zhi)令(ling)兼容(或二(er)進制轉譯或兼容)NVIDIA,支(zhi)持SIMT為主體的(de)可擴展性架(jia)構以保證(zheng)強(qiang)大可編(bian)程性,并支(zhi)持超薄的(de)軟件棧設計,通過極簡(jian)的(de)API封裝(zhuang)將硬件細節暴露給程序(xu)員,降低軟件開(kai)發難度。
▲上海交(jiao)通大學計算機科學與工(gong)程(cheng)系教授梁(liang)曉峣
談及國產自主云端GPGPU的發展機遇,梁曉峣教授金句頻出,比如將國內格局總結成:南“昇騰”,北“昆侖”,“平頭”當中坐,東西齊上陣(分別代指華為昇騰、百度昆侖芯、阿里平頭哥、眾多創業公司)。
縱觀(guan)云端AI芯片(pian)產業發展路(lu)徑,是(shi)(shi)要做得(de)更專(zhuan)業還是(shi)(shi)通用?梁曉峣幽默地(di)談道(dao),摩爾(er)定(ding)律(lv)已(yi)經(jing)被“社死(si)”了很多次,但仍然(ran)頑(wan)強(qiang)地(di)活著,而且是(shi)(shi)GPU歷史上對沖2P風(feng)險的最強(qiang)武器,數據并行計(ji)算作為(wei)可擴展性最強(qiang)的并行方式,與摩爾(er)定(ding)律(lv)是(shi)(shi)“佳偶天(tian)成(cheng)”。
他直(zhi)言市(shi)場需要的不是(shi)“好(hao)(hao)”芯片(pian)(pian),而是(shi)“好(hao)(hao)用”的芯片(pian)(pian),“不好(hao)(hao)用”是(shi)自主(zhu)芯片(pian)(pian)公司的通病,是(shi)目前行業的最(zui)大痛點。
據他分享,商業化市場(chang)最希望做到與(yu)NVIDIA兼(jian)容,做到無縫切換,但要做一款能與(yu)NVIDIA完全兼(jian)容的芯片,需要至(zhi)少3000人的團(tuan)隊、花費10年時(shi)間(jian)、付出(chu)超(chao)過100億美元的投資(zi)。
其中最根(gen)本的(de)問(wen)題是(shi)軟件(jian)。從舊世界發展起來的(de)傳(chuan)統軟件(jian)架構和層(ceng)次要經歷巨大的(de)變革。當(dang)下國(guo)內芯片(pian)產業在(zai)軟件(jian)層(ceng)面存(cun)在(zai)“重(zhong)復造(zao)輪(lun)子”問(wen)題。
梁曉峣教授說,云端(duan)大算力芯片的(de)(de)投(tou)(tou)資(zi),要的(de)(de)是(shi)“細水(shui)長流(liu)”,憑(ping)的(de)(de)是(shi)“天荒地老”,第一層(ceng)次(ci)投(tou)(tou)資(zi)金,第二(er)層(ceng)次(ci)投(tou)(tou)團隊,第三層(ceng)次(ci)投(tou)(tou)時間。要后來(lai)居上,需要以(yi)(yi)免費解決(jue)“錢”的(de)(de)問題(ti)(ti),以(yi)(yi)開(kai)放解決(jue)“人(ren)”的(de)(de)問題(ti)(ti),以(yi)(yi)開(kai)源解決(jue)“時間”的(de)(de)問題(ti)(ti)。
他認為國產芯(xin)片(pian)(pian)生態(tai)弱小的時候,需要(yao)學術界雪(xue)中送碳(tan)。這(zhe)也是為什么其團隊打造了三個“一”工(gong)程(一本GPGPU架構和芯(xin)片(pian)(pian)設(she)計專(zhuan)業教(jiao)材、一門核心課程、一個開源(yuan)通用智(zhi)能算力芯(xin)片(pian)(pian)平臺),形成四大(da)支(zhi)(zhi)柱(行業人(ren)才支(zhi)(zhi)柱、知識產權(quan)支(zhi)(zhi)柱、產業聯盟支(zhi)(zhi)柱、開放(fang)生態(tai)支(zhi)(zhi)柱)。
四、巔峰對話:一半火焰一半海水,AI芯片企業要學會“向客戶要錢”
圍繞AI芯(xin)片的(de)(de)趨(qu)勢變化,智一科技聯合創始(shi)人(ren)、總編輯張國仁,與(yu)臨芯(xin)投資董事?李亞(ya)軍(jun)、和利資本董事總經理肖鵬、天(tian)數智芯(xin)CTO呂堅平進行了一場以“創新與(yu)?存,AI芯(xin)?的(de)(de)現在和未來”為主題的(de)(de)巔峰對話。
▲巔峰對話環節,從左到右依次是:智(zhi)一科技聯合(he)創始人、總(zong)編輯(ji)張(zhang)國仁,臨(lin)芯投資董(dong)事(shi)長李亞軍,和利資本董(dong)事(shi)總(zong)經理肖鵬(peng),天(tian)數智(zhi)芯CTO呂堅平
臨芯(xin)投資董(dong)事(shi)?李(li)亞軍曾參投過許多半導體項(xiang)目(mu),但(dan)對AI芯(xin)片(pian)項(xiang)目(mu)一向(xiang)謹慎(shen),直至(zhi)觀察到(dao)AI芯(xin)片(pian)走(zou)到(dao)了創新發展(zhan)“S曲線”的(de)第二(er)波小高峰,他(ta)才開始出手(shou),陸續投資黑(hei)芝麻(ma)智能(neng)、昆侖芯(xin)等知(zhi)名(ming)AI芯(xin)片(pian)獨角獸企(qi)業。
“一(yi)半火焰,一(yi)半海水。”李(li)亞(ya)軍談道,參考“過(guo)剩經(jing)濟學”的(de)(de)(de)說(shuo)法,AI芯片領域高端的(de)(de)(de)人才及產品仍然稀缺,但(dan)一(yi)些(xie)中低端領域的(de)(de)(de)芯片創業公司已(yi)顯過(guo)剩。AI芯片是一(yi)個(ge)周期性(xing)行業,當下貿易戰、疫情把周期拉長了周期長度,既(ji)然是周期,低谷也會回歸(gui)到正(zheng)常周期,全球化浪潮不可阻擋(dang)。
現(xian)階段,從投資角(jiao)度來看(kan)(kan),他更看(kan)(kan)好(hao)有軟硬結合(he)和(he)場景應用結合(he)能(neng)力的企業,看(kan)(kan)重核心團隊的本身素質,以及公司生態朋友圈的打造。
和(he)利(li)資(zi)本同樣長期重(zhong)視半導體投資(zi),從2019年至今(jin)投了(le)30多個半導體項目。和(he)利(li)資(zi)本董事總經(jing)理肖(xiao)鵬也重(zhong)視對(dui)(dui)AI芯片(pian)(pian)(pian)團(tuan)(tuan)隊的(de)(de)考察,對(dui)(dui)于(yu)大芯片(pian)(pian)(pian)賽(sai)道(dao),他會更看重(zhong)核心團(tuan)(tuan)隊的(de)(de)同類芯片(pian)(pian)(pian)成功經(jing)驗,團(tuan)(tuan)隊完整性以及團(tuan)(tuan)隊配合的(de)(de)默契(qi)程度;對(dui)(dui)于(yu)技術門(men)檻相對(dui)(dui)低的(de)(de)小芯片(pian)(pian)(pian)賽(sai)道(dao),他會看重(zhong)這家(jia)企(qi)業的(de)(de)核心指標是(shi)(shi)否有10倍于(yu)競爭對(dui)(dui)手的(de)(de)優勢,團(tuan)(tuan)隊的(de)(de)缺點是(shi)(shi)否容易(yi)補(bu)齊。同時,他也非(fei)常重(zhong)視公司生態“朋友圈”,認為整個團(tuan)(tuan)隊的(de)(de)學習能力和(he)邊界延展性強,能夠通(tong)過上下游伙伴補(bu)齊短板。
談及(ji)“創新與生(sheng)存”問(wen)題,肖(xiao)鵬認為(wei),AI芯片(pian)企(qi)(qi)業(ye)需要(yao)著重想清(qing)楚“萬物+AI”還是(shi)“AI+萬物”這個(ge)問(wen)題,即企(qi)(qi)業(ye)要(yao)想清(qing)楚AI的(de)附加值(zhi)到底是(shi)在(zai)產品中占80%還是(shi)20%,不(bu)同占比做法完(wan)全(quan)不(bu)一(yi)樣。不(bu)管(guan)是(shi)采用哪種技術路徑去實現AI的(de)功(gong)能,AI芯片(pian)企(qi)(qi)業(ye)都要(yao)更加關注“向客戶要(yao)錢”。
在他看來,今年(nian)(nian)AI創企或許(xu)不(bu)(bu)能再像前兩年(nian)(nian)那樣活(huo)得(de)很(hen)輕松,需要考(kao)慮三個關鍵(jian)問題:1、如果行業還是(shi)像前幾年(nian)(nian)那么(me)火熱,公司CTO、合伙人還會不(bu)(bu)會接著跟你干(gan)?2、熱度(du)降下來的時候(hou),正好可用來思考(kao)團隊怎么(me)建設,產品如何,服(fu)務客戶等關鍵(jian)問題。3、做好現金(jin)流的管理。
天數智芯是國內(nei)通用GPU高端芯片(pian)的(de)代表(biao)企業之(zhi)一(yi),今(jin)年7月剛宣布(bu)完(wan)成超10億元C+輪(lun)及(ji)C++輪(lun)融(rong)資(zi)。天數智芯CTO呂堅(jian)平(ping)從被投資(zi)者(zhe)的(de)角(jiao)度分享(xiang)了他的(de)洞(dong)察。
呂堅平(ping)說,天(tian)數智芯(xin)已(yi)走(zou)過尋找客(ke)戶的(de)階段(duan),公司的(de)創新變成與客(ke)戶合(he)作適配中突破。比如(ru)在當下備受關(guan)注(zhu)的(de)大模型領(ling)域,他(ta)認為從客(ke)戶需求來看,當下智算(suan)中心的(de)底層算(suan)力建設不但要通用,而且要有多(duo)維度的(de)效能指標,如(ru)穩定度等,而不僅僅是強調(diao)高算(suan)力。
五、突破云端AI芯片算力瓶頸!架構創新、全棧能力、落地心經
2017年(nian)(nian),NVIDIA(英偉達)發布Tesla V100領銜炸場(chang),掀(xian)起(qi)了全(quan)球AI芯片的(de)創新(xin)狂瀾(lan)。如今五年(nian)(nian)過(guo)去,NVIDIA GPU始終(zhong)是云端AI訓練(lian)芯片的(de)“標桿”,與此同(tong)時,國內(nei)外多家創企摩拳(quan)擦掌,基于不同(tong)架構路線向云端AI芯片市場(chang)發起(qi)沖鋒。
今天(tian),來(lai)自NVIDIA、壁仞科技(ji)(ji)(ji)、Graphcore、墨芯人(ren)工智能(neng)、昆侖(lun)芯科技(ji)(ji)(ji)、鯤(kun)云科技(ji)(ji)(ji)等知名(ming)云端AI芯片企(qi)業以及EDA新(xin)秀芯行紀(ji)、Chiplet創(chuang)(chuang)企(qi)奇異摩爾的技(ji)(ji)(ji)術專家及創(chuang)(chuang)業領袖,聯袂奉上了從技(ji)(ji)(ji)術創(chuang)(chuang)新(xin)、量產落地(di)到(dao)生態構建的深(shen)度見解。
1、NVIDIA賴俊杰:揭秘英偉達最強Hopper架構
今年3月,全球AI計算巨頭NVIDIA在GTC大會上重磅推出基于(yu)全新(xin)Hopper架構的新(xin)一代旗艦GPU計算芯片H100,將多種精度下(xia)的AI算力最高提升(sheng)至(zhi)上一代A100的3~6倍。
NVIDIA中國(guo)區工程(cheng)及解(jie)決方案高級(ji)總監賴俊(jun)杰對Hopper架構進行了(le)詳細解(jie)析(xi)。實現性能(neng)提(ti)升的關(guan)鍵(jian)是新一代流式多(duo)處(chu)理器(SM)和新型線程(cheng)塊集(ji)群技術(shu)。
▲NVIDIA中(zhong)國(guo)區(qu)工程及解決方(fang)案(an)高級總監(jian)賴俊杰
SM引入了FP8張量核心(Tensor Core),相較(jiao)FP32/BF64吞吐(tu)量翻倍,與其Transformer引擎結合更是(shi)能(neng)大(da)(da)幅提升AI大(da)(da)模型(xing)(xing)的訓練效(xiao)率;還(huan)引入(ru)新指令集DPX,可加速動(dong)態編程(cheng)算(suan)法(fa),能(neng)解決路徑優化(hua)、基因組(zu)學等(deng)算(suan)法(fa)優化(hua)問題。新的線程(cheng)塊集群機制可實現跨單元進行協同計算(suan),為大(da)(da)模型(xing)(xing)加速運(yun)算(suan)提供更好的支撐(cheng)。
隨(sui)后賴俊杰(jie)分享了(le)GNN(圖神(shen)經網(wang)絡)分布(bu)式訓練的(de)一些研究進展(zhan)。對于大規(gui)模的(de)GNN問(wen)題,圖形結(jie)構和特征可能不適合單獨的(de)GPU內存,對此需要分區。利(li)用能實現多GPU高速互連的(de)NVIDIA NVSwitch系(xi)統(tong),可以更(geng)好地處理大規(gui)模GNN計(ji)算問(wen)題。
2、壁仞科技洪洲:對數據流深度優化,滿足大模型全棧能力需求
近兩(liang)三年,萬億參數的大(da)模型優越性更加明顯,同(tong)時對計(ji)算機體(ti)系結構和訓(xun)練(lian)框(kuang)架帶來巨大(da)挑戰。壁仞科(ke)技(ji)聯合創始?、CTO洪洲認為,大(da)模型需要從集群、平臺到(dao)框(kuang)架的全棧能力,壁仞科(ke)技(ji)的新品BR100系列(lie)通用GPU芯片應運而生。
▲壁仞科技聯合(he)創(chuang)始(shi)?、CTO洪洲
BR100采(cai)用(yong)7nm制程,容納近800億顆晶體(ti)管(guan),在BF16精(jing)度下(xia)達到1024TFLOPS性能,在INT8數(shu)據精(jing)度下(xia)支持2048TOPS算力。這款芯片在國內(nei)率先采(cai)用(yong)Chiplet技術、PCIe5.0接(jie)口(kou)和CXL互連協議(yi),創下(xia)了國內(nei)GPU互連帶寬(kuan)紀錄。
如何實現計(ji)算效率(lv)的(de)提升(sheng)?洪洲說(shuo),這主(zhu)要來自對數據流(liu)的(de)深度(du)優化。針對通用大算力(li)GPU面(mian)臨的(de)內存(cun)墻、功耗墻、并行性、互連和(he)指令集架(jia)構等挑(tiao)戰(zhan),壁(bi)仞(ren)科技設計(ji)了(le)訓(xun)推一體的(de)原創芯片架(jia)構“壁(bi)立(li)仞(ren)”,在(zai)數據流(liu)精度(du)、存(cun)取加速、并行、搬移、隔(ge)離等方面(mian)實現了(le)優化。
壁仞(ren)科技不僅有通用(yong)GPU架構、高(gao)算(suan)力的Tensor Core,還通過張量數(shu)據(ju)(ju)存(cun)(cun)(cun)取加(jia)速器提高(gao)數(shu)據(ju)(ju)存(cun)(cun)(cun)取效率;并采(cai)用(yong)NUMA/UMA訪存(cun)(cun)(cun)機(ji)制,根據(ju)(ju)深度學習訓(xun)練和通用(yong)并行計算(suan)的數(shu)據(ju)(ju)流特點分配內存(cun)(cun)(cun),從而實(shi)現“數(shu)據(ju)(ju)跑到哪(na)里,計算(suan)就(jiu)在哪(na)里”,提高(gao)計算(suan)效率。
3、Graphcore金琛:利用IPU構建高能效AI計算平臺
“訓(xun)練圖像識別模(mo)型(xing)時(shi),2012年AlexNet模(mo)型(xing)完成(cheng)訓(xun)練需要(yao)(yao)6天,如(ru)今只需要(yao)(yao)幾(ji)分鐘就可以完成(cheng)這項任(ren)務。”Graphcore中國工程副(fu)總裁、AI算法科學家金琛在發表演(yan)講時(shi)談道。
▲Graphcore中國工程副總裁、AI算法科學家金琛(chen)
大(da)規模AI計算的(de)(de)發展有三大(da)趨勢,分別是(shi)通(tong)過優化(hua)硅(gui)技(ji)術實現專業化(hua)變得更難、對越來(lai)越大(da)的(de)(de)模型的(de)(de)需求并未放緩、計算系統和(he)軟(ruan)件提升(sheng)的(de)(de)空間仍然很(hen)大(da)。
為(wei)了適應AI框架的發展,Graphcore正不斷豐(feng)富軟件生態系(xi)統(tong),其模型花園已(yi)涉及計(ji)算(suan)機視覺(jue)、自然語言處理、圖神經網絡等領域。在(zai)具體應用效果上,Graphcore的產品(pin)在(zai)保險業中使用計(ji)算(suan)機視覺(jue)來幫助(zhu)評估、維(wei)修以(yi)及保護汽車和房(fang)屋,使得結果效率提升了5倍。
AI大(da)模(mo)型的參數規模(mo)暴漲帶來許多挑戰,包括(kuo)計算系統的提升及模(mo)型本身應該變得(de)更加(jia)聰(cong)明。在此(ci)過(guo)程(cheng)中,數萬億(yi)參數的密集神經網(wang)絡不可(ke)行(xing),需要稀疏模(mo)型架構。因此(ci),Graphcore正在設(she)計一個系統,可(ke)以支持百萬億(yi)級(ji)的模(mo)型訓練。
4、墨芯人工智能王維:稀疏化推動AI計算向超高算力、更低成本發展
大(da)模型(xing)是AI的下一個必(bi)爭之地,隨著AI芯片受限于(yu)摩爾定律,硬件升級逼(bi)近(jin)物理極限,處理AI大(da)模型(xing)算力瓶頸突破迫在眉(mei)睫。
墨芯(xin)人工智(zhi)能創(chuang)始(shi)人兼CEO王維認為,稀疏化計算(suan)是AI計算(suan)的(de)未(wei)來。稀疏化計算(suan),是一種以(yi)人腦得到靈感的(de)模型(xing)壓縮方法(fa)。簡單來說,就是通過底(di)層創(chuang)新、軟硬協(xie)同(tong)設計,讓神(shen)經網絡(luo)模型(xing)消減冗余,以(yi)提高(gao)計算(suan)效率。
▲墨(mo)芯人工(gong)智能創(chuang)始人兼CEO王維
稀(xi)疏化計(ji)算(suan)(suan)相(xiang)較于業內其他(ta)AI加速(su)技術,并(bing)不是(shi)微量的(de)(de)差異化創新(xin),而是(shi)能夠讓性(xing)能帶(dai)來十(shi)倍(bei)(bei)、百倍(bei)(bei)的(de)(de)創新(xin)。王維拿標志性(xing)的(de)(de)AI大模型——GPT-3來舉(ju)例說明(ming)稀(xi)疏化計(ji)算(suan)(suan)的(de)(de)驚(jing)人(ren)性(xing)能表(biao)現。GPT-3有1700多(duo)億參數,如果放在GPU上去做推理的(de)(de)話(hua),需(xu)要(yao)內存量是(shi)要(yao)幾(ji)百G,也就是(shi)需(xu)要(yao)很多(duo)張80G的(de)(de)GPU,且會有明(ming)顯時延;但通(tong)過(guo)稀(xi)疏化計(ji)算(suan)(suan),用(yong)一張墨芯S30計(ji)算(suan)(suan)卡,就可以跑通(tong)GPT-3,并(bing)且計(ji)算(suan)(suan)速(su)度(du)還變快了很多(duo)。
目前(qian),墨芯基于(yu)自研(yan)稀疏化云(yun)端(duan)AI芯片Antoum推出(chu)了對應的S4、S10和S30三款AI計算卡,對標(biao)國際大廠主流(liu)AI推理卡,算力可(ke)達6倍(bei)以上。其中S30運算ResNet-50算力超90000FPS。
王維透露(lu),流片成功僅半年,墨芯已在核(he)心(xin)細分市場(chang)獲得幾(ji)家客戶。在互聯(lian)網(wang)市場(chang),墨芯已在一些頭部(bu)互聯(lian)網(wang)公司進入(ru)適配階段;在行業市場(chang),墨芯也與生命科(ke)學(xue)領域部(bu)分企(qi)業項目落地。
在未來一(yi)個階段(duan)中,墨芯(xin)將圍繞互聯(lian)網(wang)、泛政府(fu)行(xing)業(ye)及(ji)垂直行(xing)業(ye)三(san)大方向進行(xing)市場推(tui)廣。在定價上,會將整個算力服務(wu)器的TCO(總擁(yong)有(you)成本(ben))達到現有(you)主流產品的1/2,甚至1/3。
9月,墨芯人工智能將(jiang)公布S4和S30在業內(nei)權威AI基準測試MLPerf上的性能測試結果,王維說(shuo),這有望代表國產(chan)AI芯片達成一(yi)個新里程碑。
5、昆侖芯科技漆維:規模化部署通用AI芯片,攻克4大難點
空(kong)前繁榮的(de)AI生(sheng)態、場(chang)景與時(shi)(shi)局正驅動AI芯(xin)片快速發展(zhan),同時(shi)(shi),行業也面臨(lin)算法多樣化、巨頭生(sheng)態壁壘、客戶需求苛刻、部署環境(jing)復雜等眾多挑戰。面向這一趨勢,脫胎于百度(du)的(de)昆侖芯(xin)團隊(dui)于2017年(nian)推出了自研架構(gou)昆侖芯(xin)XPU,目前已推出兩款通(tong)用AI芯(xin)片。
昆(kun)(kun)侖(lun)(lun)(lun)(lun)芯(xin)科技芯(xin)片(pian)研發總監漆維談道,其(qi)自(zi)(zi)研新(xin)一代昆(kun)(kun)侖(lun)(lun)(lun)(lun)芯(xin)XPU-R架構采(cai)(cai)用自(zi)(zi)研高效(xiao)SIMD指令(ling)集(ji),在國內業(ye)界率(lv)先支持GDDR6,支持片(pian)上共(gong)享內存,采(cai)(cai)用軟(ruan)件定義(yi)神(shen)經網絡引(yin)擎,并配合昆(kun)(kun)侖(lun)(lun)(lun)(lun)芯(xin)SDK全(quan)棧軟(ruan)件工具,實(shi)(shi)現更通用、易編程、高性(xing)能(neng)、低成本(ben)和自(zi)(zi)研創(chuang)新(xin)的新(xin)特征。基于自(zi)(zi)研昆(kun)(kun)侖(lun)(lun)(lun)(lun)芯(xin)XPU-R架構,昆(kun)(kun)侖(lun)(lun)(lun)(lun)芯(xin)科技目前已推出了采(cai)(cai)用7nm工藝的昆(kun)(kun)侖(lun)(lun)(lun)(lun)芯(xin)2代AI芯(xin)片(pian),算力(li)達(da)256 TOPS(INT8)。以昆(kun)(kun)侖(lun)(lun)(lun)(lun)芯(xin)AI加速卡(ka)R200為例(li),經過業(ye)務規模部署的實(shi)(shi)際測試,對典(dian)型AI負(fu)載的性(xing)能(neng)相較業(ye)界主流150W GPU提升在1.5倍左右。
▲昆(kun)侖芯(xin)(xin)科技芯(xin)(xin)片研發總監漆維(wei)
漆維說,昆(kun)侖芯(xin)(xin)2代AI芯(xin)(xin)片(pian)是(shi)國內唯(wei)一(yi)款經(jing)過(guo)互聯網大規模核(he)心算法(fa)考驗(yan)的(de)云(yun)端AI芯(xin)(xin)片(pian),目前已落地搜索、Online learning(在(zai)線學習系統)、自智慧交(jiao)通、智算中(zhong)心等眾多(duo)領(ling)域。下一(yi)步(bu),對標業界最前沿產品的(de)昆(kun)侖芯(xin)(xin)3代AI芯(xin)(xin)片(pian)將在(zai)不久(jiu)之后面世。
6、鯤云科技蔡權雄:定制數據流架構,實現更優算力性價比
鯤云科技聯合創始人(ren)&CTO蔡權雄談(tan)道(dao),數(shu)據流將成為(wei)解決性能瓶頸(jing)的(de)關(guan)鍵技術。數(shu)據流芯片就(jiu)是依托數(shu)據流流動次(ci)(ci)序(xu)控(kong)制(zhi)計算次(ci)(ci)序(xu),把數(shu)據的(de)運算和搬運重(zhong)疊起來,消除空(kong)閑(xian)計算單元。
▲鯤云科技聯合創(chuang)始人(ren)&CTO蔡(cai)權雄
芯(xin)(xin)片(pian)利用率(lv)決定芯(xin)(xin)片(pian)的實測性能(neng)(neng),即(ji)芯(xin)(xin)片(pian)實際性能(neng)(neng)占其峰值算(suan)力的比例。數(shu)據流(liu)架構可(ke)有效提高芯(xin)(xin)片(pian)利用率(lv),采用指令集(ji)架構的芯(xin)(xin)片(pian)利用率(lv)能(neng)(neng)達到(dao)7%~32%,而鯤云定制數(shu)據流(liu)架構的實測芯(xin)(xin)片(pian)利用率(lv)可(ke)以達到(dao)65%~95.4%。
“我(wo)們采用(yong)成(cheng)熟(shu)制程工藝的(de)芯(xin)(xin)片(pian),能(neng)夠達(da)到先進制程芯(xin)(xin)片(pian)的(de)效果(guo)。”蔡權雄說。鯤云科技(ji)的(de)高性能(neng)數(shu)據流(liu)AI芯(xin)(xin)片(pian)CAISA,將(jiang)運算單(dan)元通過可(ke)編程的(de)單(dan)元連接(jie)在一起,并通過算子的(de)配(pei)置和數(shu)據流(liu)網絡的(de)編程保障芯(xin)(xin)片(pian)的(de)通用(yong)性。目前(qian),其產(chan)品已經應用(yong)于智慧(hui)化工、智慧(hui)油田、智慧(hui)電(dian)力(li)等多個行(xing)業。
7、芯行紀丁渭濱:用AI優化EDA,大幅提升芯片設計效率
AI芯片(pian)(pian)能加(jia)速運行(xing)AI算法,反過來,AI算法也能助(zhu)力(li)更高效的AI芯片(pian)(pian)設計(ji)。芯行(xing)紀(ji)資(zi)深研(yan)發(fa)副總(zong)裁丁渭濱分享了(le)AI優化(hua)芯片(pian)(pian)設計(ji)工具的兩類(lei)應用(yong)——預測性能,幫助(zhu)EDA工具更自動化(hua)。
▲芯行紀資深研發副總裁丁渭濱
AI算法在(zai)設(she)計(ji)前(qian)期就(jiu)可以預測(ce)芯(xin)片的性能(neng),并(bing)能(neng)實現5~10%的PPA提升。用(yong)(yong)AI幫助EDA工(gong)具更(geng)自動(dong)化方面,當客戶(hu)在(zai)反復(fu)跑(pao)某(mou)一個設(she)計(ji)時(shi),AI能(neng)基于此前(qian)參數的性能(neng)進行參數推薦。國(guo)際EDA巨頭在(zai)探(tan)索這(zhe)些應(ying)用(yong)(yong),其效果已優于人工(gong)調參。
他(ta)也分享了芯(xin)行紀在用AI構建數字實現EDA平臺的進(jin)展,其AmazeFP智能化布(bu)局規劃方(fang)案能實現同時觀測宏單元(yuan)和(he)標準單元(yuan)的擁塞(sai)度并控(kong)制擁塞(sai)模型的穩(wen)定性。該智能布(bu)局工具還能使機器自動擺放的宏單元(yuan)更加(jia)整(zheng)齊,并使其客(ke)戶在某(mou)一(yi)案例的布(bu)局規劃工作時間從以周為記(ji)(ji)縮短至以小時為記(ji)(ji)。
8、奇異摩爾祝俊東:用“3D樂高”芯片技術,滿足大算力需求
很多關(guan)注芯片創新的(de)(de)人,都會對英特爾(er)(er)今年(nian)發布(bu)的(de)(de)GPGPU 3D Chiplet技術印象深刻,英特爾(er)(er)將47顆Chiplet拼接在一起,成功實現在算力大幅提升的(de)(de)同時,兼顧(gu)了(le)面積與成本的(de)(de)平衡。
奇(qi)異(yi)(yi)摩爾即是一家專注(zhu)于(yu)2.5D/3DIC Chiplet技術研發的(de)(de)產品(pin)和(he)服務公司。奇(qi)異(yi)(yi)摩爾產品(pin)及解(jie)決?案副總裁祝俊(jun)東說(shuo),在當前高性能計(ji)(ji)算面(mian)臨顯著挑戰:如芯(xin)片良率隨(sui)著面(mian)積上升呈現指數級下降趨勢(shi);單芯(xin)片面(mian)積受限;先進制程設計(ji)(ji)量產成本高等等。3D Chiplet設計(ji)(ji)因有助于(yu)解(jie)決高性能計(ji)(ji)算挑戰,受到了更(geng)多(duo)AI芯(xin)片廠(chang)商的(de)(de)關注(zhu)。在制程不(bu)變(bian)的(de)(de)情況下,基于(yu)異(yi)(yi)構計(ji)(ji)算的(de)(de)Chiplet能帶來算力的(de)(de)持續增長(chang),實現大芯(xin)片存儲容量和(he)連接性能的(de)(de)快速持續提升;通過異(yi)(yi)構靈活堆疊,使多(duo)顆拼在一起的(de)(de)Chiplet像(xiang)一個整體,同(tong)時也(ye)有效降低IP研發硬(ying)核支出(chu)。
▲奇異摩爾產品及解(jie)決?案副總裁(cai)祝(zhu)俊東
祝俊(jun)東談(tan)道(dao),3DIC Chiplet常被(bei)比喻成“積木”,但“拆(chai)”和“拼”也面臨著(zhu)不少工程化(hua)挑戰。為此,奇異摩爾面向芯(xin)片(pian)開發者提供2個(ge)硬件:3DIC Chiplet通用(yong)底(di)座和高速接(jie)口芯(xin)粒;1個(ge)軟件:Chiplet專用(yong)設計(ji)工具,從而幫(bang)助客戶實(shi)現從芯(xin)片(pian)設計(ji)到實(shi)現量產(chan)的(de)全流程。
六、助攻智聯汽車,AI芯片新勢力崛起
高度(du)自動(dong)駕(jia)駛涉及人與車、車與車、車和(he)路之(zhi)間的默契協同(tong),是(shi)實現(xian)暢通智慧交通的一大關鍵(jian)發(fa)展方向(xiang),多家AI芯片企業正致力(li)于通過優化加速計算(suan)能(neng)力(li),為車路協同(tong)提供更(geng)好的算(suan)力(li)支撐。
國(guo)產AI芯片如何(he)助(zhu)力車路協同突破落(luo)地瓶頸(jing)?怎樣滿足汽(qi)車智能化對算力提出(chu)的(de)更高要求?解決智能駕駛芯片發(fa)展的(de)核心矛盾,有哪(na)些可行(xing)的(de)創(chuang)(chuang)新思路?瀚博半導體創(chuang)(chuang)始人兼CTO張磊、地平線(xian)聯合創(chuang)(chuang)始人&CTO黃暢、后摩智能創(chuang)(chuang)始人&CEO吳強分別分享(xiang)了他們的(de)思考與探索。
此(ci)外,汽車業務進展飛速(su)的移動芯(xin)片(pian)巨頭高通(tong),也(ye)拿出將(jiang)AI能(neng)力從(cong)終(zhong)端側擴(kuo)展至邊緣側、賦(fu)能(neng)智能(neng)網聯(lian)邊緣的心得。高通(tong)技術公(gong)司產品管(guan)理副總裁Ziad Asghar還(huan)分享(xiang)了對元宇宙趨勢的觀察(cha)。
1、瀚博半導體張磊:AI芯片助力車路協同,性能超主流GPU 2倍以上
進入大算(suan)力(li)時(shi)(shi)代,眾多智能應(ying)用加速落地,車路協同作為(wei)支撐交通強國(guo)目標達成(cheng)的(de)(de)關(guan)鍵措(cuo)施,是其中一(yi)大代表。這對智慧的(de)(de)路、實(shi)時(shi)(shi)的(de)(de)云(yun)、聰明的(de)(de)車、精(jing)確(que)的(de)(de)圖提出(chu)更高(gao)的(de)(de)要(yao)(yao)求(qiu)。邊緣計算(suan)是其中重(zhong)要(yao)(yao)一(yi)環,從技(ji)術(shu)層(ceng)面(mian)來看,需要(yao)(yao)多元(yuan)化算(suan)力(li)、更低的(de)(de)時(shi)(shi)延、更精(jing)準的(de)(de)計算(suan)。
創(chuang)立于2018年的(de)(de)瀚(han)博半(ban)導體主攻AI推理芯(xin)片,其推出(chu)的(de)(de)邊緣端SV100芯(xin)片能充分應對車路(lu)協(xie)同(tong)新需求(qiu)。瀚(han)博半(ban)導體創(chuang)始(shi)人(ren)兼CTO張磊稱,GPU延(yan)時下降(jiang)時,吞吐量也(ye)大大下降(jiang),使其在(zai)車路(lu)協(xie)同(tong)場(chang)景受限(xian)。SV100芯(xin)片在(zai)性(xing)能及延(yan)時方面(mian)進行優化,比如處(chu)理點云數據性(xing)能是業界主流(liu)GPU 2倍以上,延(yan)時大大降(jiang)低。
▲瀚博(bo)半導體創(chuang)始人兼CTO張(zhang)磊(lei)
瀚博半(ban)導體和(he)客(ke)戶一(yi)起(qi)在廣州智(zhi)慧高速三元(yuan)里(li)收(shou)費站、廣州國際(ji)生物島智(zhi)能網聯基地項目等場景(jing)落地相關產品。瀚博半(ban)導體為(wei)車路(lu)協(xie)同(tong)打(da)造了邊緣AI推理加速卡、智(zhi)能MEC,具備100TOPS INT8峰值算力,支持多路(lu)多模態傳感器接入,能靈活部署,勝任各種邊緣部署復雜環(huan)境(jing)。
2、地平線黃暢:智能計算架構2.0時代,以高性能AI計算為核心
范式級(ji)智能(neng)算(suan)法的(de)(de)革新推動了汽車(che)智能(neng)化的(de)(de)發(fa)展。地(di)平線聯合創始人&CTO黃暢談道,智能(neng)汽車(che)是堪比“計(ji)算(suan)機(ji)誕(dan)生”級(ji)的(de)(de)顛覆式創新,隨著自動駕駛技(ji)術新范式的(de)(de)出現和發(fa)展,需要相匹配的(de)(de)計(ji)算(suan)架構,從而讓(rang)機(ji)器(qi)更自主、讓(rang)開發(fa)更簡單(dan)、讓(rang)計(ji)算(suan)更智能(neng)。
▲地平線(xian)聯合創始人(ren)&CTO黃暢(chang)
他指出,智(zhi)能(neng)(neng)計(ji)算(suan)架構2.0時代(dai),以高性能(neng)(neng)AI計(ji)算(suan)為核(he)心,讓范式級智(zhi)能(neng)(neng)算(suan)法的革新,和(he)支持智(zhi)能(neng)(neng)算(suan)法的硬(ying)件(jian)(jian)體系(xi)相(xiang)結合,加(jia)速(su)實(shi)現(xian)機(ji)器(qi)自(zi)編程(cheng)和(he)應用(yong)自(zi)適應。地平線自(zi)主研發的BPU貝(bei)葉斯計(ji)算(suan)架構,是(shi)先進(jin)處理(li)器(qi)技術的集(ji)大(da)成者(zhe),實(shi)現(xian)高效(xiao)的AI計(ji)算(suan),為軟(ruan)件(jian)(jian)定(ding)義汽(qi)車提供強勁AI性能(neng)(neng),加(jia)速(su)人機(ji)共駕(jia)時代(dai)的到來。
黃(huang)暢說,地(di)平(ping)線通過(guo)軟硬協同編譯優化(hua),實現性能(neng)持(chi)續(xu)提升,地(di)平(ping)線的(de)(de)AI計算架(jia)構(gou)仿真平(ping)臺是其在尋找(zhao)軟硬件(jian)協同優化(hua)上的(de)(de)有(you)效路徑之一。采用(yong)BPU貝葉斯架(jia)構(gou)的(de)(de)地(di)平(ping)線征程5,專為高等級自動(dong)駕駛打造,擁(yong)有(you)128TOPS大算力、計算性能(neng)達到1531FPS、60ms業界超低延遲和30W超低功耗,搭配端到端全套(tao)硬件(jian)加速方案,能(neng)滿足多樣化(hua)開發需求(qiu)。
他還(huan)分享了對于(yu)自動駕(jia)(jia)駛技術(shu)和行業趨勢的六大(da)判斷(duan):一是中國成為全球(qiu)頂級(ji)汽車智能芯(xin)片的“角(jiao)斗場”;二是自動駕(jia)(jia)駛走向量產(chan)落(luo)(luo)地,算力需求持續提(ti)升;三(san)是高等級(ji)自動駕(jia)(jia)駛落(luo)(luo)地,大(da)規模并行化AI計(ji)(ji)算成趨勢;四是自動駕(jia)(jia)駛逐(zhu)步(bu)由數據(ju)驅動替代(dai)傳(chuan)統基于(yu)規則的計(ji)(ji)算;五是AI計(ji)(ji)算逐(zhu)步(bu)取代(dai)邏輯計(ji)(ji)算,成為車載(zai)計(ji)(ji)算的核心;六是統一神經計(ji)(ji)算架構,滿(man)足(zu)智駕(jia)(jia)場景各種應用需求。
3、后摩智能吳強:破解智能駕駛芯片核心矛盾,存算一體成為金鑰匙
智(zhi)能駕駛(shi)的(de)(de)(de)普及和商(shang)用對智(zhi)能駕駛(shi)芯片(pian)提(ti)出了新的(de)(de)(de)要求(qiu)。后摩智(zhi)能創(chuang)始人&CEO吳(wu)強談(tan)道,智(zhi)能駕駛(shi)芯片(pian)發(fa)展的(de)(de)(de)核心矛盾(dun)在于算(suan)力需求(qiu)不斷增(zeng)長,但供給(gei)側(ce)的(de)(de)(de)傳統方(fang)(fang)案(an)成本昂貴(gui),且(qie)依(yi)賴于少數國際大(da)廠(chang)IP,再加上(shang)高功(gong)耗和較為封閉的(de)(de)(de)方(fang)(fang)案(an),也不利于未來的(de)(de)(de)算(suan)法演進(jin)和OTA升級。
▲后摩智(zhi)能創始人&CEO吳(wu)強
“具有天生優勢(shi)的(de)存算(suan)(suan)一(yi)體,就(jiu)成(cheng)為(wei)了解鎖(suo)算(suan)(suan)力和功耗難題(ti)的(de)金(jin)鑰匙。”吳強說。存算(suan)(suan)一(yi)體的(de)實現(xian)可類比(bi)為(wei)廚(chu)師炒菜,為(wei)了壓縮廚(chu)師在廚(chu)房(fang)和倉(cang)庫之間(jian)拿(na)菜、切菜、炒制的(de)過程,要讓倉(cang)庫和廚(chu)房(fang)變成(cheng)一(yi)個整(zheng)體。對應到計算(suan)(suan)機(ji)系統架(jia)構(gou)(gou)中,就(jiu)是將運算(suan)(suan)步驟(zou)和參數(shu)一(yi)起集成(cheng)在內存上(shang),這(zhe)種架(jia)構(gou)(gou)能(neng)(neng)用(yong)(yong)低成(cheng)本(ben)方式實現(xian)大算(suan)(suan)力、能(neng)(neng)效(xiao)比(bi)、低延時,同(tong)時對先進(jin)(jin)工藝(yi)依賴較弱(ruo),能(neng)(neng)夠用(yong)(yong)成(cheng)熟制程做出(chu)先進(jin)(jin)制程的(de)性能(neng)(neng)效(xiao)果。
后摩智(zhi)能研發的首款“存算(suan)一體”大算(suan)力(li)芯片(pian)(pian)已(yi)于去年成功流片(pian)(pian),成功跑通了(le)一些主流的自(zi)動駕(jia)駛算(suan)法,今年年底(di)有望給客戶試用。
4、高通Ziad Asghar:終端側AI助力打造智能網聯邊緣
高通技術公司產品(pin)管理副(fu)總裁Ziad Asghar提(ti)出,邊緣側(ce)AI將依(yi)舊(jiu)是AI發展(zhan)的(de)主要方向之一。高通公司致力于不(bu)斷(duan)增強(qiang)終(zhong)端(duan)側(ce)AI能力,讓數據在(zai)產生(sheng)的(de)地方進行處(chu)理,在(zai)既定功(gong)耗(hao)下不(bu)斷(duan)實現處(chu)理能力突破,實現快速響(xiang)應,并(bing)保障數據隱私安全。
▲高通技(ji)術公(gong)司產品管理(li)副(fu)總裁Ziad Asghar
高(gao)通公司(si)構建了(le)“統一的(de)技術(shu)路線圖”,基(ji)于此(ci)打造了(le)一系列(lie)面向AI的(de)IP和技術(shu),助力終(zhong)端側(ce)AI能力實(shi)現規模化擴展,覆蓋智(zhi)能網(wang)聯(lian)邊緣(yuan)。硬件方(fang)面,基(ji)于第七代高(gao)通AI引擎(qing),高(gao)通公司(si)為智(zhi)能手機帶來了(le)業(ye)界(jie)領先的(de)終(zhong)端側(ce)AI體驗(yan),同時也構成了(le)面向高(gao)通汽車、物聯(lian)網(wang)、XR等所有不同業(ye)務AI擴展能力的(de)真正(zheng)核心(xin)。
軟件方(fang)面,高(gao)通公司(si)最新推出的(de)高(gao)通AI軟件棧(Qualcomm AI Stack)已覆蓋(gai)其當(dang)前所(suo)有(you)(you)產品線,讓客戶一次開發(fa)(fa)(fa),即可將解決方(fang)案跨高(gao)通所(suo)有(you)(you)產品線進行(xing)遷移,開發(fa)(fa)(fa)者和(he)終端廠商可以根據實際需求進行(xing)模型開發(fa)(fa)(fa)和(he)優化,Ziad提(ti)到這是一個對開發(fa)(fa)(fa)者和(he)終端廠商都非常(chang)強大的(de)優勢。
高通公(gong)司的研發(fa)(fa)團隊致力(li)于推動終端(duan)側AI能(neng)力(li)在(zai)性能(neng)和能(neng)效(xiao)上(shang)不斷(duan)實(shi)現突破。展望(wang)未來(lai)的邊緣側AI前(qian)景,Ziad提(ti)出(chu),未來(lai)我們希(xi)望(wang)下一(yi)步能(neng)夠實(shi)現完全分布式的AI,能(neng)夠在(zai)終端(duan)上(shang)進行推理和一(yi)定程度的學(xue)習工作,而高通所開(kai)發(fa)(fa)的眾(zhong)多技術已經能(neng)助力(li)實(shi)現這一(yi)目標。
Ziad Asghar還(huan)談及最近大火的元(yuan)宇宙(zhou)(zhou)(zhou):“元(yuan)宇宙(zhou)(zhou)(zhou)是每(mei)個用戶(hu)獨(du)一無二的數字孿(luan)生,元(yuan)宇宙(zhou)(zhou)(zhou)中所有的視覺和體驗都基于(yu)用戶(hu)的喜(xi)好(hao),這意(yi)味著(zhu)需要持(chi)續(xu)進行個性化,不斷適(shi)應用戶(hu)的特(te)定需求,我認為這也(ye)是元(yuan)宇宙(zhou)(zhou)(zhou)的獨(du)特(te)優勢。”
結語:峰會首日圓滿舉行,明天精彩繼續!
峰(feng)會首日,來自產(chan)學研投界(jie)的17位重磅(bang)嘉賓,在AI芯(xin)片高峰(feng)論壇與(yu)云端AI芯(xin)片專題論壇上,圍繞(rao)技術創新、生態建(jian)設(she)等AI芯(xin)片核心議題,輸出了(le)豐富的產(chan)業干貨(huo)。
明日,GTIC 2022全球AI芯(xin)片(pian)峰(feng)會精彩繼續(xu),邊緣端AI芯(xin)片(pian)專題(ti)論壇、存算一體芯(xin)片(pian)專題(ti)論壇、新型計算技術專題(ti)論壇將(jiang)帶來(lai)更多攻克AI芯(xin)片(pian)技術壁壘和落地難關的思想(xiang)碰撞,期(qi)間還將(jiang)公布“2022中國AI芯(xin)片(pian)50強”榜單,敬請(qing)期(qi)待。