
芯東西(公眾號:aichip001)
編輯 | 心緣
GTIC 2020全(quan)球AI芯(xin)片創(chuang)新(xin)峰會剛(gang)剛(gang)在北京(jing)圓滿收(shou)官!在這場全(quan)天座無虛席、全(quan)網直播觀看人數逾150萬次(ci)的高規格AI芯(xin)片產業峰會上,19位產學界重磅(bang)嘉賓從(cong)不同維度分享了對中(zhong)國(guo)AI芯(xin)片自主(zhu)創(chuang)新(xin)和應用(yong)落(luo)地的觀察與預判。
在(zai)峰會下(xia)午場(chang),Cadence公司驗證事(shi)業部產品工程總監(jian)孫(sun)曉陽帶來主題為《AI大時代(dai)中的芯片設計驗證挑戰》的演講。
▲Cadence公(gong)司(si)驗證事業部產品工程總監孫曉陽
孫曉陽談及(ji)芯片設計流程存(cun)在的三個關鍵挑戰,并講解了Cadence的強大驗證產品套件,以及(ji)如何(he)引入AI算法,來應對(dui)日(ri)益(yi)高漲(zhang)的算力需求。
據孫曉陽分享(xiang),增強(qiang)機器學習能力的新Xcelium ML邏輯仿真平臺在落(luo)地(di)實(shi)例中,將完全(quan)隨(sui)機回歸運行(xing)的周轉時間縮短至原(yuan)(yuan)來的1/4,同(tong)時能夠(gou)達到原(yuan)(yuan)有功能覆蓋率99%。?
以下為孫曉陽演講實錄:
一、芯片設計難在何處?
在數據(ju)爆炸(zha)的時代,算(suan)力毫無疑問成為(wei)整個(ge)行業最具挑戰(zhan)或亟待解決的一個(ge)領域。
作為國際(ji)知名EDA及IP供應商,Cadence希望其產品及方(fang)案可以助(zhu)力大家在AI的海洋(yang)里面暢游。在此次峰會上,孫曉陽代表(biao)Cadence,分享了他們所(suo)觀察到的一些(xie)芯片設計挑(tiao)戰。
從(cong)底向(xiang)上來看,單一芯(xin)片(pian)的設計(ji)復(fu)(fu)雜(za)度(du)非常高,AI芯(xin)片(pian)同(tong)樣如此,有模擬、數(shu)字(zi)和混(hun)合信號,有先進(jin)工藝節點,及數(shu)十億門芯(xin)片(pian)的實現與驗證(zheng),這些都給芯(xin)片(pian)設計(ji)帶(dai)來復(fu)(fu)雜(za)度(du)。
因此,芯(xin)片設計(ji)者(zhe)不僅需考(kao)慮(lv)單一(yi)芯(xin)片的(de)設計(ji),還要考(kao)慮(lv)芯(xin)片周(zhou)邊整個系統(tong)的(de)設計(ji),包括電磁和(he)熱(re)分析,加上驅動(dong)程序、操作系統(tong)和(he)應用性能,整體(ti)來看整個系統(tong)的(de)性能。
在(zai)這之(zhi)上,還要考慮運行在(zai)系統(tong)中心或者系統(tong)上的智能應(ying)用,包(bao)括學習、感知算(suan)法、定制化的用戶體驗(yan),以及針對應(ying)用工(gong)作負載的計算(suan)優化等。
基于(yu)這些認知,Cadence著力(li)于(yu)提升所有產品線(xian)從芯(xin)片設(she)計(ji)到(dao)智(zhi)能應用(yong)的(de)所有算力(li),不再是(shi)單點或者局部地去(qu)看待芯(xin)片設(she)計(ji)本身,除了(le)芯(xin)片的(de)設(she)計(ji)、封裝等(deng)事情外,還考慮到(dao)系統(tong)的(de)設(she)計(ji),考慮到(dao)用(yong)戶(hu)可能存在的(de)算法(fa)需求、軟硬件(jian)協(xie)同需求等(deng)問(wen)題,并在引入(ru)AI算法(fa),與客戶(hu)一起應對(dui)挑戰。
孫曉陽(yang)來(lai)自Cadence系統設計和驗證(zheng)(zheng)產品線(xian),因此在(zai)演講(jiang)中,他更多分享了(le)關于系統仿真和驗證(zheng)(zheng)相關的(de)產品和解決方(fang)案。
如圖是一個(ge)芯(xin)片設計的(de)典型周期(qi),造出(chu)一顆芯(xin)片往往需(xu)要兩(liang)三年的(de)時(shi)間,當然(ran)不全是設計的(de)緣故,比如需(xu)花一些(xie)時(shi)間做架構的(de)探索和定義等。從圖中可以看到(dao),軟件起(qi)到(dao)很大的(de)作(zuo)用,尤(you)其在(zai)AI芯(xin)片的(de)設計領域,由軟件驅動一個(ge)芯(xin)片的(de)設計正(zheng)變得越來越重(zhong)要。
這是(shi)因(yin)為,很多AI結(jie)構具有(you)重復性、通(tong)用性的(de)特(te)征,上面跑的(de)軟件及PPA表(biao)現,是(shi)芯片(pian)設(she)計成(cheng)功(gong)的(de)關鍵(jian)。因(yin)此軟件越(yue)早介入,越(yue)能夠保證最后(hou)出來(lai)的(de)芯片(pian)是(shi)成(cheng)功(gong)的(de)。
我(wo)們看(kan)到,也(ye)許在有RTL、有代(dai)碼之(zhi)前,可(ke)能要先做模(mo)型(xing),從全(quan)部(bu)或(huo)部(bu)分的模(mo)型(xing)開始,在上面(mian)運行各(ge)種各(ge)樣的軟(ruan)件,去(qu)評估架構(gou),評估通(tong)路、帶寬、存儲等各(ge)類參(can)數(shu),來達到最好的平衡(heng)。
Cadence有虛擬的(de)(de)平臺來支撐各種模型(xing)(xing)的(de)(de)仿(fang)真(zhen),有各種RTL+部分模型(xing)(xing)的(de)(de)仿(fang)真(zhen),有非常知(zhi)名的(de)(de)Palladium硬件仿(fang)真(zhen)加(jia)速平臺,還有基于FPGA的(de)(de)原型(xing)(xing)驗證平臺Protium X1,能(neng)運行對性能(neng)、功(gong)耗、功(gong)能(neng)等(deng)各方面的(de)(de)驗證評估。
二、破解芯片設計驗證挑戰的三大平臺
今天在(zai)中國,人(ren)們享受到(dao)了物流帶來的便(bian)利性,可以(yi)看到(dao)在(zai)城市中,有(you)(you)貨車(che)、卡車(che)、飛機(ji)在(zai)城市群周邊做物流快遞。其中前兩者裝卸(xie)相(xiang)對容易,但跑得慢;飛機(ji)跑得最快,但裝卸(xie)流程相(xiang)對復雜。這里有(you)(you)一個概(gai)念,引(yin)擎(qing)(qing)越快,就要做更(geng)多準備(bei)工作(zuo)來使(shi)能(neng)引(yin)擎(qing)(qing),以(yi)實現更(geng)好的性能(neng)。
類似的,Cadence提供有并(bing)行邏(luo)輯仿真平臺Xcelium、硬件仿真加速平臺Palladium、基于FPGA的原型(xing)驗證平臺Protium等。Xcelium跑(pao)在(zai)100Hz水平,Palladium跑(pao)在(zai)1MHz,而Protium能跑(pao)在(zai)5MHz。
因為性能不同,應用(yong)場景也不一樣,Xcelium主要(yao)做(zuo)IP的仿(fang)真(zhen)評估,Palladium面向(xiang)SoC芯片(pian)的仿(fang)真(zhen)驗證,Protium則可以使能完整系統的開發(fa)調試。
Xcelium相比上一(yi)代有很大(da)的(de)性能提(ti)升(sheng),Cadence在產(chan)品中大(da)量使用AI算法來加速性能,包括分布式(shi)計算。“可以(yi)看到,我們(men)一(yi)邊(bian)面(mian)臨AI應用帶來的(de)挑戰,一(yi)邊(bian)也在使用AI算法來提(ti)升(sheng)算力。”孫曉陽說(shuo)。
Xcelium最新發布的(de)AI-機器學習(xi)賦能(neng)技術,可(ke)以讓(rang)驗證的(de)吞吐力得到提升(sheng),能(neng)使覆(fu)蓋(gai)率(lv)收斂更快,可(ke)達(da)到5倍的(de)速度(du)提升(sheng)。例(li)如在一家芯片公司應用最新的(de)Xcelium ML平(ping)臺的(de)案例(li)中(zhong),將完全(quan)隨機回歸運行中(zhong)的(de)周轉時間速度(du)提升(sheng)4倍,達(da)到原來(lai)產品99%的(de)功能(neng)覆(fu)蓋(gai)率(lv)。
其原理如(ru)上圖所(suo)示,跑整個(ge)覆(fu)蓋(gai)率回歸是一(yi)樣的(de)(de)(de)(de),有(you)上千條、上萬條的(de)(de)(de)(de)case放(fang)到計(ji)算(suan)中(zhong)心上運(yun)行(xing),花(hua)這(zhe)么多的(de)(de)(de)(de)時(shi)間(jian)才可以結束,在這(zhe)個(ge)過程當(dang)中(zhong),機(ji)器學習(xi)算(suan)法就(jiu)可以去學習(xi)case和覆(fu)蓋(gai)率之間(jian)的(de)(de)(de)(de)關系,從而(er)創建一(yi)個(ge)模型,并產(chan)生更高效的(de)(de)(de)(de)測試(shi)集和相應的(de)(de)(de)(de)隨機(ji)化(hua)參數(shu),就(jiu)能在更短的(de)(de)(de)(de)時(shi)間(jian)(比如(ru)1/4、1/5的(de)(de)(de)(de)時(shi)間(jian)),達到相當(dang)的(de)(de)(de)(de)覆(fu)蓋(gai)率,從而(er)縮短驗證時(shi)間(jian)。
還有(you)(you)多核仿真,在仿真回歸中(zhong),一定有(you)(you)一些需要花很長時間(jian)才(cai)能做完的case,針(zhen)對這些case,如(ru)果有(you)(you)足(zu)夠的算(suan)力,用分(fen)布式的計算(suan)方式,就能縮(suo)短整個驗證(zheng)回歸時間(jian)。
Palladium是業界的(de)明星產品,主要用作(zuo)仿真加速(su),Palladium是基于(yu)Cadence自研(yan)CPU做(zuo)出來的(de)平(ping)(ping)臺(tai),Protium是基于(yu)賽靈思(si)的(de)FPGA做(zuo)出來的(de)平(ping)(ping)臺(tai)。正如剛(gang)才提到的(de),要應用更(geng)快的(de)引擎(qing),勢必做(zuo)一(yi)些準備(bei)工作(zuo)。這個(ge)準備(bei)工作(zuo)對(dui)用戶來講(jiang)是一(yi)筆(bi)開(kai)銷(xiao),怎么減少這筆(bi)開(kai)銷(xiao)呢?Palladium和Protium用的(de)是完全統(tong)一(yi)的(de)前(qian)端編(bian)譯系統(tong)、編(bian)譯流程,這致(zhi)使一(yi)個(ge)設(she)計在Palladium跑起來后,要將它移植到Protium上就會非常簡單(dan)。
孫曉陽現場給(gei)大家一個參考,有(you)些AI公司在40億門左右,系統廠商在140億門左右,或(huo)者其(qi)它(ta)超大型公司有(you)30億門左右,在Palladium和(he)Protium是這樣的比例。
他也(ye)再次強調軟件(jian)(jian)驅動的重要性,軟件(jian)(jian)越早介入,就能(neng)讓(rang)芯片或整個開(kai)發周期(qi)縮短,一開(kai)始用全部虛(xu)擬的平臺,有模型就可以開(kai)始做(zuo)很多開(kai)發和評估。
最近很多AI、GPU公(gong)司都(dou)遇(yu)到這樣的需求,它(ta)的主(zhu)力(li)可能(neng)是做(zuo)GPU或(huo)AI算(suan)法相關IP,而(er)不是CPU、互連等技(ji)術。于(yu)是在開(kai)始確(que)定一些架構的時候,它(ta)們可以拿Cadence的虛(xu)擬平(ping)臺來(lai)建立一個虛(xu)擬CPU、真實(shi)的GPU或(huo)AI IP,然后就能(neng)去做(zuo)開(kai)發和評估。
因(yin)此(ci)全套軟件可(ke)(ke)以(yi)貫穿從(cong)虛擬到部(bu)分(fen)IP芯片的(de)混合(he)動力仿真(zhen)到整(zheng)個(ge)芯片回(hui)來的(de)整(zheng)個(ge)流程(cheng)。很多(duo)客戶已經有(you)部(bu)署(shu)這個(ge)方法學(xue)流程(cheng),比如(ru)博世(shi)主要關心它(ta)的(de)IP,很早就可(ke)(ke)以(yi)介入(ru)軟件開發;再比如(ru)英(ying)偉達做(zuo)的(de)是大(da)型的(de)系(xi)統,當Cadence把(ba)CPU從(cong)RTL中搬(ban)出(chu)來后,性(xing)能(neng)可(ke)(ke)以(yi)得到更(geng)大(da)的(de)提升。
三、EDA是關鍵性少數
接著,孫曉陽談(tan)到(dao)AI芯(xin)片(pian)的(de)(de)幾(ji)個關(guan)鍵點,包括(kuo)存(cun)儲、互聯及一些(xie)相(xiang)關(guan)IP。Cadence在這(zhe)些(xie)先進制程領(ling)域,IP追得非常緊,包括(kuo)內存(cun)、DDR、HBM等都(dou)緊追最新標準。除了有IP,大家還有驗(yan)證IP產品VIP,Cadence在驗(yan)證方面也會(hui)有相(xiang)應的(de)(de)解決方案(an),今年已追到(dao)像PCIe6這(zhe)樣的(de)(de)標準。
芯片做功能(neng)驗(yan)證,還(huan)(huan)要追求PPA的指標等事情。在SoC系統(tong)上,除了用Cadence的IP之外,也可(ke)以用Cadence System VIP產品(pin)去模(mo)擬整個數據流,從(cong)而(er)幫助實現很多系統(tong)級分析,還(huan)(huan)能(neng)自動生(sheng)成test bench,來降低人(ren)工(gong)的時間。
Cadence還(huan)有其它的(de)(de)產品、驗(yan)證和設計的(de)(de)管(guan)理(li),比如有企業級的(de)(de)驗(yan)證管(guan)理(li)方案(an),從計劃到實(shi)施到最后的(de)(de)覆蓋率,能滿足跨地域團隊驗(yan)證的(de)(de)流(liu)程;還(huan)有調(diao)試(shi),在整(zheng)個驗(yan)證的(de)(de)cycle里面(mian),調(diao)試(shi)約占70%的(de)(de)時間,因此調(diao)試(shi)工具毫無疑問是最重要的(de)(de),新的(de)(de)Indago Debug平(ping)臺可以(yi)提升調(diao)試(shi)的(de)(de)效(xiao)率,并且有開(kai)放的(de)(de)接口,性能也在持(chi)續提升。
在演講(jiang)(jiang)末(mo)尾,孫(sun)曉陽(yang)總結說(shuo),此(ci)次(ci)演講(jiang)(jiang)主旨(zhi)很(hen)契(qi)合當下的(de)新基(ji)建,過去二三十年間,中國持(chi)續做高(gao)(gao)(gao)速(su)公路的(de)建設、高(gao)(gao)(gao)鐵的(de)建設,是(shi)今天快速(su)物流(liu)的(de)前提。而Cadence相當于(yu)在做基(ji)建的(de)工(gong)作,提供快速(su)的(de)計算平(ping)臺,讓各位的(de)計算訴求在計算平(ping)臺上跑得更快。今天的(de)新基(ji)建是(shi)另外一(yi)種(zhong),它(ta)不是(shi)鋼筋水泥,而是(shi)數據(ju)中心、絕(jue)對(dui)算力(li)、AI芯(xin)片這樣的(de)更高(gao)(gao)(gao)級的(de)東西。這些邏輯(ji)是(shi)一(yi)脈相承(cheng)的(de)。
Cadence采用了(le)大量的算法(fa)來(lai)持(chi)續提升這些引(yin)擎的計算能力。孫曉(xiao)陽主要代(dai)表Cadence的系(xi)統設計和(he)驗(yan)證團隊,但其產品線遠不止(zhi)于(yu)驗(yan)證部分,還有(you)時(shi)限(xian)、布線、系(xi)統分析(xi)等很多其它(ta)產品線。Cadence持(chi)續打造“Intelligent System Design”的全(quan)流程解(jie)決方案(an),更好(hao)地服務于(yu)客戶。
最(zui)后(hou),他(ta)提(ti)到20年前(qian)剛(gang)進入EDA行業時(shi),一位前(qian)輩曾(ceng)跟(gen)他(ta)講過的話:“EDA是(shi)關鍵性少數。”
就算是兩年前,鮮(xian)少(shao)有大(da)眾能(neng)夠理(li)解EDA是什么,而(er)今天大(da)家都在談EDA,其“關鍵性”毋庸置(zhi)疑。
但是(shi)少(shao)數(shu)(shu)還(huan)沒有變(bian)成多數(shu)(shu),孫曉(xiao)陽非常(chang)高興(xing)看(kan)到這么多人(ren)(ren)做AI芯片,希(xi)望有更多的人(ren)(ren)投身EDA行(xing)業,使其變(bian)成關鍵性(xing)的多數(shu)(shu),帶來(lai)更快的進步。
以上是孫曉陽演講內容的完整整理。除了孫曉陽外,在本屆GTIC 2020 AI芯片創新峰會期間,清華大學微納電子系尹首一教授,比特大陸、地平線、燧原科技、黑芝麻智能、壁仞科技、光子算數、知存科技、億智電子、豪微科技等芯片創企,Imagination、安謀中國等知名IP供應商,以及北極光創投、中芯聚源等知名投資機構,分別分享了對AI芯片產業的觀察與思考。如感興趣更多嘉賓演講的核心干貨,歡迎關注芯東西后續推送內容。