芯東西(公眾號:aichip001)
編輯 | ?GTIC

芯(xin)(xin)東西9月6日報道,在剛剛落幕的(de)GTIC 2022全球AI芯(xin)(xin)片峰會(hui)期間,芯(xin)(xin)行紀資(zi)深研發副總裁(cai)丁渭濱以(yi)《構建(jian)新一代數字實現EDA平臺》為主題發表演講。

新一代EDA產品通(tong)過應用AI技術(shu)優化客戶體驗、提升效能是(shi)全自(zi)動芯片設計迭代的(de)一個重要方向。在數(shu)字實現EDA環節,有許多關鍵的(de)子問題可(ke)以(yi)得益于豐富的(de)AI模型算(suan)法(fa),包括提升布局(ju)規(gui)劃的(de)效率(lv)和質量、通(tong)過機(ji)器(qi)學習(xi)解決(jue)EM-IR和時序之間的(de)相互影響來(lai)優化PPA(性能、功耗(hao)和面積(ji))、路徑分(fen)類、擁塞(sai)位置預(yu)測(ce)等(deng)。

丁渭濱(bin)認為,AI賦能(neng)(neng)的(de)EDA產品能(neng)(neng)大(da)幅度提升(sheng)芯(xin)片設計效率,提高性(xing)能(neng)(neng)和EDA可用(yong)性(xing)。他(ta)還(huan)分享了芯(xin)行紀引入AI技(ji)術來構(gou)建數字(zi)實現EDA平臺方面(mian)的(de)進展和初步成(cheng)果(guo)。

以下為丁渭濱的演講實錄:

大家下午好。芯行紀是(shi)一家數字(zi)實現EDA公(gong)司,我們專注于(yu)自主研(yan)發數字(zi)實現EDA產品和提供高端設(she)計服務,幫助芯片設(she)計企業(ye)更高效便利(li)地開(kai)展設(she)計工(gong)作。

一、挑戰最難賽道,國產EDA新勢力涌現

數(shu)字實現EDA領域的布(bu)局布(bu)線部分,是(shi)EDA領域中研發(fa)難度(du)最(zui)大、同時也是(shi)市(shi)場價值最(zui)高的產品之一,只有極(ji)少數(shu)國際廠商擁有這(zhe)方面的技術。

那為什(shen)么芯行紀敢(gan)于去(qu)做(zuo)這個領域(yu)的(de)產(chan)品(pin),并(bing)且要做(zuo)新一代的(de)數(shu)字實現EDA產(chan)品(pin)?

第一,從時代大背景來看,目前全(quan)球科技(ji)領域的合作(zuo)和分工正(zheng)在急劇變化,現在可能沒辦法(fa)像之前一樣互相協(xie)同共創,這也就是為(wei)什么我們需(xu)要自(zi)主研發。隨(sui)著近幾年來涌現的EDA方(fang)面的內(nei)部(bu)創新,大家分別開(kai)始在不(bu)同的方(fang)向努(nu)力。

芯行紀具(ju)備(bei)了一(yi)支非常(chang)專(zhuan)業的團(tuan)隊,集聚了目前在數字實現方面(mian)具(ju)有(you)非常(chang)全面(mian)的產(chan)品研發(fa)經驗的先(xian)進專(zhuan)家,這(zhe)幾十位“行業老兵”具(ju)備(bei)超過15年(nian)的國際(ji)EDA廠商從業經驗。我們希望(wang)憑借(jie)這(zhe)支優秀的團(tuan)隊,在數字芯片領域貢獻一(yi)份力(li)量。

第二(er),目前中國(guo)集成電(dian)路設計的(de)(de)人才(cai)缺口非常大,而其中要培養一個(ge)后端工程師尤其不容(rong)易。布局布線工具(ju)是一個(ge)非常龐(pang)大的(de)(de)系統,它里面的(de)(de)步驟(zou)數量繁多,每個(ge)步驟(zou)里用(yong)人工控(kong)制的(de)(de)開關數量可(ke)(ke)以(yi)(yi)達(da)到幾(ji)百個(ge),這(zhe)些開關之(zhi)間(jian)還可(ke)(ke)以(yi)(yi)互相組合(he),以(yi)(yi)致(zhi)于數量更加無限(xian)大。

而(er)后端(duan)工(gong)程師(shi)除了要(yao)(yao)理(li)解設計本身還(huan)需要(yao)(yao)花大量時間(jian)來學習如何(he)應用(yong)軟(ruan)件(jian),因此一個富有經驗的后端(duan)設計專(zhuan)家,在市(shi)場上實際是不多的。

高(gao)度自動(dong)(dong)化的(de)(de)工(gong)具,在某些環節(jie)可以節(jie)省(sheng)大量(liang)的(de)(de)人力。從這個角度來看,將(jiang)工(gong)具朝自動(dong)(dong)化乃至智能化方(fang)向提升,一(yi)定(ding)程度上(shang)可以緩解人才缺口。

另一方面,目前算(suan)力(li)(li)正在(zai)不斷提升。當現在(zai)要架構一個新(xin)的軟件(jian),你可以用的算(suan)力(li)(li)、計算(suan)資源(yuan)和十(shi)多年前相(xiang)比,存在(zai)天(tian)翻地覆(fu)的不同(tong)。

早年前(qian)能用到的(de)(de)(de)(de)(de)算力無非是(shi)一(yi)臺(tai)機(ji)(ji)器里的(de)(de)(de)(de)(de)多個(ge)CPU核(he),甚至多個(ge)CPU核(he)在(zai)當時未(wei)必流(liu)行,而現(xian)在(zai)的(de)(de)(de)(de)(de)計算機(ji)(ji)本身的(de)(de)(de)(de)(de)性能提(ti)高非常多,網絡之(zhi)(zhi)間的(de)(de)(de)(de)(de)帶寬也(ye)提(ti)升很高,使得多機(ji)(ji)之(zhi)(zhi)間的(de)(de)(de)(de)(de)協(xie)同、并行計算、云計算可能同時存在(zai),傳輸數(shu)據的(de)(de)(de)(de)(de)延遲度大大改善。

現如今(jin)存在(zai)各式(shi)各樣(yang)(yang)的(de)(de)專(zhuan)門類別的(de)(de)計(ji)算芯(xin)片,對于一些特殊算法,可以(yi)通過不同的(de)(de)GPU核或其他(ta)IP核,實現指數(shu)級的(de)(de)性(xing)能提升(sheng),這些核的(de)(de)出現同樣(yang)(yang)帶(dai)來了不一樣(yang)(yang)的(de)(de)機遇(yu)。

當你重新(xin)思考(kao)(kao)要做一(yi)個(ge)(ge)布局布線工具(ju)的(de)時(shi)候,你能夠用到的(de)算(suan)力和思考(kao)(kao)的(de)角(jiao)度就會(hui)發生變化,此時(shi)你就不會(hui)想著做一(yi)個(ge)(ge)工具(ju)只(zhi)在一(yi)臺單機上跑,而是跳(tiao)出(chu)這(zhe)個(ge)(ge)框,思考(kao)(kao)更多可(ke)能性。

二、AIEDA領域的兩大類應用:預測性能,讓工具更好用

回到(dao)(dao)AI這個話(hua)題(ti),AI目(mu)前在很多(duo)行(xing)業(ye)已經得到(dao)(dao)了一定的落地(di),而在EDA領域,利(li)用AI技術改(gai)變現有的EDA工具的形態,其實已經在發生。

目(mu)前AI在EDA工具(ju)中的(de)應(ying)用(yong)(yong)主要有兩大類。第(di)(di)一類是(shi)(shi)用(yong)(yong)AI來預測性能,第(di)(di)二(er)類是(shi)(shi)借助AI算(suan)法幫助EDA工具(ju)在使用(yong)(yong)上更加(jia)自(zi)動化。

芯行紀丁渭濱:用AI改造EDA最難賽道,極大提高芯片設計生產力

在(zai)用(yong)AI預測性(xing)能(neng)(neng)方(fang)面,因為(wei)后端設計(ji)的(de)(de)流程很長,在(zai)每個階段看到的(de)(de)性(xing)能(neng)(neng)會局限在(zai)當前(qian)階段,當下性(xing)能(neng)(neng)表現并不能(neng)(neng)說明后面環節的(de)(de)性(xing)能(neng)(neng)一定好(hao),所以如(ru)果(guo)你希望優化結(jie)果(guo)真(zhen)正準確,最好(hao)是在(zai)當前(qian)階段就(jiu)能(neng)(neng)預見(jian)到后面環節的(de)(de)結(jie)果(guo),如(ru)果(guo)實現這一步,優化的(de)(de)結(jie)果(guo)和效率就(jiu)比(bi)較(jiao)高(gao)。

這一(yi)點其實已經得到(dao)實踐,在時序、功耗甚至(zhi)設(she)計(ji)任務方面,頂尖的國際EDA廠商已經把大量步驟轉成非傳(chuan)統的啟發式方式,通過訓練(lian)和學習(xi)后(hou),可(ke)以(yi)在前面的階段預測(ce)后(hou)面的時序和功耗的變化,這樣會得到(dao)比較顯著的提(ti)升效果,比如性能、功耗和面積可(ke)以(yi)改(gai)善5-10%,這是個不(bu)小的數(shu)字。

簡單來說,當一個(ge)(ge)CPU芯片,頻率從原來的2G赫茲提升到(dao)2.2G赫茲,這已經是(shi)一個(ge)(ge)非常大的突破。如果你拿這個(ge)(ge)產品(pin)(pin)和同質(zhi)性產品(pin)(pin)相(xiang)比,能做到(dao)改(gai)善(shan)10%,你就能占領更多的市(shi)場份額(e)。

當然以(yi)這(zhe)樣的方式走下去,還存在一(yi)定的局限性,但(dan)并不(bu)(bu)是出在AI算法本身,而是在EDA領域我們面(mian)對的數據是特殊(shu)的,不(bu)(bu)像一(yi)般的圖像識(shi)別、語音識(shi)別這(zhe)樣資料本身可以(yi)較(jiao)容易地獲取、分享和測試。

EDA領域(yu)的數據(ju)都是(shi)客(ke)戶專有數據(ju),處理方式也(ye)保密,不(bu)同公(gong)司之間存(cun)在屏障,數據(ju)不(bu)能(neng)互(hu)通分享,所以很(hen)難(nan)綜(zong)合大量數據(ju)訓練出(chu)更好的模型并繼(ji)續提升。如何(he)利用(yong)已經(jing)設(she)計出(chu)的芯片,幫助EDA工具更加“聰明”,我想這個還有待繼(ji)續探討。

在借助(zhu)AI算法(fa)幫助(zhu)EDA工(gong)(gong)具更自動化(hua)方面,我(wo)們(men)已知當前(qian)的(de)EDA工(gong)(gong)具比較難用(yong),一(yi)個后端工(gong)(gong)程師的(de)工(gong)(gong)作量有限,但(dan)即使(shi)是拿著工(gong)(gong)具反復跑一(yi)百次,也無法(fa)將智(zhi)能性(xing)帶到工(gong)(gong)具中。

其實理(li)論上(shang)來說(shuo),當(dang)一個設(she)計在反復(fu)跑數(shu)據(ju)時(shi),能(neng)夠看到哪(na)(na)些(xie)參(can)數(shu)對應(ying)哪(na)(na)些(xie)性能(neng),看出參(can)數(shu)對應(ying)的(de)好(hao)壞情況,這(zhe)意味著當(dang)嘗試新的(de)設(she)計時(shi),在一定頻率(lv)、功耗的(de)程度范(fan)圍內(nei),工具(ju)可以基于既(ji)有經(jing)驗幫助(zhu)做(zuo)參(can)數(shu)推薦。

大家可以仔細想一(yi)(yi)想,如果(guo)我把(ba)這件(jian)事(shi)一(yi)(yi)直往前推到極致,其實就已經實現(xian)無人設(she)計,也就是當重復跑完100次(ci),到了101次(ci)想要做一(yi)(yi)些小修改,需要重新(xin)跑流程時,工具可以自動(dong)推薦(jian)參數,給出在期待(dai)和合(he)理范(fan)圍內的結果(guo)。

現(xian)(xian)在(zai)有國(guo)際EDA廠商已經(jing)在(zai)這方面走得較(jiao)遠,在(zai)一定(ding)程度上可(ke)實現(xian)(xian)技術的落地,輸(shu)出比(bi)人工調(diao)參更好的結果。

再往(wang)后(hou)發展,很有可(ke)能出現類似跑(pao)工具的(de)(de)機器(qi)(qi)人,然后(hou)變成當大家(jia)在購買工具時,還需要同(tong)時買機器(qi)(qi)人,而(er)且是(shi)從幾家(jia)公司同(tong)時購買,最后(hou)變成幾個來自不(bu)同(tong)EDA廠商的(de)(de)機器(qi)(qi)人協(xie)同(tong)設計(ji)同(tong)一(yi)個芯片(pian),我認為這樣的(de)(de)可(ke)能性是(shi)存在的(de)(de)。

畢竟現在人力成(cheng)本高(gao)昂,當用大(da)量(liang)的機器取(qu)代人力時,能幫助整個公司提(ti)高(gao)效率、節約成(cheng)本。

三、智能布局規劃:國內首創用AI做擁塞預測,極大節省設計工作量

接下來想(xiang)要和大家分享,芯行(xing)紀通過(guo)一年多時(shi)間的努力做出的成果——智能布局規劃工具AmazeFP。

芯行紀丁渭濱:用AI改造EDA最難賽道,極大提高芯片設計生產力

在(zai)(zai)后端設(she)計中,有一(yi)個步驟相對(dui)而言還沒有比較自動化,就(jiu)是開(kai)局(ju)做布(bu)局(ju)規劃(hua)的(de)時候(hou),這個時候(hou)同時存(cun)在(zai)(zai)很(hen)多(duo)(duo)宏(hong)(hong)單元(yuan)和(he)標(biao)準單元(yuan)。標(biao)準單元(yuan)的(de)大小和(he)形狀(zhuang)(zhuang)比較規整,此(ci)時比較容(rong)易用算法(fa)來(lai)自動擺放(fang),同時因(yin)為它的(de)數量(liang)相對(dui)很(hen)多(duo)(duo),達到幾百萬(wan)個,目(mu)前也(ye)不太會有工程師手(shou)動擺放(fang)。宏(hong)(hong)單元(yuan)不同于(yu)標(biao)準單元(yuan),宏(hong)(hong)單元(yuan)的(de)大小形狀(zhuang)(zhuang)各(ge)異,從目(mu)前的(de)設(she)計復雜度來(lai)看,因(yin)為存(cun)在(zai)(zai)各(ge)種IP,宏(hong)(hong)單元(yuan)的(de)個數比以(yi)前多(duo)(duo)很(hen)多(duo)(duo)。

目前宏單元的擺(bai)(bai)放主要(yao)靠工(gong)程師(shi)手動擺(bai)(bai),有(you)經(jing)驗的工(gong)程師(shi)可(ke)(ke)能對設計(ji)比較(jiao)熟悉就能擺(bai)(bai)得(de)更好(hao),他可(ke)(ke)能更清楚哪些(xie)宏單元之間溝通較(jiao)多(duo),可(ke)(ke)以(yi)根據數據流和已有(you)經(jing)驗進行操(cao)作。

但這(zhe)樣(yang)也有缺點(dian),首先是當宏(hong)(hong)單元(yuan)(yuan)(yuan)個數很多時(shi),人工擺放(fang)需要耗費大量(liang)時(shi)間(jian),當存在(zai)成百上千個宏(hong)(hong)單元(yuan)(yuan)(yuan)時(shi),想要手動(dong)擺出相對較(jiao)好的(de)結果其實并不容易(yi)。另外,不僅(jin)宏(hong)(hong)單元(yuan)(yuan)(yuan)與(yu)宏(hong)(hong)單元(yuan)(yuan)(yuan)之間(jian)有聯系,宏(hong)(hong)單元(yuan)(yuan)(yuan)與(yu)標準單元(yuan)(yuan)(yuan)也有聯系,擺放(fang)時(shi)不能(neng)只顧(gu)兩(liang)個宏(hong)(hong)單元(yuan)(yuan)(yuan),可(ke)(ke)是一旦要考慮(lv)宏(hong)(hong)單元(yuan)(yuan)(yuan)與(yu)標準單元(yuan)(yuan)(yuan)的(de)聯系,可(ke)(ke)能(neng)就(jiu)顧(gu)不過來(lai)了(le)。

人工擺放有一個優勢是會(hui)放得比較(jiao)規矩(ju),但如果同時處理宏單(dan)元(yuan)和標(biao)準單(dan)元(yuan),因為二(er)者存在(zai)的(de)大小差(cha)異巨大,要實現某種程度上平(ping)衡的(de)結果,存在(zai)較(jiao)高的(de)技術門(men)檻(jian)。總體而言(yan),從人工和工具擺放的(de)效(xiao)果來(lai)看(kan),人工應(ying)該比不過工具擺放的(de)效(xiao)果。

全世界只有極個別國(guo)際EDA廠(chang)商可(ke)以做(zuo)到同時捆(kun)綁(bang)考慮(lv)宏(hong)單元和標準單元,芯行紀通過自主研發,目前已經實現(xian)了這(zhe)一點。

產品(pin)的第二個特點是,我們首(shou)創性(xing)地(di)將擁塞預測通過機器學習的方(fang)式實(shi)現。

當前期(qi)布局單元時,有一個(ge)重要的任務是要確保后期(qi)芯片可(ke)繞通,否則就需要回頭(tou)重做。

以前評估擁(yong)(yong)塞模(mo)型(xing)時(shi),大家往往采用一種比較(jiao)粗糙的方式去評估,現在隨著工藝的進步,問題變得復雜,特別是到(dao)7nm或(huo)5nm以下,擁(yong)(yong)塞的評估一般不(bu)會體(ti)現在全局,很有可(ke)能(neng)出現在局部,用以前那(nei)些做法可(ke)能(neng)就看(kan)不(bu)到(dao)擁(yong)(yong)塞。

此時(shi)機器學(xue)習就變成了一個(ge)選(xuan)項,當算(suan)法學(xue)習過大量的制程上的版(ban)圖(tu)模型后,就能夠(gou)判(pan)斷哪些位(wei)置會(hui)有(you)影響。

為什么大多(duo)數國(guo)際(ji)EDA廠(chang)商沒有把擁塞的(de)預測模型(xing)放入布局呢?這里有一(yi)個重要的(de)原(yuan)因。以前用啟發式(shi)(shi)的(de)方式(shi)(shi)去(qu)做,雖然不(bu)準,但(dan)是很(hen)(hen)穩定。如果(guo)變成機器學習(xi)模型(xing),就會(hui)發生(sheng)一(yi)些隨(sui)機事(shi)件(jian),結果(guo)不(bu)夠穩定,也很(hen)(hen)難去(qu)控制。

而(er)芯行紀通(tong)過大(da)量的(de)艱苦(ku)工作,能夠用一(yi)些獨(du)特技術,控制這個模型在某種(zhong)范(fan)圍(wei)內的(de)穩定(ding)性,而(er)它犧牲(sheng)掉的(de)準(zhun)度在可以接受的(de)范(fan)圍(wei)內。基(ji)于(yu)這一(yi)前提,我(wo)們才能夠把這項獨(du)有的(de)機器學習(xi)擁塞模型放入我(wo)們的(de)布局引擎,實現突破。

第(di)三(san)個(ge)特點是(shi)宏單元自動(dong)整理(li)對齊(qi),該功(gong)能是(shi)擬人(ren)化的(human-like)。

當傳(chuan)統(tong)工具在做一個布局規(gui)劃時,不一定非(fei)常整齊(qi),它會考(kao)慮時序、功耗(hao)等各方(fang)面因素,將宏(hong)單元或(huo)標準(zhun)單元放在推薦的位置,但(dan)(dan)是當人做設計時,會考(kao)慮哪些單元需要靠邊或(huo)者組合對(dui)齊(qi)更好,這一點在工具上很難(nan)通(tong)過傳(chuan)統(tong)算(suan)法實現,但(dan)(dan)是通(tong)過機(ji)器學(xue)習(xi)可以(yi)做到。機(ji)器學(xue)習(xi)是一種模式計算(suan),可以(yi)實現版圖(tu)模型(pattern)的匹(pi)配和(he)學(xue)習(xi)。

芯行紀丁渭濱:用AI改造EDA最難賽道,極大提高芯片設計生產力

從我(wo)(wo)(wo)們的案例(li)中可(ke)以(yi)看到,人工擺(bai)放的結(jie)果很整齊(qi),而我(wo)(wo)(wo)們工具擺(bai)放的結(jie)果也很整齊(qi),我(wo)(wo)(wo)們的工具會自(zi)動將一(yi)些單元推到邊上,空出留白區域,同時保持比(bi)較好的PPA,這可(ke)以(yi)極(ji)大節省設計的工作量。

當(dang)某(mou)一個案例的(de)布局(ju)規劃工作(zuo)時(shi)間(jian)從以(yi)周為記(ji)縮短至(zhi)以(yi)小時(shi)為記(ji),生產力將成倍(bei)提高,釋放更多人力用于其(qi)他工作(zuo)。

這(zhe)就是我們芯行(xing)紀近期推出(chu)的(de)第一(yi)款智能布局(ju)規劃工具(ju)AmazeFP,目前我們正密(mi)切與(yu)一(yi)些(xie)客(ke)戶在合作(zuo),我們希望這(zhe)一(yi)工具(ju)能夠幫助到他們的(de)項目。

當然(ran),AmazeFP只(zhi)是我們的(de)一(yi)個開始,芯行(xing)紀(ji)的(de)目標是基于3S產品(pin)理念(Smart、Speedy、Simple)構建新(xin)一(yi)代數字實現(xian)EDA平臺,后期我們全體同仁(ren)還將推出更(geng)多易用、智能(neng)、快速高效的(de)工具。我們也希(xi)望攜手(shou)更(geng)多合作伙伴,用我們的(de)EDA產品(pin)助力芯片設計企業實現(xian)更(geng)多的(de)產品(pin)成(cheng)功,謝(xie)謝(xie)大(da)家。

以上是丁渭濱演講內容的完整整理。