
芯東西(公眾號:aichip001)
作者 | ?GTIC峰會
芯(xin)(xin)東西8月27日報道,今日,GTIC 2022全球(qiu)AI芯(xin)(xin)片(pian)(pian)峰會在深圳(zhen)市南山區圓滿落幕。會上(shang),2022「中國AI芯(xin)(xin)片(pian)(pian)企業50強」榜單正式(shi)揭曉。
▲智(zhi)一科(ke)技聯合創(chuang)始(shi)人、總編輯張國仁(ren)揭(jie)曉榜(bang)單
這場(chang)高規(gui)格產業(ye)會議,由芯(xin)東(dong)西(xi)與智東(dong)西(xi)公(gong)開課聯合主(zhu)辦,以“不負芯(xin)光(guang) 智算未(wei)來”為主(zhu)題(ti),匯集了來自AI芯(xin)片領域的產學研投專家及創(chuang)業(ye)先(xian)鋒代(dai)表,展示智能(neng)計算底(di)層創(chuang)新(xin)與落地(di)的最新(xin)光(guang)景。
兩天內,32位嘉賓通過主題演講和巔峰對話,分享了干貨滿載、深入淺出的行業見解。峰會全場座無虛席,全網直播人數累計高達220萬+人次。作為智一科技產(chan)(chan)業(ye)對接平臺GTIC落地深圳(zhen)的(de)首場產(chan)(chan)業(ye)峰會(hui),GTIC 2022全球AI芯片峰會(hui)得到了深圳(zhen)產(chan)(chan)業(ye)人(ren)士的(de)廣(guang)泛好評。
昨日(ri),我(wo)們整理了AI芯(xin)片高峰論壇和(he)云端AI芯(xin)片專題論壇的核(he)心看點。()
今天,精彩繼續!15位(wei)大牛分別出席邊緣(yuan)端AI芯(xin)片專(zhuan)題論壇、存算一體芯(xin)片專(zhuan)題論壇、新型計算技術專(zhuan)題論壇,暢談AI芯(xin)片創新路徑(jing),以及在(zai)加(jia)速落地商用過程(cheng)中積累的心得。
一、南科大余浩:“種草”低碳AI芯片,高精度與低功耗并存
南方(fang)科技大學深(shen)港微(wei)電子學院(yuan)創院(yuan)副院(yuan)長余(yu)浩(hao)教授(shou)在現場(chang)“種草”了低碳AI芯片。
我們(men)向往著讓機器來做計算,幫(bang)助我們(men)“躺平(ping)”,但(dan)就目前的(de)算力中心而言,其在功耗(hao)和效(xiao)率(lv)上都需(xu)要(yao)付出很(hen)大(da)代(dai)價,如(ru)電力、能源(yuan)的(de)消耗(hao)。因此(ci),在數字經濟、可持(chi)續經濟的(de)背景下,我們(men)需(xu)要(yao)一塊(kuai)高能效(xiao)的(de)低碳芯片。
▲南方科技大學深港微電子學院(yuan)創院(yuan)副院(yuan)長余浩教授(shou)
現有的(de)有效(xiao)解(jie)決途徑(jing)包括(kuo)并(bing)行的(de)GPU、脈動的(de)TPU,不過這些解(jie)法或(huo)多或(huo)少仍存在功(gong)耗高(gao)、能(neng)效(xiao)低的(de)問題。那么,如何在保證(zheng)精度(du)、降低功(gong)耗的(de)情況下訓練出多精度(du)、多復(fu)雜度(du)模型(xing)并(bing)實現高(gao)能(neng)效(xiao)的(de)硬件計算?
余(yu)浩教授團(tuan)隊的(de)做(zuo)法是通過(guo)網(wang)絡(luo)架構自(zi)動搜(sou)索(suo)設(she)計,對網(wang)絡(luo)進行(xing)(xing)逐層優化,得到高(gao)能(neng)效的(de)混合精(jing)度(du)神經網(wang)絡(luo);并(bing)在硬件(jian)層面,讓每個(ge)數(shu)據(ju)單元都支持多精(jing)度(du)并(bing)行(xing)(xing)處(chu)理,同時每個(ge)并(bing)行(xing)(xing)的(de)多精(jing)度(du)陣列又(you)可(ke)以進行(xing)(xing)數(shu)據(ju)復用,就可(ke)以高(gao)能(neng)效地運行(xing)(xing)多復雜度(du)的(de)網(wang)絡(luo)模型。
南方科技大學團隊(dui)已(yi)經(jing)研發了4款AI芯片,其中,在(zai)平均能(neng)效情況下(xia),X-Edge芯片達到200TOPS/W,超越(yue)人(ren)腦(nao)的10TOPS/W。
基于(yu)上述研發理(li)念(nian),X-Edge芯(xin)片(pian)可以應用于(yu)搭建低碳邊緣算力平(ping)臺(tai)、機器(qi)人平(ping)臺(tai)、移動巡檢平(ping)臺(tai)、元宇(yu)宙平(ping)臺(tai)等(deng)。
二、軟硬件協同設計,應對AI落地碎片化難題
相(xiang)對(dui)云端(duan)AI芯片(pian)(pian),邊緣側(ce)與端(duan)側(ce)的(de)AI芯片(pian)(pian)企(qi)業(ye)面臨(lin)著(zhu)更為多(duo)元的(de)應用(yong)場景,不(bu)止要通過(guo)優化底層技術,還(huan)必須抓住(zhu)時間(jian)窗口,加速實(shi)現芯片(pian)(pian)及相(xiang)應解決(jue)方案的(de)規模化落(luo)地。
在上午舉行(xing)的邊緣(yuan)端AI芯(xin)片(pian)專(zhuan)題論壇期間,來自時(shi)擎(qing)科(ke)技、愛芯(xin)元(yuan)智、Imagination、齊感科(ke)技、英諾達、嘉(jia)楠科(ke)技的行(xing)業大牛,分享(xiang)了(le)他(ta)們(men)觀察到(dao)的下游市場需求之(zhi)變,以及應(ying)對(dui)這些變化(hua)的產品創新、落地(di)打法與實(shi)戰經(jing)驗。
1、時擎科技仇健樂:分布式存儲與計算,應對端側AI落地碎片化挑戰
在AIoT時代,AI應用(yong)(yong)越來越多地以“云(yun)邊端協同(tong)”形(xing)式出現。與(yu)云(yun)端AI芯片相比(bi),端側AI芯片需要滿足(zu)一些特定需求,比(bi)如:算力能(neng)支持本地預處(chu)理或(huo)簡單決策即可,對(dui)功耗和(he)(he)成本更敏感(gan),傳感(gan)器接(jie)口和(he)(he)應用(yong)(yong)市場碎片化等。
面向這樣的市場(chang)特點,端(duan)側(ce)智(zhi)能芯片(pian)公司時擎科(ke)技(ji)選擇采用DSA(領域專用架(jia)構(gou))芯片(pian)設計(ji)方案,時擎采用神經網絡數據壓縮(suo)引擎,支(zhi)持自(zi)主研發的基于(yu)RISC-V架(jia)構(gou)的端(duan)側(ce)DSA智(zhi)能處理器。
據時擎科(ke)技(ji)研發副總裁(cai)仇健樂分享,該(gai)處理器(qi)可進(jin)行分布式(shi)存儲和(he)計算(suan),適(shi)應AI算(suan)法快(kuai)速演進(jin),保持高計算(suan)效率,目前(qian)已能在128GOPS-2TOPS算(suan)力范圍內實(shi)現較強伸縮性(xing)。
▲時擎科技(ji)研(yan)發(fa)副總裁仇健樂
當(dang)進(jin)入客戶應用場景(jing)進(jin)行部(bu)署(shu),設計好的(de)AI端(duan)側芯片又面臨一大新的(de)挑戰——部(bu)署(shu)模(mo)型多為小型化網絡模(mo)型,數據量化難度大。
為此,時(shi)擎通過TimesFlow平臺(tai)提供多(duo)種(zhong)量化方法,包括INT8/INT16的(de)對稱(cheng)/非對稱(cheng)量化選項,從(cong)而降(jiang)低(di)量化過程中的(de)精度損失。時(shi)擎還配備一鍵(jian)部署(shu)功(gong)能、豐富算子(zi)庫、多(duo)種(zhong)預處理方法,以(yi)優化客(ke)戶(hu)的(de)應用部署(shu)體驗。
2、愛芯元智劉建偉:兩大核心技術,加速端側AI芯片落地
近(jin)10年(nian)AI技術(shu)發展迅猛,隨著算力(li)越(yue)(yue)來越(yue)(yue)大,市場空(kong)間(jian)暴漲,端側(ce)和(he)邊緣側(ce)的AI芯(xin)片也迎來發展機遇。在端側(ce)、邊緣側(ce)對(dui)智能要求越(yue)(yue)多,需要的算法也就越(yue)(yue)多,同時,AI的應用也對(dui)感(gan)知和(he)計算提(ti)出了更高的需求。
愛芯(xin)元智聯合創始(shi)人、副總裁劉建偉說:“愛芯(xin)元智在(zai)AI芯(xin)片領(ling)域(yu)(yu)對感知(zhi)和計(ji)算的探索(suo),已經(jing)成功量產兩代四顆芯(xin)片,并布局于消費電子、智慧城市領(ling)域(yu)(yu)。”
▲愛芯元智聯(lian)合創始人、副總(zong)裁劉建偉
愛芯(xin)元智將感知和(he)計(ji)算作為兩(liang)大基(ji)礎(chu)技術(shu)進行(xing)(xing)研發(fa),其中,AI-ISP技術(shu)將AI與ISP(圖像信(xin)號處(chu)理)相結合,選取傳統(tong)ISP中的模(mo)塊進行(xing)(xing)增強(qiang)。混合精度NPU提供(gong)基(ji)礎(chu)算力,可以實現模(mo)塊間并行(xing)(xing)計(ji)算。
此外,愛芯元智提供的不僅(jin)是AI芯片,而是面向場景的解(jie)決(jue)方案,在設計(ji)整個芯片時,會幫(bang)助客戶從(cong)芯片、應(ying)用(yong)到算法進行協同設計(ji)。
3、Imagination鄭魁:CPU+GPU+AI異構計算,滿足邊緣智能多樣化需求
隨著人(ren)工智(zhi)能(neng)市場(chang)快速增長,PC、智(zhi)能(neng)手機、安全、汽(qi)車等(deng)市場(chang)都需要不同算力,為此,IP解(jie)決方案商Imagination最(zui)新推(tui)出了覆蓋AI、GPU和CPU等(deng)IP的(de)異構(gou)計(ji)算架構(gou)。
Imagination中國區??智能及汽(qi)車產品市場副總(zong)鄭魁談(tan)道,作為(wei)一(yi)家IP設計(ji)公司(si),PPA(性能、功耗、面積(ji))是產品一(yi)直(zhi)強調的(de)(de)要(yao)素(su)。同時面向(xiang)(xiang)手(shou)機、自動(dong)駕駛(shi)等各個領域的(de)(de)算(suan)(suan)力需求(qiu)多樣(yang)化(hua),對硬件計(ji)算(suan)(suan)架構(gou)(gou)乃至軟件棧有更(geng)高的(de)(de)需求(qiu)。異構(gou)(gou)計(ji)算(suan)(suan)是未來的(de)(de)發展方向(xiang)(xiang),對此,Imagination已在IP層面將所有計(ji)算(suan)(suan)異構(gou)(gou)能力整(zheng)合,提供具備靈活性、標準化(hua)、開(kai)放性的(de)(de)解決(jue)方案。
▲Imagination中國區(qu)??智能及(ji)汽車產品市場副總鄭魁
在(zai)AI方面(mian)(mian),Imagination推(tui)出了(le)NNA(神(shen)經(jing)網絡加速器)等IP產品,已落地自動(dong)駕駛(shi)、consumer等多個領域;在(zai)CPU方面(mian)(mian),最新(xin)推(tui)出基于(yu)RISC-V的(de)(de)RTXM-2200,是其首款實(shi)時嵌入式(shi)的(de)(de)高(gao)(gao)(gao)度可(ke)擴(kuo)展(zhan)的(de)(de)實(shi)時、確定性(xing)(xing)、32位嵌入式(shi)CPU;在(zai)GPU方面(mian)(mian),基于(yu)PowerVR開拓性(xing)(xing)架構除了(le)出色的(de)(de)PPA,還具備(bei)強(qiang)大的(de)(de)算(suan)(suan)力(li)可(ke)拓展(zhan)性(xing)(xing)。Power VR架構走過30載(zai),如今(jin)高(gao)(gao)(gao)算(suan)(suan)力(li)IMG GPU已拓展(zhan)至(zhi)桌(zhuo)面(mian)(mian)、車載(zai)、高(gao)(gao)(gao)性(xing)(xing)能計算(suan)(suan)等多個新(xin)市(shi)場。
4、齊感科技刁勇:芯片+解決方案,助不同AI場景的應用快速落地
齊感(gan)科技市(shi)場副總裁刁勇談道,AI產業市(shi)場正(zheng)在(zai)高速發展,目(mu)前較典型(xing)的AI應用包括(kuo)語音(yin)識(shi)別、自然語言處理、視(shi)覺(jue)應用,其中視(shi)覺(jue)應用是成長最快速的。
▲齊感科技市場副(fu)總裁刁(diao)勇
智慧家居、智慧零(ling)售、智慧農牧、機器人、智慧教育等(deng)落(luo)地場(chang)景,對AI視覺芯(xin)片(pian)有(you)非常強的需求(qiu)。對于AI視覺芯(xin)片(pian)公司來(lai)說,僅利用自己的經驗(yan)來(lai)應對不(bu)同業務需求(qiu),可能會面(mian)臨很多的挑戰。對此,齊感科技以(yi)AI SoC芯(xin)片(pian)為(wei)核心,推出全套解決方(fang)案(an),來(lai)幫(bang)助客戶在設計相(xiang)關產品時快速落(luo)地。
目前,齊感(gan)科(ke)技已經推出兩代(dai)芯片平臺QG21、QG31,包(bao)含(han)8顆(ke)芯片,并在(zai)此基礎上布(bu)局了智(zhi)能網絡(luo)攝像機(ji)、低功耗視覺應(ying)用,智(zhi)能門鎖、AI智(zhi)能分析盒子、智(zhi)能云臺、翻譯機(ji)等解決(jue)方案。
此外,很多不帶AI的(de)攝像(xiang)頭已經部署應(ying)用,但它(ta)們可能有(you)實際上有(you)升級(ji)、增(zeng)加AI加速能力的(de)需求,齊感科技的(de)AI智能分析解(jie)決(jue)方案則給這些產品提供了(le)升級(ji)路徑。
5、英諾達李曦:大型AI芯片驗證平臺,應對芯片設計上云需求
算力成(cheng)(cheng)為半導體行業的新增長點,人們在(zai)追求更(geng)先進(jin)的制程(cheng)工藝時,IC設(she)計成(cheng)(cheng)本隨(sui)之快速(su)上升,芯片設(she)計軟件EDA上云成(cheng)(cheng)為新趨勢。
英諾達市場與銷售總(zong)監李曦談道(dao),IC設計(ji)上云面臨(lin)數(shu)據(ju)安(an)全、商(shang)務模式、技術支持(chi)等多重挑(tiao)戰。EDA龍頭Cadence推出(chu)的(de)Palladium硬件仿真加速器是(shi)業界較通用的(de)硬件仿真器,支持(chi)百億門(men)級的(de)SoC全芯片驗(yan)證(zheng);但它(ta)價格昂貴,安(an)裝及維護要求高,中(zhong)小公司往(wang)往(wang)難(nan)以負擔。
▲英諾達市場與銷(xiao)售總監李曦
為此,英諾達推出國內首(shou)個基于且由Cadence獨(du)家(jia)授權的(de)(de)Palladium的(de)(de)異構云平臺(tai),在國內搭建異構機房以保證(zheng)安(an)全可控和(he)數據快(kuai)速傳輸,并(bing)將費(fei)用(yong)降低到中小公司可負擔(dan)的(de)(de)范(fan)圍,目前(qian)已形成按(an)需使用(yong)、按(an)時收費(fei)的(de)(de)商業(ye)模式(shi)。
同(tong)時,該(gai)平(ping)臺(tai)也會提供機器故(gu)障(zhang)診(zhen)斷及維修、客戶(hu)(hu)配置初(chu)始調(diao)試、驗證環境搭(da)建等技術支持。在疫情期間,英諾達的(de)(de)(de)云服(fu)務(wu)優勢(shi)明顯,客戶(hu)(hu)的(de)(de)(de)機器利用(yong)率保持在80%以(yi)上,不僅可以(yi)讓用(yong)戶(hu)(hu)持續推進研發進度,還可以(yi)讓用(yong)戶(hu)(hu)把更多精力(li)放在體現其(qi)核心(xin)競爭力(li)的(de)(de)(de)芯片設計上。
6、嘉楠科技湯煒偉:擁抱軟硬件開源生態,算法平臺和倉庫幫助輕松部署
“AI應用的發展逐(zhu)漸變(bian)得(de)場景化、設備(bei)化、多樣化。”嘉(jia)楠科(ke)技副(fu)總裁湯煒偉說。AI先(xian)起于(yu)云端,隨著技術不(bu)斷成熟、AI算法模(mo)型裁剪(jian)量(liang)化,AI芯片性能(neng)和(he)性價比不(bu)斷提升,邊(bian)緣的AI算力(li)變(bian)得(de)更加(jia)普(pu)及。
▲嘉(jia)楠科技副總裁(cai)湯煒偉(wei)
邊緣AI計(ji)算設備形態多元化,這導致未(wei)來該領域的開發(fa)并不(bu)只在大公司,更多中小公司、個人(ren)開發(fa)者(zhe)(zhe)都會(hui)參與進來。不(bu)過在開發(fa)過程中,開發(fa)者(zhe)(zhe)往(wang)往(wang)直面很(hen)多門檻(jian),比如選擇(ze)芯片(pian)平臺(tai)、買(mai)不(bu)到芯片(pian)硬件、獲(huo)取開發(fa)資料和(he)獲(huo)得支持等。在他(ta)看(kan)來,降低門檻(jian)最好的途徑就是開源。
因此,嘉楠科技(ji)采用RISC-V的通(tong)用處理(li)器核架(jia)(jia)構,多代自研KPU架(jia)(jia)構,實現全流程(cheng)的研發自主研發,能夠對開源開放、快(kuai)速(su)迭代和客戶支持有更好支撐。近兩三年嘉楠科技(ji)已經(jing)實現超200萬顆RISC-V AI芯片出(chu)貨。
另外,新(xin)的(de)AI算法平臺(tai)和倉庫(ku)計劃(hua)年底推出(chu),該工具(ju)將極大(da)降低AI開(kai)發門(men)檻。在(zai)體驗已有(you)AI demo集的(de)基礎上(shang),開(kai)發者可空中升級(ji)新(xin)增的(de)AI算法demo 以及算法二(er)次開(kai)發,并輕松優化(hua)部署在(zai)硬(ying)件上(shang)。
嘉楠科(ke)技的AI工具鏈,軟件SDK等代碼和文檔已全面開源在Github等平(ping)臺(tai)上(shang),以勘智(zhi)Kendryte AI品牌呈現。
三、存算一體核心力量集結!從小算力走向大算力
存算(suan)一(yi)體是當(dang)前AI芯片領域(yu)最熱門的(de)(de)架構創(chuang)新(xin)方(fang)向。這個有望突破傳統算(suan)力瓶頸的(de)(de)創(chuang)新(xin)賽道,不(bu)僅是國(guo)際芯片學術頂級會議的(de)(de)焦(jiao)點話題,而且在產業界開始頻頻“吸金”,連獲各路資本(ben)的(de)(de)傾投。
今天(tian)下午,五位國(guo)內存算(suan)一(yi)體(ti)AI芯(xin)片創(chuang)企的(de)創(chuang)始人兼CEO齊聚(ju)GTIC 2022全球AI芯(xin)片峰會·存算(suan)一(yi)體(ti)芯(xin)片專題論壇,展示(shi)前沿架構與落地進展,探討高(gao)能效、低成(cheng)本的(de)可行之徑(jing)。
1、知存科技王紹迪:存內計算芯片能效、成本優勢明顯,WTM系列芯片率先布局生態
相比于傳統計(ji)(ji)(ji)算(suan)(suan)架構,存(cun)算(suan)(suan)一體更適(shi)合AI計(ji)(ji)(ji)算(suan)(suan)。利用歐姆定律乘法的計(ji)(ji)(ji)算(suan)(suan)原理(li),這種架構就可以實(shi)現百萬(wan)級、千萬(wan)級并行(xing)計(ji)(ji)(ji)算(suan)(suan),使得(de)AI計(ji)(ji)(ji)算(suan)(suan)算(suan)(suan)力能效提升數(shu)倍到數(shu)十(shi)倍,相比CPU、GPU具備更高密度、更高并行(xing)度、更高能效、更大算(suan)(suan)力。
知存(cun)科(ke)技創始人兼CEO王紹(shao)迪談道(dao),存(cun)算一體在(zai)成本(ben)、算力、功耗(hao)上有很大優(you)勢,但還需要補(bu)齊(qi)通用型(xing)、工具鏈(lian)、精度。
▲知存科技(ji)創始人兼CEO王紹迪
知存科(ke)技已經量產商用存內計(ji)算(suan)(suan)SoC芯片WTM2101,AI算(suan)(suan)力達(da)到50Gops,功(gong)耗(hao)僅5uA-3mA,主要(yao)應用于可(ke)穿戴場景中的(de)語音(yin)識(shi)別、語音(yin)增強、健(jian)康監測(ce)等功(gong)能。未來5年內,還(huan)將發布(bu)更高算(suan)(suan)力芯片序列(lie)(lie)WTM8系列(lie)(lie)、WTM-C系列(lie)(lie)、WTM-S系列(lie)(lie)。
接(jie)下來(lai)(lai),憑借存(cun)內(nei)計算產品研發和商用的(de)先(xian)發優(you)勢,知存(cun)科技(ji)會持續投入算法體(ti)系、架構(gou)(gou)創新與工具鏈、底層(ceng)工藝三(san)個(ge)層(ceng)面,推動存(cun)內(nei)計算生態構(gou)(gou)建。王紹迪表(biao)示,存(cun)內(nei)計算未來(lai)(lai)也要擁(yong)抱Chiplet,將兼容(rong)性、能效做的(de)更好(hao)。
2、蘋芯科技楊越:AI算力下沉時代,用SRAM突破“存儲墻”限制
進入AI時(shi)代,算力正(zheng)在下沉到移動物聯網及(ji)AIoT終端,計算更加注重能耗及(ji)效率。
為(wei)了解決“存(cun)(cun)儲(chu)墻”問題,減(jian)少數據(ju)在存(cun)(cun)儲(chu)器與(yu)處理器之間的傳輸損耗,業界出現(xian)了CMOS加速器、近存(cun)(cun)計(ji)算、存(cun)(cun)內計(ji)算等多(duo)種路徑。蘋(pin)芯科技聯合創(chuang)始?兼(jian)CEO楊(yang)越認為(wei),在可實現(xian)存(cun)(cun)內計(ji)算的多(duo)種存(cun)(cun)儲(chu)器技術中,SRAM(靜態(tai)隨(sui)機存(cun)(cun)取存(cun)(cun)儲(chu)器)具有較大(da)計(ji)算優勢。
▲蘋芯科技聯合(he)創始?兼CEO楊(yang)越
聚焦這(zhe)一領域(yu),蘋芯科技推出(chu)了SRAM數字存內(nei)計算內(nei)核(he),支持(chi)常(chang)見的(de)定點(dian)/浮點(dian)運算,能實(shi)現超5倍效(xiao)率(lv)提(ti)升,納秒級(ji)(ji)讀(du)寫(xie)(xie)延遲,無擦(ca)寫(xie)(xie)次數限制,并且能夠向(xiang)高級(ji)(ji)工藝節點(dian)兼(jian)容,引入ADC-less設計,從而實(shi)現精(jing)度無損效(xiao)果。從內(nei)核(he)硬件到(dao)SoC產品,蘋芯科技在可掛載的(de)PIM核(he)、軟件構(gou)建等方面加大布局,目(mu)前正(zheng)在陸(lu)續推出(chu)NE002、NE003、PIMCHIP S230等幾款芯片。
權威(wei)報告顯示,2030年(nian)全球AI芯(xin)片市(shi)場(chang)規模有望達到2021億美(mei)元。楊越說,蘋芯(xin)定位的(de)市(shi)場(chang)不局限于(yu)AI識別算(suan)(suan)法,還覆蓋(gai)了包括降噪算(suan)(suan)法、SLAM算(suan)(suan)法、ISP算(suan)(suan)法等其他矩(ju)陣類運(yun)算(suan)(suan),目標(biao)落地智慧可(ke)穿戴、機(ji)器人、工(gong)農業智能(neng)化設(she)備(bei)等領域(yu)。
3、億鑄科技熊大鵬:基于ReRAM的全數字化存算一體大算力芯片技術
AI芯(xin)片正(zheng)在(zai)從通(tong)用(yong)CPU、專用(yong)加速器(qi)發(fa)展為存算(suan)一體階(jie)段,而馮·諾(nuo)依(yi)曼架構的存儲墻、能(neng)效墻、編譯墻正(zheng)在(zai)阻礙AI芯(xin)片算(suan)力和能(neng)效比的持續發(fa)展。
億鑄(zhu)科(ke)技創始人、董(dong)事長兼(jian)CEO熊(xiong)大鵬談道,存(cun)算(suan)一(yi)體(ti)架構在突破這些瓶(ping)頸上具有先天優勢。目(mu)前實(shi)現存(cun)算(suan)一(yi)體(ti)架構主要通過(guo)(guo)模(mo)(mo)擬、數(shu)(shu)模(mo)(mo)兩(liang)種(zhong)方(fang)(fang)式。模(mo)(mo)擬能(neng)(neng)(neng)夠提高兩(liang)個數(shu)(shu)量級以上的能(neng)(neng)(neng)效比(bi),數(shu)(shu)模(mo)(mo)混合能(neng)(neng)(neng)部分解決精(jing)度問(wen)題,不過(guo)(guo)這兩(liang)種(zhong)方(fang)(fang)式會犧牲部分精(jing)度,同時數(shu)(shu)模(mo)(mo)、模(mo)(mo)數(shu)(shu)轉換(huan)會帶來能(neng)(neng)(neng)耗(hao)、面(mian)積和性(xing)能(neng)(neng)(neng)瓶(ping)頸。
▲億鑄科技創(chuang)始人、董事(shi)長兼CEO熊(xiong)大(da)鵬
為了(le)(le)突破上述瓶頸(jing),億(yi)鑄科技基于ReRAM打造了(le)(le)全數(shu)字化存算(suan)(suan)一體AI大算(suan)(suan)力芯片(pian)技術(shu),通過(guo)數(shu)字化徹(che)底解精度問題,在整個計算(suan)(suan)過(guo)程中,不受工藝(yi)環境的影(ying)響,實現高精度、大算(suan)(suan)力、超高能效比,切實將存算(suan)(suan)一體架構應(ying)用于大算(suan)(suan)力領域。
不(bu)同存儲(chu)介(jie)質應用在不(bu)同場景上(shang)各有優劣勢(shi)。熊(xiong)大(da)鵬認為(wei),面向AI大(da)算力場景,ReRAM是目前(qian)最合適的存儲(chu)介(jie)質。億(yi)鑄選擇(ze)ReRAM的優勢(shi)在于非易失、密度大(da)、密度上(shang)升空(kong)間(jian)巨大(da)、能(neng)耗(hao)低(di)(di)、讀寫速度快、成本低(di)(di)、穩定、兼(jian)容CMOS工(gong)藝(yi)等特點。目前(qian)ReRAM的制造(zao)工(gong)藝(yi)已經(jing)成熟,且已經(jing)有ReRAM產(chan)品量產(chan)落(luo)地(di)。
4、智芯科張鐘宣:解決AI落地中的“將大象塞進冰箱”難題
杭州智芯科微電(dian)?創始?兼CEO張鐘宣說,千(qian)千(qian)萬萬的AI公司做AI落地,面臨“將大象塞(sai)進冰箱”的問題。例如,一個(ge)手(shou)機的功(gong)耗不(bu)能超(chao)過5W,否(fou)則熱散不(bu)去,AI模(mo)型落地到手(shou)機上(shang),就會損失很多效果(guo)。
▲杭州智芯(xin)科微電?創始?兼CEO張鐘宣(xuan)
看到這一市(shi)場發展瓶頸,智(zhi)芯(xin)(xin)科(ke)選擇(ze)基(ji)于(yu)SRAM(靜態隨機存(cun)(cun)取存(cun)(cun)儲器)的存(cun)(cun)內計算技術,解決后摩爾時(shi)代的“大算力、低功耗”市(shi)場痛(tong)點。智(zhi)芯(xin)(xin)科(ke)主要聚焦視覺處理(li)芯(xin)(xin)片、GPNPU(通(tong)用神經網絡(luo)處理(li)器)兩個(ge)落(luo)地方向。
張鐘(zhong)宣談道,智芯科的(de)(de)視(shi)覺處理(li)器AT700 AI CIM,int8能(neng)耗(hao)比(bi)達(da)(da)到10TOPS/W。AT700X Pre-ISP圖像(xiang)增強能(neng)使算力(li)超過(guo)20TOPS,同時功耗(hao)低(di)于1W;落(luo)地網絡攝像(xiang)機(ji)領(ling)域(yu),能(neng)實(shi)現(xian)0.5~2W低(di)功耗(hao),算力(li)達(da)(da)10~50TOPS(int8),實(shi)現(xian)暗光(guang)全彩效果(guo);AT800 GP CIM是其代表(biao)性的(de)(de)邊緣AI處理(li)器,采用12nm制程,int8能(neng)耗(hao)比(bi)達(da)(da)到30TOPS/W,幾乎達(da)(da)到當下5nm同類(lei)芯片的(de)(de)水平。
在(zai)軟件方(fang)面,智芯(xin)科推出了(le)一套AI工(gong)具流(liu)程(cheng),面向客戶提供(gong)網(wang)絡優化、量(liang)化浮點(dian)達(da)int8的算力服務,并(bing)支持神經網(wang)絡圖形(xing)編譯、可執(zhi)行二進制(zhi)文件生成(cheng)的相關硬件。
5、九天睿芯劉洪杰:基于混合信號SRAM存算一體,多模態傳感器協同
人機交互系統智能程度(du)提(ti)(ti)升(sheng),帶來了傳(chuan)感器數量、時間(jian)空間(jian)分辨率要求及神經網(wang)絡應用規模的(de)提(ti)(ti)升(sheng),對多維度(du)數據(ju)同步采(cai)集(ji)、傳(chuan)輸(shu)、處理、運(yun)算和存儲操作的(de)能效、面效和時效性(xing)能提(ti)(ti)出(chu)了更(geng)高的(de)要求。
九天睿(rui)芯創始人、董事長(chang)兼CEO劉洪杰談道(dao),基于SRAM的混合信(xin)號存內計算能(neng)夠實現(xian)更小的運算單(dan)元(yuan)、更高的能(neng)效,同時保持符合商用的精度(du),體現(xian)了(le)該架構良好的應用優勢,在面積上,九天睿(rui)芯的產品大(da)小僅為1.4×1.4平方(fang)毫(hao)米。
▲九(jiu)天(tian)睿(rui)芯創(chuang)始人、董事長(chang)兼CEO劉洪(hong)杰
混合(he)信號(hao)SRAM存(cun)(cun)算一(yi)體同(tong)時(shi)(shi)結合(he)模擬預處(chu)理(li)和高性能(neng)ADC,九天睿芯(xin)使整個信號(hao)鏈更智能(neng)更高效率,這一(yi)架構(gou)能(neng)打破傳感(gan)器(qi)端(duan)ADC速度和精度性能(neng)瓶頸(jing),存(cun)(cun)算一(yi)體實現(xian)了NPU突(tu)破功耗(hao)瓶頸(jing),因此適用(yong)(yong)于(yu)追求極致低(di)功耗(hao)和低(di)延(yan)時(shi)(shi)、高精度的(de)(de)場景。面向兩個應(ying)用(yong)(yong):1,VR/AR領域的(de)(de)未來應(ying)用(yong)(yong),基于(yu)混合(he)信號(hao)SRAM感(gan)存(cun)(cun)算一(yi)體可幫助實現(xian)眼動(dong)追蹤,以及(ji)VR/AR頭(tou)顯設備的(de)(de)超低(di)功耗(hao)語(yu)音識(shi)別、SLAM同(tong)步(bu)定位(wei)與(yu)構(gou)圖。2,集(ji)成模擬預處(chu)理(li)或高速ADC與(yu)存(cun)(cun)算一(yi)體的(de)(de)車用(yong)(yong)傳感(gan)器(qi)端(duan)(視覺,激光雷達等(deng))的(de)(de)低(di)延(yan)時(shi)(shi)低(di)功耗(hao)高集(ji)成度處(chu)理(li)。
四、鍛造新型計算鑰匙,打開通用智能未來之門
在后摩(mo)爾(er)時(shi)代,AI芯(xin)片日漸(jian)面(mian)臨(lin)來自器件、工藝、架構(gou)、能(neng)耗、成(cheng)本等諸多(duo)(duo)芯(xin)片設計(ji)與制造層(ceng)面(mian)的挑(tiao)戰。同(tong)時(shi),盡管深(shen)度學(xue)習算法(fa)的落(luo)地(di)愈發廣泛,產學(xue)界仍在探索實現通用智能(neng)的更多(duo)(duo)可能(neng)路徑,這(zhe)要求(qiu)AI芯(xin)片從底層(ceng)架構(gou)創新(xin),來應對主(zhu)流AI算法(fa)變化(hua)的不確定性。
除了存算一體方興未艾,還有幾類新型(xing)計(ji)(ji)(ji)(ji)算架構走(zou)出學術象牙塔,走(zou)向產業化。在新型(xing)計(ji)(ji)(ji)(ji)算技術專(zhuan)題論(lun)壇上(shang),類腦計(ji)(ji)(ji)(ji)算創企(qi)代(dai)表(biao)(biao)靈(ling)汐科(ke)技、光子(zi)(zi)(zi)計(ji)(ji)(ji)(ji)算創企(qi)代(dai)表(biao)(biao)曦智科(ke)技、量子(zi)(zi)(zi)計(ji)(ji)(ji)(ji)算創企(qi)代(dai)表(biao)(biao)玻色(se)量子(zi)(zi)(zi)發(fa)表(biao)(biao)主題演講,分(fen)享他們如何通過(guo)將前沿技術轉化落地(di),闖向AI計(ji)(ji)(ji)(ji)算加速的“無人(ren)區”。
1、靈汐科技華寶洪:類腦芯片已量產落地,異構融合成新趨勢
靈汐(xi)科技(ji)副總經理華(hua)寶洪認(ren)為,類腦(nao)計(ji)算(suan)是后摩爾時代顛覆性戰略(lve)技(ji)術,已(yi)成中美歐(ou)科技(ji)競爭必爭之地。這一(yi)方法(fa)受(shou)人腦(nao)啟發產生,是一(yi)個融合生物腦(nao)科學(xue)原理和計(ji)算(suan)機科學(xue)原理的(de)計(ji)算(suan)系統,具有近似計(ji)算(suan)、抗(kang)噪音、稀疏(shu)、時空相關性等特點(dian)。
▲靈(ling)汐科技副總經理華寶洪
華(hua)寶洪說,異構融合是類腦計算的(de)(de)發展(zhan)趨勢。靈汐科技的(de)(de)相關成果(guo)于2019年登國(guo)際學術頂刊《自然》封面,基于此(ci)靈汐科技已流片和量產了(le)邊(bian)端首款商用(yong)類腦芯片Lynchip KA200,兼容人工神經(jing)(jing)網絡(luo)和生(sheng)物神經(jing)(jing)網絡(luo),采用(yong)12nm制程(cheng),支持25萬神經(jing)(jing)元(yuan)、2500萬突觸,稀疏模式支持200萬神經(jing)(jing)元(yuan),DNN算力達到32TOPS(int8),16TFLOPS(FP16),功(gong)耗(hao)范圍在(zai)1-14瓦,運行ResNet50-64、yolo5等主流網絡(luo)時,芯片在(zai)能效比和性價比遠高于NVIDIA T4。
目前(qian)靈汐科技的類腦(nao)計算芯片已經用于(yu)腦(nao)科學和類腦(nao)計算,同時也覆蓋(gai)安防(fang)、機(ji)器人(ren)、無人(ren)機(ji)等傳統AI應用領(ling)域(yu)。
2、曦智科技胡永強:光電混合,重新定義算力基建
半導(dao)體工(gong)(gong)藝(yi)從硅基(ji)時代(dai)的(de)10μm工(gong)(gong)藝(yi)發(fa)展到3nm工(gong)(gong)藝(yi),進入后(hou)摩爾時代(dai),企(qi)業(ye)開始探(tan)索光(guang)子(zi)(zi)計算(suan)、量(liang)子(zi)(zi)計算(suan)、存內計算(suan)的(de)發(fa)展。曦智科(ke)技全(quan)球(qiu)副總(zong)裁(cai)胡永強談(tan)道,光(guang)子(zi)(zi)計算(suan)的(de)底(di)層優勢(shi)是低延遲、低能耗、高通量(liang)。與電傳輸相比(bi),光(guang)信(xin)號以光(guang)速(su)傳輸,能實現微米至百(bai)米級的(de)TB級數(shu)據傳輸能力(li)。
▲曦智科技全球副總裁胡永強
基(ji)于光(guang)(guang)子(zi)矩陣計算oMAC、片上光(guang)(guang)網絡oNET、片間光(guang)(guang)網絡oNOC的(de)三大光(guang)(guang)核(he)心技(ji)術,曦(xi)智科技(ji)打(da)造了光(guang)(guang)子(zi)計算和光(guang)(guang)子(zi)網絡兩(liang)大產(chan)品線(xian)。
相比于電子芯(xin)片(pian),光(guang)的(de)計算(suan)單(dan)元并行能(neng)(neng)力很強,可(ke)以(yi)利用波(bo)分復(fu)用同時計算(suan)多路數據(ju),同時獲得更高的(de)能(neng)(neng)效(xiao)比以(yi)及極低的(de)計算(suan)延遲,且對工(gong)藝制程的(de)要(yao)求也更低。此(ci)外,片(pian)上光(guang)網絡(luo)oNOC技(ji)術將CMOS硅電子芯(xin)片(pian)堆疊在光(guang)芯(xin)片(pian)上,這種光(guang)電技(ji)術能(neng)(neng)通過光(guang)波(bo)導實(shi)現高帶寬、低能(neng)(neng)耗、低延遲的(de)chiplet網絡(luo)互聯方案。
去(qu)年,曦智(zhi)科技(ji)(ji)發布了第二代(dai)光(guang)計(ji)算處理器PACE,采用64×64光(guang)學矩陣(zhen)乘(cheng)法器,單個光(guang)子(zi)芯片中集成超過10000個光(guang)子(zi)器件,其運行特定(ding)神經網絡的(de)(de)計(ji)算速度(du)可以達到目(mu)前(qian)高端GPU的(de)(de)數百倍。今年下半年,曦智(zhi)科技(ji)(ji)將推出全球(qiu)首(shou)顆基于oNOC技(ji)(ji)術的(de)(de)光(guang)電(dian)混合3D封(feng)裝AI加(jia)速計(ji)算芯片,并搭(da)載(zai)自研軟件棧。
3、玻?量??凱:光量子芯片正從理論優越性走向實用優越性
量(liang)子(zi)計算(suan)代表著下一代算(suan)力(li)的(de)重要突破方向(xiang)。在量(liang)子(zi)計算(suan)世界中(zhong),運算(suan)的(de)基(ji)本(ben)單元是量(liang)子(zi)比特(te),它的(de)基(ji)本(ben)狀態是0和1的(de)疊加(jia)。對(dui)N個量(liang)子(zi)比特(te)進行一次(ci)操作(zuo),相當于對(dui)經典比特(te)進行2的(de)N次(ci)方次(ci)操作(zuo)。這體(ti)現(xian)了量(liang)子(zi)計算(suan)機(ji)的(de)巨大運算(suan)潛力(li),可應用于模擬、優化(hua)、機(ji)器學(xue)習、密碼學(xue)等方向(xiang)。
玻色量(liang)子(zi)創始(shi)人兼CEO文凱分享說(shuo),光量(liang)子(zi)計(ji)(ji)算是商用(yong)化量(liang)子(zi)計(ji)(ji)算機的(de)(de)新形態,目(mu)前正(zheng)從(cong)(cong)空間光發(fa)展(zhan)到集成光學芯(xin)片(pian),從(cong)(cong)理論優越性走向(xiang)實(shi)用(yong)優越性。比如中科大“九(jiu)章”去年研制(zhi)的(de)(de)113個光量(liang)子(zi)的(de)(de)“九(jiu)章2.0”完成了(le)高(gao)斯玻色采樣計(ji)(ji)算實(shi)驗(yan),比經典超級計(ji)(ji)算機快了(le)大約10的(de)(de)24次方(fang)倍,驗(yan)證了(le)量(liang)子(zi)計(ji)(ji)算的(de)(de)理論優越性。近年來,北(bei)京大學王劍(jian)威團隊、美國PsiQuantum公司,加拿(na)大Xanadu公司等都進行(xing)了(le)光量(liang)子(zi)計(ji)(ji)算芯(xin)片(pian)化的(de)(de)相關探索。
▲玻色(se)量子創(chuang)始人兼(jian)CEO文凱(kai)
創立于2020年(nian)底的(de)玻色量子(zi)(zi)是一(yi)支來自斯坦福大學、麻省理工、清(qing)華(hua)大學、中科院等(deng)學府(fu)的(de)團隊,多年(nian)研究基于DOPO(簡并光(guang)學參量振蕩器)的(de)相干量子(zi)(zi)計算(suan)方案,并在(zai)量子(zi)(zi)神經元(yuan)生成芯(xin)片、通(tong)用光(guang)量子(zi)(zi)計算(suan)芯(xin)片等(deng)方向展開了攻關。
目前,玻色(se)量子已(yi)推(tui)出第一(yi)代“天(tian)工”光(guang)量子計算驗證(zheng)平(ping)臺(tai),在國(guo)內首次(ci)實(shi)現(xian)25節點任意相連可(ke)編程的MAX-CUT問題的優化(hua)求解驗證(zheng),能在50微秒內在3000多萬種可(ke)能性中篩選(xuan)出4個(ge)最優解之一(yi)。在商(shang)業化(hua)場(chang)景應用(yong)上,玻色(se)量子在金融、交通(tong)、生(sheng)物(wu)制(zhi)藥等方面也都實(shi)現(xian)了突破。
結語:AI芯片長坡厚雪,奔向智能計算未來
至此,GTIC 2022全球AI芯片峰會(hui)圓滿收官。
在(zai)這場(chang)AI芯片盛(sheng)宴上,我們看到(dao)技(ji)術創新(xin)的(de)力(li)量依然熠熠生輝,從(cong)競逐(zhu)有效(xiao)算力(li)到(dao)聚焦(jiao)解(jie)決現實(shi)問題,許多(duo)創新(xin)方案提(ti)供了更多(duo)破解(jie)AI芯片瓶頸(jing)的(de)差異化思(si)路,多(duo)個(ge)創業團隊積淀(dian)的(de)AI芯片實(shi)力(li)也開始(shi)厚積薄(bo)發。
同時,我們也看(kan)到,無論(lun)是(shi)大算(suan)(suan)(suan)力(li)還(huan)(huan)是(shi)小算(suan)(suan)(suan)力(li)的(de)AI芯片,無論(lun)是(shi)相(xiang)對成(cheng)熟的(de)領域專用(yong)架構、通用(yong)GPU,還(huan)(huan)是(shi)存算(suan)(suan)(suan)一(yi)體、類腦計(ji)算(suan)(suan)(suan)、光子計(ji)算(suan)(suan)(suan)、量子計(ji)算(suan)(suan)(suan)等前(qian)沿技(ji)術路(lu)線,都有越來(lai)越多的(de)高性能產品走向規(gui)模化(hua)量產與商(shang)用(yong)落地。
隨著(zhu)疫情得到有(you)效控制,行業(ye)秩序(xu)逐步恢復,面(mian)對智能(neng)化、數字化、電動化帶來的海量(liang)數據計算需求(qiu),承載著(zhu)智能(neng)計算核心動力(li)的AI芯片產業(ye),繼續快速奔跑,未來市(shi)場(chang)發(fa)展空間廣闊。
我們(men)希望GTIC 2022全球AI芯片(pian)峰(feng)會成為前(qian)沿技(ji)術交(jiao)流(liu)和(he)產(chan)業落(luo)地對接的(de)平臺(tai),通過邀請各條細分賽道極具(ju)代表(biao)性的(de)AI芯片(pian)企業們(men)同臺(tai),共同譜(pu)出AI芯片(pian)產(chan)業的(de)最強音(yin)。
預告(gao):GTIC另一場產業峰(feng)會,2022全球自(zi)動(dong)駕駛峰(feng)會,也將于(yu)近期(9月27日(ri))在深圳舉行,敬請關注(zhu)。
接(jie)下來(lai),芯東西將就部分演(yan)講及巔峰論壇進行(xing)更(geng)完整(zheng)的(de)報道,請關注(zhu)芯東西的(de)后續推送。