
芯東西(公眾號:aichip001)
作者 | ?ZeR0
編輯 | ?漠影
芯(xin)東西8月8日(ri)報道,今日(ri),北京AI芯(xin)片(pian)創(chuang)企蘋芯(xin)科技發(fa)布存(cun)算(suan)一體NPU“PiMCHIP-N300”和多模態(tai)智能感知SoC芯(xin)片(pian)“PiMCHIP-S300”。兩款產(chan)品是(shi)存(cun)算(suan)一體技術在28nm及22nm制(zhi)程節(jie)點上的首次產(chan)品化實現。N300已有客戶,S300預計(ji)在今年(nian)第四季度推向市場。
通(tong)過將計(ji)算和(he)存儲深(shen)度(du)融合,PiMCHIP-S300實現了(le)數據(ju)處(chu)理的“零搬運(yun)”,在(zai)大幅提(ti)升(sheng)計(ji)算效率(lv)的同時(shi),顯著降低了(le)功耗,可應用于智能可穿(chuan)戴設備、智能安(an)防(fang)、具(ju)身智能、AI大模型、健(jian)康(kang)數據(ju)分析(xi)等領域。
蘋芯科技創立于2021年(nian)2月,同年(nian)9月其基于SRAM架構的存(cun)內計算加速器S200測(ce)試成功,該成果還發表于素有(you)“固態電(dian)路(lu)領域奧林匹克”之稱(cheng)的芯片(pian)頂會(hui)ISSCC 2022。今天的新品(pin)發布(bu)也是(shi)對其過(guo)去三年(nian)創業(ye)發展的階段(duan)性總結。
清華大學電子工(gong)程系教授、無問芯(xin)穹(qiong)科技有限公司發(fa)起人(ren)汪玉現場發(fa)表致辭,他總結了蘋芯(xin)兩款(kuan)新品的三個(ge)特(te)點:1)在28nm成熟工(gong)藝(yi)下(xia)取得跨代性能(neng)提升,實現極致能(neng)效比;2)通用性強,能(neng)支持不同應用;3)是一個(ge)平臺架構的概念,在大模型、可穿戴(dai)、機(ji)器人(ren)等應用領域均能(neng)發(fa)揮(hui)作(zuo)用。
汪玉(yu) 回顧道(dao),他(ta)與(yu)蘋(pin)芯的(de)CEO楊越(yue)是從高(gao)中到大學的(de)同班(ban)同學。保送清華時(shi),汪玉(yu)選擇了電子工(gong)程系,楊越(yue)則選擇了自動化(hua)系。多年來的(de)學習和(he)工(gong)作中,兩(liang)人一直以來保持(chi)著非常緊密的(de)溝通(tong)和(he)聯系,是相(xiang)識28年的(de)老友(you)。
此外,在(zai)存(cun)(cun)算一(yi)體(ti)技術方向上,汪(wang)玉跟蘋(pin)芯(xin)團隊算是同(tong)行。汪(wang)玉大約在(zai)2012年(nian)、2013年(nian)開始研究(jiu)存(cun)(cun)算一(yi)體(ti)并發(fa)表相關(guan)論(lun)文。
據了(le)解,蘋(pin)芯科技(ji)已(yi)與國內外(wai)電子(zi)類頭(tou)部企業(ye)、大型企業(ye)集團等客戶展開合作,為其提供存內計算(suan)技(ji)術的一站式解決(jue)方案。
一、單核算力0.5TOPS,系統功耗毫瓦級,支持自定義算子
PIMCHIP-N300是蘋芯科(ke)技自(zi)研的新一(yi)代存算(suan)一(yi)體NPU(神經網絡處理單元)IP,專為(wei)機(ji)器學習(xi)和AI領域設計,可內(nei)嵌到端側(ce)芯片中,能以更高(gao)效率、更低能耗承(cheng)擔(dan)繁重的神經網絡加速任務。
楊越談到端(duan)側電(dian)子產(chan)品中出現兩(liang)個趨勢(shi)(shi),一(yi)是(shi)智能(neng)本地化(hua),二是(shi)小型化(hua)、輕量化(hua)、低功耗化(hua)。兩(liang)個趨勢(shi)(shi)都(dou)對底層芯片(pian)提出了新(xin)的設(she)計要求,低成(cheng)本、高效能(neng)、小面積、低功耗這四個優化(hua)維(wei)度(du)幾乎(hu)涵(han)蓋了所有(you)端(duan)側芯片(pian)的設(she)計理念。
PiMCHIP-N300采用軟硬(ying)融(rong)合(he)架(jia)構(gou),充分(fen)考慮可擴展性,單核可提供0.5TOPS算(suan)力,系統功耗(hao)為25-100mW,典型場(chang)景下(xia)靜態功耗(hao)僅10μW,支(zhi)持混合(he)精(jing)度(du)計(ji)算(suan),涵蓋INT4/INT8/FP16精(jing)度(du),支(zhi)持12大類超過100種(zhong)算(suan)子,核心計(ji)算(suan)單元能效比達27TOPS/W,跑YOLO-V3 tiny網絡的算(suan)力資(zi)源利用率達89.5%。
在兼(jian)容性方面,PiMCHIP-N300支(zhi)持自定義(yi)算子,可(ke)滿足不(bu)同模型(xing)部署需(xu)求,并(bing)針對(dui)人聲監聽、眼動追蹤、主動降噪、環境感(gan)知等(deng)應用(yong)場景提供了配置方案和專門(men)優化。
在靈活(huo)性方(fang)面,該NPU有(you)高速任務調度加速單元,支持(chi)多(duo)核或多(duo)個計算單元的實(shi)時任務調度。
為(wei)了滿足(zu)客(ke)戶(hu)更自主、靈活(huo)的(de)算法移植需求,蘋(pin)芯科(ke)技根據客(ke)戶(hu)定義的(de)場景或數據,提供一鍵部署的(de)端到端的(de)解決方案,開(kai)放NPU中間表示(shi)層規范、模型解析器、模型優化器、驅動等(deng),并提供免費的(de)軟(ruan)件工具鏈,包(bao)括軟(ruan)件模擬器、調試器、C編譯(yi)器,能夠減少二次開(kai)發(fa)的(de)時(shi)間。
蘋(pin)芯(xin)科技(ji)CTO章堯君把(ba)存算技(ji)術(shu)平臺分(fen)為五類:應(ying)(ying)用(yong)、工藝(yi)(yi)、電路(lu)、架構、算法,每一(yi)部分(fen)需(xu)要相互(hu)配合和共同(tong)設計(ji),從應(ying)(ying)用(yong)出發,確(que)定需(xu)要的算法、工作環境及(ji)設計(ji)要求(qiu),進(jin)而確(que)定架構設計(ji)和工藝(yi)(yi)選擇,根(gen)據(ju)工藝(yi)(yi)特(te)性設計(ji)電路(lu),最終(zhong)實現(xian)存算芯(xin)片方(fang)案。
這是一個密(mi)度優先(xian)(xian)、功耗優先(xian)(xian)、速(su)度優先(xian)(xian)的設(she)計方案。混合計算(suan)架(jia)構(gou)可基于不(bu)(bu)同的技術(shu)和設(she)計參數實(shi)現,包括不(bu)(bu)同陣(zhen)列形狀(zhuang)(存儲容(rong)量(liang)),SRAM、RRAM等不(bu)(bu)同的存算(suan)單元,不(bu)(bu)同的存算(suan)容(rong)量(liang)與算(suan)力的比例(li),以及不(bu)(bu)同輸(shu)(shu)入/輸(shu)(shu)出數量(liang)。
章堯君總(zong)結(jie)說(shuo),蘋芯科(ke)技(ji)以高能效加速計算核(he)心為(wei)原(yuan)點開始開發,之后做從定點運算到浮點運算,以及一些面向特殊應用的設計,并在研(yan)可靈(ling)活實現不同算力部(bu)署(shu)需求的首款存(cun)算編譯器,還將提供(gong)混合(he)計算架構(gou)和異(yi)構(gou)存(cun)內計算量(liang)化映射技(ji)術。
二、多模態智慧感知芯片:28nm,異構架構,單核能效比27TOPS/W
PIMCHIP-S300多模態智(zhi)慧感知芯(xin)片(pian)(pian)是(shi)一款基于SRAM的存內(nei)計算芯(xin)片(pian)(pian),內(nei)置自研NPU、數(shu)字PIM單元(yuan),單核(he)能(neng)效比(bi)高(gao)達27TOPS/W,具備高(gao)能(neng)效、小面積、低功耗、低成(cheng)本(ben)等特點,可高(gao)效完(wan)成(cheng)數(shu)據密(mi)集型任務(wu)。
該芯(xin)(xin)片(pian)采用(yong)輕量級(ji)Cortex-M MCU處(chu)理器,實現(xian)實時控制與調(diao)度(du);支(zhi)持音、視(shi)頻及(ji)多種(zhong)傳感器接入(ru),實現(xian)多模態融合(he)感知;支(zhi)持多路麥克風陣(zhen)列預處(chu)理流程,滿足各級(ji)語音場景應(ying)用(yong)。基于自(zi)研異構架構,這款AI芯(xin)(xin)片(pian)可實現(xian)超低功(gong)耗(hao)喚(huan)醒(xing)、VAD、語音識別(bie)、運動監測(ce)、視(shi)覺識別(bie),針(zhen)對(dui)特定計算能(neng)節約(yue)90%的耗(hao)能(neng)。
蘋芯(xin)科技副總(zong)裁江(jiang)廣(guang)展示了PIMCHIP-S300芯(xin)片(pian)的諜照。它(ta)采用28nm制程、BGA封裝、自(zi)研異構架構,12mm * 12mm大小(xiao),die做得很(hen)小(xiao),能滿足(zu)更小(xiao)型化(hua)的需求。
這款芯片擁有豐富(fu)的外設接口,單(dan)顆芯片既可(ke)(ke)以接收數據(ju),也可(ke)(ke)以本地處理數據(ju),產生簡單(dan)決策,最(zui)終產生控制,一顆就能閉環。
其(qi)高(gao)度靈活(huo)和易集成(cheng)性,有助于大幅(fu)縮(suo)短產品開(kai)(kai)發周期(qi)。蘋芯打(da)造了完整交鑰匙解決方案,底層操(cao)作系統、中間(jian)件、工(gong)(gong)具(ju)鏈都會開(kai)(kai)源,提(ti)供一鍵(jian)AI部署工(gong)(gong)具(ju)、一鍵(jian)二(er)進(jin)制生(sheng)成(cheng)和下載工(gong)(gong)具(ju)。
該(gai)存算一體AI芯片提供電(dian)池(chi)可(ke)驅動(dong)的(de)(de)低(di)功(gong)耗,未來還能(neng)結合新能(neng)源甚(shen)至(zhi)是光伏電(dian)池(chi),達到更好(hao)的(de)(de)小(xiao)型化和易部(bu)署能(neng)力(li),廣(guang)泛支持無(wu)人(ren)機、具身智能(neng)等(deng)場景(jing)應用。
蘋(pin)芯(xin)挑選了近期(qi)參(can)與MLPerf測評(ping)的競品(pin),進(jin)行綜合比(bi)較,圖表顯示,在跑多種AI算(suan)法時,蘋(pin)芯(xin)存算(suan)一體AI芯(xin)片的能(neng)耗和延遲均最低。
同時,蘋芯自研了一套開源的(de)Pstreamer異構計算(suan)框架,通(tong)過(guo)管道將不同端側通(tong)用算(suan)法和(he)算(suan)力模塊連接(jie)起來,實現聲光電不同模態信息的(de)采集、融合(he)、感知(zhi)等功能,并銜(xian)接(jie)決策(ce)與控制功能,以幫助(zhu)客(ke)戶快(kuai)速部署(shu)產品,快(kuai)速推向市場。
結語:已申請40余項海內外專利,將積極擁抱大模型生態
蘋(pin)芯(xin)科技定位自身為智(zhi)能計算(suan)架(jia)構的(de)革新者,致力于通過創新的(de)存算(suan)一體解(jie)決方(fang)案,為AI的(de)廣泛應用鋪設(she)技術高速(su)路,推動從智(zhi)能終端設(she)備到(dao)智(zhi)慧城市(shi)、從智(zhi)能醫療到(dao)具身智(zhi)能的(de)全方(fang)位變革。目前蘋(pin)芯(xin)已申請海內外專利40余項,相關(guan)知識產權和工程(cheng)經(jing)驗覆(fu)蓋(gai)從存儲器器件、電路設(she)計、算(suan)法優化到(dao)體系(xi)結構等全技術棧。
楊越(yue)在發(fa)表致辭時談道,展望(wang)未(wei)來,蘋芯科技(ji)將繼續秉承“創新引(yin)領未(wei)來,技(ji)術改(gai)變世(shi)界”的理念,積極擁抱大模型生態,以產品為核心,不斷加大研發(fa)投入,深化與高(gao)校(xiao)、科研機構的合(he)作,培養和吸(xi)引(yin)頂尖人才(cai),共(gong)同推動中(zhong)國(guo)集(ji)成(cheng)電路產業向更(geng)高(gao)層(ceng)次邁(mai)進。
包(bao)括蘋(pin)芯(xin)兩款新品在內,隨著相關技(ji)術和器件的迭代和成熟,越(yue)來越(yue)多存算一體AI芯(xin)片(pian)產品走(zou)向落地商(shang)用,為國內AI加速解(jie)決方案提供一種兼顧高能效與(yu)靈活(huo)性的新選擇(ze)。