
芯東西(公眾號:aichip001)
作者 | ?GACS 2024
芯東西9月7日(ri)報道(dao),9月6日(ri)~7日(ri),2024全球(qiu)AI芯片峰會(hui)(GACS 2024)在北京舉行。本(ben)屆峰會(hui)以「智(zhi)算紀元 共筑芯路(lu)」為主題,全面展示AI芯片產業在算力(li)、網絡、存儲、軟件(jian)、系統及應用方(fang)面的前(qian)沿技術、最新(xin)成果與(yu)落地進(jin)程。
50+位產學研嘉賓全程(cheng)密集輸出干貨,本屆(jie)峰會(hui)有超(chao)過(guo)(guo)1500位觀(guan)眾到場參會(hui),線(xian)上(shang)觀(guan)看人(ren)次累計超(chao)過(guo)(guo)210萬。
大會(hui)由智一科技(ji)旗(qi)下芯東西聯合(he)智猩(xing)猩(xing)發(fa)起主辦,以「智算(suan)紀元 共筑芯路」為主題(ti),邀請50+位(wei)嘉(jia)賓來自AI芯片(pian)、Chiplet、RISC-V、智算(suan)集(ji)群、AI Infra等領域的嘉(jia)賓與(yu)會(hui),分享AI產(chan)業最新技(ji)術(shu)創新、落地現(xian)狀、商業化挑戰(zhan)與(yu)機遇。
繼(ji)首日(ri)開幕式、數據中心AI芯片(pian)(pian)專場(chang)、Chiplet技術論壇火熱開場(chang)()后,峰會第二(er)天演講繼(ji)續輸出密集干貨,并正(zheng)式公布「2024年(nian)度(du)中國智算集群解(jie)決方案(an)企(qi)業(ye)TOP 20」、「2024年(nian)度(du)中國AI芯片(pian)(pian)新銳企(qi)業(ye)TOP 10」AiiP AI生產力創(chuang)新先鋒企(qi)業(ye)榜單(dan)。
▲智一科技聯(lian)合創始人、智車(che)芯產媒矩陣總編輯(ji)張國仁(ren)正式(shi)公布AiiP榜單
一、AI之外,近存計算斗不過存算分離
上午主(zhu)會場舉行(xing)的(de)AI芯片(pian)(pian)架(jia)構創新專場期間,北(bei)京(jing)超弦存(cun)(cun)儲器研(yan)究院首席科學家戴(dai)瑾(jin)進(jin)行(xing)了一場信息滿載的(de)存(cun)(cun)內計(ji)算主(zhu)題演講。在回顧芯片(pian)(pian)級(ji)、機架(jia)級(ji)存(cun)(cun)算分離與(yu)近存(cun)(cun)計(ji)算的(de)斗爭后,他拋出結(jie)論:AI之外,近存(cun)(cun)計(ji)算斗不過存(cun)(cun)算分離。
天量的AI模型參(can)數帶來無盡的帶寬要求,存(cun)算分離架構的帶寬、功耗、時(shi)延(yan)會嚴重制約系統性能,嚴重降低硬件的費效比(bi)。涉及HBM、3D封裝等的近存(cun)計算,以及存(cun)內計算,成(cheng)為必需品。
目前做(zuo)存(cun)(cun)(cun)內(nei)(nei)計(ji)(ji)(ji)算(suan)的(de)路(lu)線(xian)中,徹底借鑒人類(lei)(lei)的(de)類(lei)(lei)腦計(ji)(ji)(ji)算(suan)進展緩慢,但戴(dai)瑾認為“笨的(de)AI容(rong)易成功”。神經網絡計(ji)(ji)(ji)算(suan)中還有(you)數字(zi)引擎和(he)模擬引擎兩種路(lu)線(xian)。數字(zi)引擎把GPU、NPU或部分與內(nei)(nei)存(cun)(cun)(cun)集(ji)成在同一(yi)個芯(xin)片上,要(yao)求(qiu)存(cun)(cun)(cun)儲介質可(ke)以(yi)和(he)邏輯工(gong)藝集(ji)成;模擬引擎用(yong)存(cun)(cun)(cun)儲單元和(he)存(cun)(cun)(cun)儲陣列做(zuo)計(ji)(ji)(ji)算(suan),等效內(nei)(nei)存(cun)(cun)(cun)容(rong)量擴大16倍,但可(ke)用(yong)算(suan)法有(you)限(xian)。
▲北京超弦存儲(chu)器研究(jiu)院(yuan)首席(xi)科學家戴瑾
存內計算按介(jie)(jie)質劃分為SRAM、NOR、DRAM成熟存儲介(jie)(jie)質和MRAM、RRAM、PCRAM、FeRAM等新興存儲介(jie)(jie)質。
戴瑾稱這些存儲介質都(dou)不(bu)理想(xiang),各有優劣(lie)。如SRAM兼容邏輯工藝(yi)、速度快,但(dan)容量低、容易(yi)漏電;NOR Flash工藝(yi)成(cheng)熟(shu)、節能(neng),但(dan)無法使用先進(jin)工藝(yi)節點,且受擦寫速度和(he)擦除(chu)次數(shu)所限,只能(neng)用于推理;DRAM理論(lun)上可用于訓(xun)練和(he)推理,最大困難(nan)不(bu)在于技術,而在于產業。
新興存儲介質(zhi)(zhi)中,FeRAM存儲介質(zhi)(zhi)是鐵電(dian)材料。戴瑾(jin)認為(wei)(wei),這是新興存儲中唯(wei)一(yi)容量可(ke)能超過DRAM且速度、功(gong)耗性能相對好的介質(zhi)(zhi),應該可(ke)以在存算一(yi)體中取代(dai)DRAM,作為(wei)(wei)一(yi)種(zhong)非(fei)易失(shi)存儲或存內計(ji)算介質(zhi)(zhi)都很有吸引力。
比新興存(cun)儲更新的(de)(de)是2T0C DRAM。在戴(dai)瑾看來,這是看得見的(de)(de)存(cun)儲技術中最理想的(de)(de)存(cun)內計算介質。2T0C DRAM分讀寫兩個MOS,利用讀晶體(ti)管的(de)(de)寄生電容做存(cun)儲。其最大的(de)(de)好處(chu)是做多(duo)bit更為簡單、直接,速度不遜于(yu)DRAM,能(neng)做到無限次擦寫、功耗很低,但唯(wei)一(yi)的(de)(de)不確定(ding)性是IGZO材料(liao)在半(ban)導(dao)體(ti)行業尚未徹底應用。
二、突破有效算力天花板,可重構、存算一體、類腦智能是未來
隨著AI PC等邊緣(yuan)端推理(li)需求(qiu)(qiu)增長,珠(zhu)海芯動力(li)創始人兼CEO李原相信,未來可重構芯片將(jiang)成為(wei)主(zhu)流。他認為(wei)性(xing)價比已成為(wei)邊緣(yuan)計算的核心要求(qiu)(qiu),但性(xing)能和(he)TOPS并(bing)非直接掛鉤(gou),模型在Prefill和(he)Decode階段的計算類型不(bu)同(tong),也對(dui)性(xing)能有不(bu)同(tong)的要求(qiu)(qiu)。針對(dui)這一特(te)點,珠(zhu)海芯動力(li)推出(chu)了可重構并(bing)行處理(li)器架構(RPP)。
RPP基于數據流架構,兼容CUDA指令集,融合了GPU和NPU的優勢。RPP第(di)一代產品算力可達(da)(da)32TOPS,DRAM帶寬達(da)(da)59GB/s,具有性(xing)能高、面(mian)積效(xiao)率高、功耗(hao)低靈(ling)活(huo)性(xing)強(qiang)的特(te)點(dian),FOStrip先進封裝工藝將芯(xin)片面(mian)積和厚度縮小(xiao)至(zhi)原(yuan)來的1/3。測試中,其計算機視(shi)覺和信號(hao)處理(li)性(xing)能都較(jiao)同類(lei)產品有較(jiao)大提升(sheng),以14nm工藝達(da)(da)到(dao)甚至(zhi)超(chao)越了英偉達(da)(da)A100芯(xin)片的功耗(hao)。
億鑄科技創始人、董事長兼CEO熊大(da)鵬認為(wei)(wei),AI芯片架構創新將開(kai)啟大(da)算力第二增長曲(qu)線。如今摩爾(er)定律(lv)面臨挑戰,以計算單元(yuan)為(wei)(wei)中(zhong)心(xin)的已到(dao)達(da)天花板,將來AI芯片一(yi)定是(shi)以存儲單元(yuan)為(wei)(wei)中(zhong)心(xin)。
要突破有效算力(li)的天花板有兩個路徑(jing):芯片(pian)內,采用存算一體(ti)、先進封(feng)裝技(ji)術(shu)(shu)(shu),減少數據搬運、傳輸延(yan)遲;芯片(pian)間,采用高速(su)互連(lian)和Chiplet技(ji)術(shu)(shu)(shu)、硅光子技(ji)術(shu)(shu)(shu)以及(ji)類似于NVLink及(ji)NVSwitch的互連(lian)技(ji)術(shu)(shu)(shu),提供高帶寬(kuan)和低時延(yan)。
億鑄(zhu)科技于2023年首次提(ti)(ti)出存算(suan)一體超異(yi)構架(jia)構,并(bing)致力于通過基于新型存儲介質,提(ti)(ti)供高性價(jia)比,高能效比的AI大算(suan)力芯片。
▲億鑄科技創(chuang)始(shi)人、董(dong)事長兼CEO熊大(da)鵬(peng)
時識科(ke)技(ji)創始人兼CEO喬寧談道(dao),類(lei)腦智能(neng)被認為(wei)是可(ke)以打破硅制程限制、解決算(suan)力(li)瓶頸的未來技(ji)術之一。從(cong)生物腦獲得啟發(fa)的類(lei)腦感知、類(lei)腦計算(suan),均比傳統(tong)計算(suan)方式效能(neng)更高(gao)。生物系統(tong)通過累積性變化(hua)(hua)檢測并(bing)轉化(hua)(hua)為(wei)脈沖,以優(you)化(hua)(hua)帶寬使用,動態相機(ji)也采用類(lei)似原理(li),以低功耗(hao)方式捕捉(zhuo)光強(qiang)變化(hua)(hua)。類(lei)腦計算(suan)芯片是基于脈沖做計算(suan)的系統(tong),脈沖就(jiu)是數(shu)字傳輸(shu)和計算(suan)的載體。
時(shi)識科技已經形成了事(shi)件(jian)相(xiang)機(ji)(即類腦傳感器(qi))、類腦處理器(qi)、感算(suan)一(yi)體(ti)動態視覺(jue)智能SoC三大產品矩(ju)陣。類腦視覺(jue)目(mu)前最大的關注點是手機(ji)后攝(she)的高(gao)幀率(lv)成像(xiang)(xiang)應(ying)用。DVS事(shi)件(jian)相(xiang)機(ji)通(tong)過模擬人類視網膜,在電路層面做出根本性改變,來突破全局(ju)快門對相(xiang)機(ji)成像(xiang)(xiang)的幀率(lv)限制。通(tong)過對DVS事(shi)件(jian)相(xiang)機(ji)數據做處理,可以達到等效(xiao)高(gao)幀成像(xiang)(xiang)的效(xiao)果。另外一(yi)個是XR領(ling)域眼(yan)(yan)動追蹤,由于DVS只對光強變化作(zuo)出反應(ying),生成稀疏點云數據,具有(you)超低功(gong)耗、高(gao)動態范圍(wei)、超低延遲等優勢,尤其超低功(gong)耗性能在眼(yan)(yan)動追蹤領(ling)域領(ling)先(xian)。
隨(sui)著數據量和(he)(he)算(suan)(suan)(suan)力的(de)暴增與(yu)(yu)算(suan)(suan)(suan)法的(de)提升(sheng),計(ji)算(suan)(suan)(suan)市場對(dui)可(ke)定制化(hua)、低成本、高安全性和(he)(he)高隱(yin)私性的(de)需求日益提升(sheng)。對(dui)此,2023年成立(li)的(de)鋒(feng)行(xing)致遠致力于研發存(cun)算(suan)(suan)(suan)一體的(de)邊(bian)緣計(ji)算(suan)(suan)(suan)模組與(yu)(yu)解決(jue)方(fang)案,可(ke)實現(xian)大模型算(suan)(suan)(suan)力加速。據鋒(feng)行(xing)致遠創始人兼CEO孫唐分(fen)享,該公司已擁(yong)有(you)面向PC、工(gong)作(zuo)站、服務器和(he)(he)分(fen)布式集(ji)群(qun)的(de)各類存(cun)算(suan)(suan)(suan)一體產品。
鋒(feng)行致遠的(de)產(chan)品整(zheng)合(he)了存(cun)儲(chu)控制(zhi)器與AI推理加(jia)(jia)速(su)能力。其SSD內置算力,降(jiang)低(di)主機負載和整(zheng)體(ti)功耗(hao),也具備高保密性,可(ke)(ke)運(yun)用(yong)于AI PC加(jia)(jia)速(su)、大模型(xing)推理加(jia)(jia)速(su)、訓推一體(ti)加(jia)(jia)速(su)等場景;GPU直通方(fang)案(an)可(ke)(ke)實(shi)現(xian)對(dui)數據(ju)吞吐的(de)加(jia)(jia)速(su)達(da)50%-300%,更(geng)通過共享內存(cun)降(jiang)低(di)能耗(hao)。針對(dui)AI推理加(jia)(jia)速(su),其端到端應用(yong)平均效(xiao)率超英(ying)偉(wei)達(da)NX平臺2倍,平均功效(xiao)比存(cun)算分離方(fang)案(an)提升3.7倍,還兼容多種框架。
▲鋒行(xing)致遠創始(shi)人兼CEO孫(sun)唐
在PhySim資深產品(pin)工程師黃建偉看來(lai),以先(xian)進(jin)(jin)封(feng)(feng)裝(zhuang)(zhuang)技術為(wei)基礎(chu)的(de)3D IC和Chiplet技術,是后摩爾(er)時代的(de)必然選擇。然而,SIP/2.5D/3D等先(xian)進(jin)(jin)封(feng)(feng)裝(zhuang)(zhuang)復雜(za)的(de)制造(zao)工藝和嚴苛的(de)設計(ji)要(yao)(yao)求,會導致材料(liao)、設備、涉(she)及開發(fa)的(de)生產成本大(da)幅增加,同時這些先(xian)進(jin)(jin)封(feng)(feng)裝(zhuang)(zhuang)仍面臨散熱、制造(zao)工藝、成本上升等挑戰,需(xu)要(yao)(yao)專門的(de)仿真工具。
針(zhen)對多物(wu)理場(chang)仿(fang)真(zhen)場(chang)景,PhySim自研(yan)了一體化解決方案,包括熱仿(fang)真(zhen)工具(ju)TurboT、信號(hao)完整性(xing)仿(fang)真(zhen)軟件ACEM、電(dian)源(yuan)完整性(xing)仿(fang)真(zhen)軟件Physim-ET等(deng)產品,能(neng)夠實現(xian)高性(xing)能(neng)GPU加速,實現(xian)數倍甚至數十倍的效率(lv)提升,幫(bang)助設計人員定(ding)位(wei)溫度熱點優化設計。
▲PhySim資深產品工(gong)程師(shi)黃(huang)建偉
AI發展對芯(xin)片良率(lv)、延(yan)遲、高熱問題提(ti)出更(geng)高要求,業界正在探索更(geng)有效的芯(xin)片互聯技術,如分離Computing Die和IO Die、降低PCIe等傳(chuan)統架(jia)構延(yan)遲、推動新標準支持AI應用。
UCIe作為推(tui)動芯片之間高(gao)效(xiao)通信的(de)新標(biao)準應運而生(sheng)。UCIe提供了先進(jin)封裝(zhuang)和(he)標(biao)準封裝(zhuang)兩種(zhong)解(jie)決方案,其中先進(jin)封裝(zhuang)因(yin)具有兼容性和(he)增(zeng)加通道數(shu)有利于高(gao)速數(shu)據傳輸,適(shi)用(yong)于追求更高(gao)帶寬(kuan)的(de)應用(yong),標(biao)準封裝(zhuang)密度較低適(shi)合產能(neng)受限的(de)情(qing)況。
乾(qian)瞻(zhan)科(ke)技(ji)產(chan)品高(gao)級總監曹澤豪透露道(dao),目前他們已經在5nm和(he)4nm的技(ji)術節點上面向大(da)客戶形成(cheng)量產(chan),3nm已經回片,同時正在將UCIe 1.1和(he)1.0版(ban)本(ben)向2.0版(ban)本(ben)遷移。
三、加速邊緣與端側大模型落地,AI芯片如何做出極致性價比?
在下午舉行的(de)邊緣(yuan)/端側(ce)AI芯片專場,后(hou)摩(mo)智能聯(lian)合創始(shi)人、產品副總裁信曉旭(xu)分享(xiang)說(shuo),大模型(xing)已從“上新品”進(jin)入“強應(ying)用”階段,中國的(de)優勢(shi)在應(ying)用創新,而應(ying)用創新的(de)機(ji)會在邊緣(yuan)側(ce)。目前AI芯片的(de)痛(tong)點已經轉(zhuan)變為內存(cun)訪問效率低(di),存(cun)算一體架構憑借低(di)成本、低(di)功耗、低(di)延時的(de)優勢(shi),適配了(le)邊端側(ce)AI的(de)需求。
后(hou)(hou)摩智能一直在(zai)探(tan)索(suo)存(cun)算(suan)(suan)一體技術(shu),過去2年推(tui)出并量產了(le)基于首代“天樞”架構(gou)的H30和M30邊端芯片(pian),即使在(zai)落后(hou)(hou)一代工藝節點的情況下,能效比仍具有(you)2倍的優勢,這是存(cun)算(suan)(suan)一體架構(gou)帶來的收(shou)益。
該(gai)公司(si)已提供(gong)從芯(xin)片到終端的(de)完整解決(jue)方案,信曉(xiao)旭說,后摩新一(yi)代芯(xin)片將(jiang)基于(yu)“天(tian)璇”架構,計算效率將(jiang)提升20%,對大語言(yan)模(mo)型(xing)/視覺語言(yan)模(mo)型(xing)、端邊(bian)場(chang)景進行優(you)化,更具(ju)易用性(xing),明(ming)年就將(jiang)問(wen)世(shi)。
▲后(hou)摩智能聯(lian)合創始人、產品副總裁信曉(xiao)旭(xu)
隨(sui)著(zhu)大模型推動物理世界的智(zhi)能化演進,更多的應用將在邊緣(yuan)側完成。大模型使邊緣(yuan)AI場(chang)景(jing)面臨(lin)新(xin)(xin)的算(suan)力(li)(li)挑戰(zhan):算(suan)力(li)(li)需求大、帶寬要求高、計算(suan)擴展性(xing)強(qiang)。云天勵飛副總裁、芯(xin)片業務線總經理李愛軍談(tan)道(dao),國產工藝邊緣(yuan)AI芯(xin)片要應對挑戰(zhan),架構創新(xin)(xin)是關(guan)鍵。
面向新的(de)(de)(de)邊(bian)緣AI計算(suan)場景,云天勵飛研發國內(nei)首(shou)顆基于(yu)國產(chan)工(gong)藝Chiplet系列化邊(bian)緣AI芯片(pian),采(cai)用(yong)“算(suan)力(li)積木”的(de)(de)(de)理(li)念,設(she)計了D2D Chiplet/C2C Mesh大(da)模型推理(li)架構,從芯片(pian)設(she)計、制程工(gong)藝、基板選擇到封裝測試均用(yong)國產(chan)技術,算(suan)力(li)覆蓋8TOPS~256TOPS,滿足大(da)模型落(luo)地的(de)(de)(de)個性化需求(qiu),可應(ying)用(yong)于(yu)各類邊(bian)緣場景,并且工(gong)具鏈與軟件(jian)棧統一,算(suan)法的(de)(de)(de)部署落(luo)地更便捷(jie)。
他(ta)預告說,云天勵飛后續將發布基于國產工藝的(de)大模型邊(bian)緣(yuan)推理一體機,提(ti)供更有性(xing)價比的(de)邊(bian)緣(yuan)算力。
▲云天勵飛副總裁(cai)、芯片(pian)業務線總經理李愛軍
據安謀(mou)科(ke)技產(chan)品(pin)總監楊磊分享,邊(bian)緣(yuan)(yuan)側(ce)大模(mo)型部署(shu)的(de)載體包括AI手機、AI PC、智能(neng)(neng)汽車、機器人等,鑒于這些設備(bei)對(dui)成(cheng)本、功耗及散熱的(de)高(gao)度敏感性(xing),100億參(can)數規模(mo)以下的(de)大模(mo)型被視為(wei)邊(bian)緣(yuan)(yuan)側(ce)部署(shu)的(de)理想選(xuan)擇(ze)。為(wei)實現邊(bian)緣(yuan)(yuan)側(ce)部署(shu)的(de)最高(gao)效(xiao)率(lv),異構計算(suan)方案脫穎而出,它(ta)能(neng)(neng)夠充分挖掘(jue)并利(li)用邊(bian)緣(yuan)(yuan)側(ce)設備(bei)的(de)計算(suan)能(neng)(neng)力,從而達(da)到性(xing)價比的(de)最優化。
為了(le)(le)(le)應對大(da)模(mo)型(xing)在(zai)邊緣(yuan)(yuan)側部署(shu)的(de)挑戰,安謀(mou)科技自研新(xin)一代“周(zhou)易(yi)”NPU通過創(chuang)新(xin)的(de)計(ji)算單(dan)元微架構(gou)(gou)設計(ji),能夠(gou)同時(shi)支持卷積神經網絡(luo)(CNN)和(he)Transformer架構(gou)(gou),在(zai)計(ji)算架構(gou)(gou)層面有效減輕了(le)(le)(le)帶寬需求,并增強(qiang)了(le)(le)(le)算力(li)的(de)可(ke)擴展性(xing)。此外,“周(zhou)易(yi)”NPU還能夠(gou)通過多核擴展,實現更強(qiang)大(da)的(de)計(ji)算能力(li),進一步提(ti)升了(le)(le)(le)邊緣(yuan)(yuan)側大(da)模(mo)型(xing)部署(shu)的(de)靈(ling)活性(xing)和(he)效能。
智(zhi)芯科(ke)(ke)從2019年開始(shi)研究基于(yu)SRAM的存算一(yi)體(ti)(ti)芯片,已有(you)大(da)量專利積累(lei)。智(zhi)芯科(ke)(ke)創始(shi)人兼CEO顧渝驄認為(wei),具(ju)身(shen)智(zhi)能是其中(zhong)最(zui)大(da)的落地場景(jing)之一(yi),具(ju)身(shen)智(zhi)能對低(di)延時(shi)、低(di)功耗都(dou)有(you)嚴苛的要求,因此(ci)有(you)必要配備高(gao)能效(xiao)的存算一(yi)體(ti)(ti)AI芯片。
存算一體芯(xin)片(pian)的主流技術路徑包括DRAM、SRAM、Flash、Emerging NVM等(deng)。其中,SRAM具有讀寫速度(du)快、能(neng)效比(bi)高、工藝成熟和可(ke)集成性佳的優勢,可(ke)快速無限次(ci)讀寫,很(hen)適合Transformer的自注意(yi)力機制。
智(zhi)芯(xin)科(ke)基于(yu)SRAM的模數混合(he)存內計算(suan)芯(xin)片(pian),精度高、量產一致性(xing)高,并能(neng)夠(gou)進一步降低功耗。硬件之(zhi)外(wai),智(zhi)芯(xin)科(ke)還打造了通用性(xing)、易用性(xing)較強的軟件生態。據顧(gu)渝(yu)驄(cong)透露,未(wei)來(lai)智(zhi)芯(xin)科(ke)將推出面(mian)向(xiang)具身智(zhi)能(neng)感知到大算(suan)力邊(bian)緣服務器的眾多產品,覆(fu)蓋大模型、機器人(ren)和自動駕(jia)駛等場景。
▲智芯科(ke)創始人兼(jian)CEO顧渝(yu)驄(cong)
大模(mo)型認(ren)知智(zhi)能(neng)(neng)已呈現(xian)初步(bu)的(de)智(zhi)能(neng)(neng)涌現(xian),但很多都是單點(dian)的(de)能(neng)(neng)力(li)。聆思(si)科(ke)技副總(zong)裁徐燕松(song)強調了系統集成的(de)重要(yao)性,對設備廠商而言,為大而全的(de)AI單點(dian)能(neng)(neng)力(li)找(zhao)到(dao)中間態是主要(yao)命題(ti)。算(suan)(suan)法(fa)取決于場景,端側(ce)模(mo)型的(de)算(suan)(suan)法(fa)應用會重新定義AI芯(xin)片(pian)需(xu)求,因此需(xu)要(yao)將算(suan)(suan)法(fa)算(suan)(suan)力(li)一體化(hua)。
聆思科(ke)技致力(li)于打(da)造(zao)智(zhi)能終端人機交互(hu)入口芯片(pian),進行(xing)了(le)云(yun)-端-芯算(suan)法算(suan)力(li)一體化(hua)布局,提(ti)供自(zi)主(zhu)知識產權AI芯片(pian)、高性能IoT芯片(pian),并以(yi)模(mo)組成(cheng)本最(zui)優來設計芯片(pian),能夠以(yi)單(dan)芯片(pian)滿足(zu)客戶在性能、價格兩方面的需(xu)求(qiu)平衡。同時其端側內置超100項行(xing)業頂(ding)級AI算(suan)法,還能直連AI云(yun)平臺,與星火大模(mo)型(xing)形成(cheng)聯(lian)動(dong)。
▲聆思科技副(fu)總(zong)裁徐(xu)燕(yan)松
近(jin)年(nian)來(lai),隨著智慧城市(shi)的推進,算(suan)(suan)法(fa)在公安(an)、金(jin)融、安(an)防及零售(shou)等(deng)多個(ge)領域的應用逐漸增多,基(ji)于此,極視角(jiao)(jiao)科技打(da)造了算(suan)(suan)法(fa)商城。極視角(jiao)(jiao)科技聯合創(chuang)始人&高級副總裁劉(liu)若水談(tan)道,在保證算(suan)(suan)法(fa)質量方面,極視角(jiao)(jiao)的優勢是數據來(lai)源豐(feng)富、內部算(suan)(suan)法(fa)團隊會提供底層算(suan)(suan)法(fa)能力、40萬開發者(zhe)通過PK評測保障(zhang)算(suan)(suan)法(fa)最(zui)優。
極視角科(ke)技(ji)已(yi)打造AI極星和(he)AI極光平(ping)臺。AI極星平(ping)臺有(you)標(biao)準的(de)算(suan)法部署、硬件(jian)配(pei)置的(de)功能,支持統一算(suan)法接(jie)入(ru)標(biao)準,可以納入(ru)符合接(jie)口規(gui)范(fan)的(de)第(di)三方算(suan)法,整個系統部署時間在1個小時左(zuo)右;AI極光則側重于算(suan)法的(de)輕量化部署。
▲極(ji)視角科技聯合創始人&高級副總(zong)裁(cai)劉若水
視(shi)海芯圖創始人兼董(dong)事長許達文(wen)分(fen)享說,機器(qi)(qi)人需要同時運行(xing)感(gan)知(zhi)、判定、決(jue)策和(he)(he)執行(xing)任務,對算力和(he)(he)能耗要求嚴苛(ke),視(shi)覺語言(yan)模型更是帶(dai)來了新的挑戰。現(xian)在(zai)的機器(qi)(qi)人需要一款加速圖像(xiang)融合處(chu)理傳(chuan)統算法和(he)(he)AI算法的邊緣端芯片。
機器人(ren)感(gan)知(zhi)一方面作為VLM大模型的輸入,另一方面為機器人(ren)SLAM建(jian)圖(tu)及位姿(zi)估計(ji)。視海芯圖(tu)推出了SH1210視覺芯片,整(zheng)合了CPU、NPU、ISP、3DCP、特征(zheng)提(ti)取模塊和(he)多(duo)傳感(gan)融合模塊,讓應用和(he)算(suan)法能以(yi)最(zui)大化的利用率映射到硬(ying)件。
其圖像融合架構實現了ISP每個處理步(bu)驟的(de)可(ke)控,還可(ke)通過神經網(wang)絡處理識別關(guan)鍵目標(biao)和區域,進行針對性的(de)圖像增強,實現能效提升。采(cai)用SH1210的(de)RGB-D相機(ji)能夠(gou)高效融合深度(du)空間(jian)數據和RGB信息,完善機(ji)器人的(de)視覺信息。
▲視海(hai)芯圖(tu)創(chuang)始人兼董事長(chang)許(xu)達文(wen)
富瀚微資(zi)深市場(chang)總監(jian)馮曉光對(dui)邊(bian)緣(yuan)視(shi)頻AI芯(xin)片進(jin)行復盤與(yu)展望。邊(bian)緣(yuan)視(shi)頻AI芯(xin)片被設(she)計用于攝像(xiang)機(ji)、錄像(xiang)機(ji)等(deng)邊(bian)緣(yuan)設(she)備,進(jin)行視(shi)頻內容分析和處理(li)。Transformer將視(shi)頻處理(li)帶入2.0時代,也為AI芯(xin)片帶來新的架構變(bian)化(hua)。區別于傳(chuan)統的CNN網絡,Transformer大模(mo)型推(tui)理(li)過(guo)程中的參數讀(du)取帶來系統帶寬需求,計算過(guo)程中的矩陣相乘則帶來主動加速需求。
馮曉光認為,未來端側AI芯(xin)片不(bu)會呈(cheng)某一個架(jia)構的統一,而會呈(cheng)金(jin)字(zi)塔(ta)形態(tai)(tai)。其中,0.5TOPS以(yi)(yi)下算力(li)(li)的低端高性價(jia)比(bi)芯(xin)片,將覆(fu)蓋(gai)80%以(yi)(yi)上的應用;支持輕量化Transformer、AI ISP的中端主流(liu)AI芯(xin)片主要(yao)是NPU,算力(li)(li)1~8TOPS;高端的邊緣(yuan)AI芯(xin)片可能以(yi)(yi)GPGPU架(jia)構為主,算力(li)(li)超20TOPS,可運行邊緣(yuan)多模態(tai)(tai)大模型。
▲富瀚微資深市(shi)場總監馮(feng)曉光(guang)
結語:AI芯片企業承壓前行
隨(sui)著大(da)模(mo)型革命席(xi)卷全球,算(suan)力需求(qiu)達到(dao)新高,推動云(yun)邊端AI芯片迭代與進化。在數據(ju)爆炸式增長、工藝(yi)逼近物(wu)理極限、國(guo)際形(xing)勢復雜(za)多(duo)變三朵烏云(yun)下,許(xu)多(duo)AI芯片企業低調務實地承壓前行,積極備戰生成式AI浪潮(chao)帶來(lai)的時(shi)代機遇。
從2018年3月舉辦(ban)國(guo)內首(shou)場(chang)AI芯片產業(ye)峰會(hui)(hui)至今,七年來,除了2021年受(shou)疫情影(ying)響外,全球AI芯片峰會(hui)(hui)基本上保持(chi)每年一屆(jie)的節奏(zou),邀請近150位大(da)咖分享前沿進(jin)展(zhan)和行業(ye)洞見,成為了解國(guo)內外AI芯片發展(zhan)動(dong)態的重要窗口,也(ye)是目前國(guo)內在AI芯片領域里最具影(ying)響力(li)的行業(ye)峰會(hui)(hui)。
據(ju)智(zhi)(zhi)一科技(ji)聯合創始人、CEO龔倫常透露,智(zhi)(zhi)一科技(ji)旗下(xia)硬科技(ji)知(zhi)識分享社區智(zhi)(zhi)猩(xing)猩(xing)將聯合智(zhi)(zhi)能產業新媒體智(zhi)(zhi)東西、智(zhi)(zhi)能汽車(che)產業新媒體車(che)東西,11月份在上海舉行今年(nian)的第二場生成式AI大(da)會,12月份舉辦中國端到端自(zi)動駕駛峰會,歡迎參會交(jiao)流。