
AI芯片主(zhu)要承擔推(tui)(tui)斷(duan)任(ren)務(wu),通過將終(zhong)(zhong)端設(she)備(bei)上的(de)傳(chuan)感器(qi)(麥克(ke)風陣列(lie)、攝像(xiang)頭等(deng))收集的(de)數據(ju)代入訓練(lian)好的(de)模型推(tui)(tui)理得出推(tui)(tui)斷(duan)結(jie)果。由于終(zhong)(zhong)端場景多(duo)種多(duo)樣各不(bu)相同,對于算力(li)和能(neng)耗(hao)等(deng)性能(neng)需(xu)求(qiu)也有(you)大有(you)小,應(ying)用于終(zhong)(zhong)端芯片需(xu)要針(zhen)對特殊(shu)場景進(jin)行(xing)針(zhen)對性設(she)計(ji)以(yi)實現最優解方案,最終(zhong)(zhong)實現有(you)時間關聯度的(de)三維處理能(neng)力(li),這(zhe)將實現更深層次的(de)產業(ye)鏈(lian)升(sheng)(sheng)級,是(shi)設(she)計(ji)、制造、封測和設(she)備(bei)材(cai)料(liao),以(yi)及軟件環境的(de)全(quan)產業(ye)鏈(lian)協同升(sheng)(sheng)級過程。
相比于傳(chuan)統(tong)(tong)CPU服務(wu)器(qi)(qi)(qi),在提(ti)供相同算(suan)(suan)力(li)(li)情況下,GPU服務(wu)器(qi)(qi)(qi)在成(cheng)本、空間占用和能耗分別為傳(chuan)統(tong)(tong)方案的(de)1/8、1/15和1/8。 人工(gong)智能服務(wu)器(qi)(qi)(qi)是AI算(suan)(suan)力(li)(li)基礎設施(shi)的(de)主要角色,在服務(wu)器(qi)(qi)(qi)中滲透率不斷提(ti)升。 L3自(zi)動駕駛(shi)算(suan)(suan)力(li)(li)需求(qiu)為30-60TOPS,L4需求(qiu)100TOPS以(yi)上,L5需求(qiu)甚至(zhi)達1,000TOPS,GPU算(suan)(suan)力(li)(li)需求(qiu)提(ti)升明顯(xian),芯片主要向(xiang)著(zhu)大算(suan)(suan)力(li)(li)、低功耗和高制程三(san)個方向(xiang)發展。
本(ben)期的(de)智能內參,我們(men)推薦華西證券的(de)報(bao)告《AI領強算力時代,GPU啟(qi)新(xin)場(chang)景(jing)落(luo)地》,解(jie)讀(du)GPU三大(da)落(luo)地場(chang)景(jing)和國產GPU最新(xin)的(de)發展(zhan)趨勢。
來源 華西證券
原標題:
《AI領強算力時代,GPU啟新場景落地》
作者:孫遠峰?等
一、算力時代,GPU開拓新場景
廣義上講只要能夠運行人工智能算法的芯片都叫作 AI 芯片。但是通(tong)常意義上的(de)(de) AI 芯(xin)片指的(de)(de)是針對人(ren)工智能算法(fa)做(zuo)了(le)特殊加速設計的(de)(de)芯(xin)片。
AI芯片(pian)也被(bei)稱為AI加速器或(huo)計(ji)算卡,即(ji)專門用于處(chu)理(li)人工(gong)智能應(ying)用中的大量計(ji)算任務(wu)的模(mo)塊(其他非計(ji)算任務(wu)仍由CPU負責)。到目前位(wei)置(zhi),AI芯片(pian)算力(li)發(fa)展走(zou)過(guo)了三個階段:
第一階段: 因為芯片算力不足,所以神經網絡沒有受到重視;
第二階段:通用芯片CPU的算力大幅提升,但仍然無法 滿足神經網絡的需求;
第三階段: GPU和和新架構的AI芯片推進人工智能落地。
▲AI芯片算力發展階段(duan)
目前,GPT-3模型已(yi)入選了(le)《麻省理工科技評論》2021年“十大(da)突破性(xing)技術。 GPT-3的(de)(de)模型使用的(de)(de)最大(da)數(shu)據集在處(chu)理前容量達到了(le)45TB。根據 OpenAI的(de)(de)算(suan)力(li)統計單位(wei)petaflops/s-days,訓練AlphaGoZero需要1800-2000pfs-day,而GPT-3用了(le)3640pfs-day。
▲自然語(yu)言模(mo)型/會(hui)話式AI平臺(tai)
AI運算指以“深度學習” 為代表的神經網絡算法,需要系統能夠高效處理大量非結構化數據(文本、視頻、圖像、語音等) 。需要硬件具有高效的線性代數運算能力,計算任務具有:單(dan)(dan)位(wei)計算(suan)(suan)任務簡單(dan)(dan),邏(luo)輯控制難度要求低(di)(di),但并行運(yun)算(suan)(suan)量大、參(can)數多的特點。對于芯片(pian)的多核并行運(yun)算(suan)(suan)、片(pian)上存儲、帶寬、低(di)(di)延時的訪(fang)存等(deng)提出(chu)了較高的需求。
自2012年以來,人(ren)工智能訓練任務(wu)所(suo)需求的算力(li)每 3.43 個月就會翻倍,大大超越了芯(xin)片產業長期存在的摩爾定律(lv)(每 18個月芯(xin)片的性能翻一倍)。針對不同(tong)應用場景,AI芯(xin)片還應滿足(zu):對主流AI算法框架兼容、可編程(cheng)、可拓展、低功耗、體積及價格等需求。
從技術架構(gou)來看,AI芯(xin)片(pian)(pian)主要(yao)分為(wei)圖形(xing)處理器(GPU)、現場可編程(cheng)門(men)陣(zhen)列(FPGA)、專用集成(cheng)電路(lu)(ASIC)、類腦芯(xin)片(pian)(pian)四大類。其中,GPU是較為(wei)成(cheng)熟的(de)通用型人工智能芯(xin)片(pian)(pian),FPGA和ASIC則是針對人工智能需(xu)求特征的(de)半定制和全定制芯(xin)片(pian)(pian),類腦芯(xin)片(pian)(pian)顛覆(fu)傳統馮諾依曼架構(gou),是一種模擬人腦神經元結構(gou)的(de)芯(xin)片(pian)(pian),類腦芯(xin)片(pian)(pian)的(de)發展尚處于起步階(jie)段。
▲三種技術架構AI芯片類型比較
2019年(nian)(nian)全球人工(gong)智(zhi)(zhi)能芯(xin)(xin)片(pian)市(shi)場規(gui)模為110億美(mei)元(yuan)。隨著人工(gong)智(zhi)(zhi)能技術日趨成熟(shu),數字化(hua)基礎設施不(bu)斷(duan)完(wan)善,人工(gong)智(zhi)(zhi)能商業化(hua)應用將加落地(di),推(tui)動(dong)AI芯(xin)(xin)片(pian)市(shi)場高速(su)增長,預計2025年(nian)(nian)全球人工(gong)智(zhi)(zhi)能芯(xin)(xin)片(pian)市(shi)場規(gui)模將達到726億美(mei)元(yuan)。
▲2019-2025年全球(qiu)人工智能芯片市場規(gui)模及(ji)預測(億美元(yuan))
二、GPU 下游三大應用市場
GPU其實是由硬件實現的一組圖形函數的集合,這些函數主要用于繪制各種圖形所需要的運算。這些和像素,光影處理,3D坐標變換等相關的運算由GPU硬件加速來實現。圖形運算的特點是大量同類型數據的密集運算——如圖形數據的矩陣運算,GPU的微架構就是面向適合于矩陣類型的數值計算而設計的,大量重復設計的計算單元,這類計算可以分成眾多獨立的數值計算——大量數值運算的線程,而且數據之間沒有像程序執行的那種邏輯關聯性。
GPU微架構的設計研發是非常重要的,先進優秀的微架構對GPU實際性能的提升是至關重要的。目前市面上(shang)有非(fei)常豐(feng)富(fu)GPU微架構,比如Pascal、Volta、Turing(圖靈)、Ampere(安培),分別發布(bu)于(yu) 2016 年、2017 年、2018 年和2020年,代表著(zhu)英(ying)偉達 GPU 的最高工藝水(shui)平。
GPU的API(Application Programming Interface)應用程序接口發揮著連接應用程序和顯卡驅動的橋梁作用。目(mu)前(qian)GPU API可以分為2大(da)陣(zhen)營(ying)和若干其他類。 2大(da)陣(zhen)營(ying)分別是微軟的(de)DirectX標(biao)準和KhronosGroup標(biao)準,其他類包括蘋果的(de)Metal API、 AMD的(de)Mantle(地幔) API、英特爾的(de)One API等。
AI芯片(GPU/FPGA/ASIC)在云端同時承擔人工智能 “訓練”和“推斷”過程,在終端主要承擔“推斷”過 程,從性能與成本來看ASIC最優。ASIC作(zuo)為專(zhuan)用芯(xin)(xin)片,算力與功耗在(zai)通用芯(xin)(xin)片GPU具有絕對(dui)(dui)優(you)(you)勢(shi),但(dan)開發周期較長,落地較慢,需(xu)一(yi)定規(gui)模后才能體現成本(ben)優(you)(you)勢(shi)。FPGA可以看做從GPU到(dao)ASIC重點過渡方案。相對(dui)(dui)于GPU可深(shen)入到(dao)硬(ying)件級優(you)(you)化,相比ASIC在(zai)算法不(bu)斷迭(die)代演進情況下更具靈活性(xing),且開發時(shi)間更短。
從生態與落地來看,GPU占據絕對優勢,英偉達處壟斷地 位。開(kai)發(fa)者能通過英偉達(da)CUDA平臺使用軟件語(yu)言很方便地(di)開(kai)發(fa)英偉達(da)GPU實現運算加速,已被廣泛認可和普及,積累了良好的編程環(huan)境。以TPU為(wei)代表的ASIC目前(qian)主要運用在(zai)巨頭的閉(bi)環(huan)生態,FPGA在(zai)數據(ju)中(zhong)心業(ye)務中(zhong)發(fa)展較(jiao)快。
2020年(nian)(nian)GPU市(shi)場(chang)規模為(wei)254.1億美元,預(yu)計到(dao)2027年(nian)(nian)將(jiang)(jiang)達到(dao)1853.1億美元,從2021年(nian)(nian)到(dao)2027年(nian)(nian)的(de)復合(he)年(nian)(nian)增(zeng)長率(lv)為(wei)32.82%。GPU市(shi)場(chang)分(fen)為(wei)獨(du)立(li),集成和(he)混合(he)市(shi)場(chang)。2019年(nian)(nian)集成占據了GPU市(shi)場(chang)份額的(de)主(zhu)導(dao)地位(wei),但由于混合(he)處理器同時(shi)具有集成和(he)獨(du)立(li)GPU的(de)能力,因此未(wei)來混合(he)細分(fen)市(shi)場(chang)預(yu)計將(jiang)(jiang)實現最高復合(he)年(nian)(nian)增(zeng)長率(lv)。
市(shi)場(chang)分為計(ji)算機,平(ping)板電(dian)腦,智能手機,游戲機,電(dian)視等(deng)。在(zai)2019年(nian),智能手機市(shi)場(chang)占(zhan)據了全球(qiu)GPU市(shi)場(chang)份額的(de)主導地位,預(yu)(yu)計(ji)在(zai)預(yu)(yu)測(ce)期內將(jiang)繼續保持這(zhe)一趨勢。但是,由(you)于對醫療設(she)備(bei)等(deng)其他設(she)備(bei)中對小型GPU的(de)需求不斷增長(chang),預(yu)(yu)計(ji)其他領域在(zai)未來的(de)復合年(nian)增長(chang)率(lv)最高。由(you)于在(zai)設(she)計(ji)和工程應(ying)用(yong)中圖(tu)形(xing)處理器的(de)廣泛使用(yong),預(yu)(yu)計(ji)汽車應(ying)用(yong)細(xi)分市(shi)場(chang)將(jiang)在(zai)預(yu)(yu)測(ce)期內以(yi)最高的(de)復合年(nian)增長(chang)率(lv)增長(chang)。
總體來說,GPU有三大(da)應用(yong)場景:游戲(xi) 、 AI和自動駕駛
1、游戲
IDC數據(ju)顯(xian)示,2020年(nian)(nian)游(you)戲(xi)PC和顯(xian)示器的出(chu)貨(huo)量(liang)(liang)同(tong)比增長26.8%,達(da)到5500萬臺(tai)。游(you)戲(xi)筆(bi)記本電(dian)腦在2020年(nian)(nian)增長了(le)(le)創紀錄的26.9%。與PC并(bing)行(xing),游(you)戲(xi)顯(xian)示器在2020年(nian)(nian)也達(da)到了(le)(le)新的高(gao)度,與2019年(nian)(nian)相比增長了(le)(le)77%以上,出(chu)貨(huo)量(liang)(liang)達(da)到了(le)(le)1430萬臺(tai)。
IDC預計(ji)2021年(nian)(nian)游(you)(you)戲顯示器的(de)(de)銷量將(jiang)首次(ci)超過(guo)游(you)(you)戲臺式機。即使游(you)(you)戲臺式機逐漸受到青(qing)睞,游(you)(you)戲筆記本電腦(nao)的(de)(de)顯示器連接率(lv)不斷提高也意(yi)味著游(you)(you)戲監控器市場的(de)(de)五年(nian)(nian)復(fu)合年(nian)(nian)增(zeng)長(chang)率(lv)預計(ji)將(jiang)超過(guo)10%。IDC預計(ji)2025年(nian)(nian)全(quan)球銷量達到7290萬(wan),復(fu)合年(nian)(nian)增(zeng)長(chang)率(lv)為5.8%。
2、AI
移動端AI芯片市場不止于智能手機,潛在市場還包括(kuo):智能手環/手表、 VR/AR眼鏡等(deng)市場。
在邊(bian)緣計(ji)算(suan)場(chang)景(jing)(jing),AI芯片主要承擔推(tui)斷任(ren)務,通過將(jiang)終端設(she)備上(shang)的(de)傳感(gan)器(麥克風陣列、攝像頭等(deng))收(shou)集的(de)數據代入訓練好的(de)模型推(tui)理(li)得出推(tui)斷結(jie)果。由(you)于邊(bian)緣側(ce)場(chang)景(jing)(jing)多種多樣、各(ge)不相(xiang)同,對于計(ji)算(suan)硬(ying)件(jian)的(de)考(kao)量也不盡相(xiang)同,對于算(suan)力和(he)能(neng)耗等(deng)性能(neng)需(xu)求也有大(da)有小。因此應用(yong)于邊(bian)緣側(ce)的(de)計(ji)算(suan)芯片需(xu)要針對特殊場(chang)景(jing)(jing)進行(xing)針對性設(she)計(ji)以實現(xian)最優(you)的(de)解決(jue)方案。
▲不同邊緣計算(suan)場(chang)景對AI芯(xin)片性能(neng)要求
安防攝像(xiang)(xiang)頭(tou)發展經(jing)歷了(le)由模擬向數(shu)(shu)(shu)字(zi)(zi)化(hua)(hua)、數(shu)(shu)(shu)字(zi)(zi)化(hua)(hua)高清到現(xian)在的數(shu)(shu)(shu)字(zi)(zi)化(hua)(hua)智(zhi)能(neng)方向的發展,最新的智(zhi)能(neng)攝像(xiang)(xiang)頭(tou)除了(le)實現(xian)簡單(dan)的錄(lu)、 存(cun)功能(neng)外,還可以實現(xian)結(jie)構(gou)化(hua)(hua)圖像(xiang)(xiang)數(shu)(shu)(shu)據(ju)分析。安防攝像(xiang)(xiang)頭(tou)一(yi)天可產生20GB數(shu)(shu)(shu)據(ju),若將(jiang)全(quan)部數(shu)(shu)(shu)據(ju)回傳(chuan)到云數(shu)(shu)(shu)據(ju)中(zhong)心將(jiang)會(hui)對網(wang)絡(luo)帶寬(kuan)和數(shu)(shu)(shu)據(ju)中(zhong)心資源造成極大占用(yong)。
通過在(zai)(zai)(zai)攝(she)像頭(tou)終端、網(wang)絡邊(bian)緣(yuan)側(ce)加(jia)裝(zhuang)AI芯(xin)片(pian),實(shi)(shi)現對攝(she)像頭(tou)數(shu)據(ju)的本(ben)地(di)化(hua)實(shi)(shi)時處(chu)(chu)理,經(jing)過結(jie)構(gou)化(hua)處(chu)(chu)理、關鍵信(xin)息(xi)提取(qu),僅將帶(dai)有關鍵信(xin)息(xi)的數(shu)據(ju)回傳(chuan)后(hou)方(fang),將會大(da)大(da)降低(di)(di)網(wang)絡傳(chuan)輸帶(dai)寬壓力。當(dang)前(qian)主流解決(jue)方(fang)案分為:前(qian)端攝(she)像頭(tou)設備內集成AI芯(xin)片(pian)和(he)在(zai)(zai)(zai)邊(bian)緣(yuan)側(ce)采取(qu)智能服務(wu)器級產(chan)品。 前(qian)端芯(xin)片(pian)在(zai)(zai)(zai)設計上需要平衡面積、功耗、成本(ben)、可靠性等問題,最好采取(qu)低(di)(di)功耗、低(di)(di)成本(ben)解決(jue)方(fang)案(如:DSP、 ASIC);邊(bian)緣(yuan)側(ce)限制更(geng)(geng)少(shao),可以(yi)采取(qu)能夠(gou)進(jin)行更(geng)(geng)大(da)規模(mo)數(shu)據(ju)處(chu)(chu)理任務(wu)的服務(wu)器級產(chan)品(如:GPU、 ASIC)。
▲AI芯片在智能安防攝像(xiang)頭(tou)中的應(ying)用
人工(gong)智能服務(wu)(wu)器通常搭載GPU、FPGA、ASIC等(deng)加(jia)速芯片(pian),利用(yong)(yong)CPU與加(jia)速芯片(pian)的(de)組(zu)合(he)可以(yi)滿足高(gao)吞吐量互聯(lian)的(de)需求,為(wei)自然語言處理、計算(suan)機視覺、語音交互等(deng)人工(gong)智能應用(yong)(yong)場景提(ti)(ti)供(gong)強大的(de)算(suan)力(li)支持,已經(jing)成(cheng)為(wei)人工(gong)智能發展的(de)重(zhong)要支撐力(li)量相比(bi)于傳統(tong)CPU服務(wu)(wu)器,在提(ti)(ti)供(gong)相同算(suan)力(li)情況下,GPU服務(wu)(wu)器在成(cheng)本、空間占用(yong)(yong)和(he)能耗分別為(wei)傳統(tong)方案的(de)1/8、1/15和(he)1/8。
當(dang)前(qian)在云端場(chang)(chang)景下被最廣泛應用的AI芯片是英(ying)偉達的GPU,主要原(yuan)因是:強(qiang)大的并行計算能力(相比CPU)、通用性以及成(cheng)熟的開發(fa)環(huan)境。2020年全(quan)球AI服(fu)務器(qi)市(shi)(shi)場(chang)(chang)規模為122億美元,預計到2025年全(quan)球AI智能服(fu)務器(qi)市(shi)(shi)場(chang)(chang)將(jiang)達到288億美元,5年CAGR達到18.8%。
▲2020-2025年全(quan)球AI服務器行業(ye)市場規模及(ji)增速(單位:億美(mei)元(yuan))
在(zai)AI開(kai)發中(zhong),由于(yu)深度(du)學習模(mo)(mo)型(xing)開(kai)發及部(bu)署需要強(qiang)大(da)(da)算力(li)支持(chi),需要專用的(de)芯片及服(fu)務器支持(chi)。開(kai)發者如(ru)選擇自購AI服(fu)務器成本(ben)過高。通過云服(fu)務模(mo)(mo)式,采取按需租用超算中(zhong)心計(ji)算資(zi)源可極大(da)(da)降低項目(mu)期(qi)初(chu)資(zi)本(ben)投入同(tong)時也省卻了項目(mu)開(kai)發期(qi)間(jian)的(de)硬件運維費(fei)用,實現資(zi)本(ben)配置效率(lv)的(de)最大(da)(da)化提升(sheng)。
3、自動駕駛
全球自(zi)(zi)動(dong)(dong)駕(jia)駛邁入商(shang)用階段,未(wei)(wei)來可期。IDC最(zui)新發布的(de)(de)《全球自(zi)(zi)動(dong)(dong)駕(jia)駛汽(qi)車預測報(bao)告(2020-2024)》數(shu)據顯示,2024年全球L1-L5級(ji)(ji)自(zi)(zi)動(dong)(dong)駕(jia)駛汽(qi)車出(chu)貨量(liang)預計將(jiang)達(da)到約5425萬輛,2020至2024年的(de)(de)年均復合(he)增長率(CAGR)達(da)到18.3%;L1和L2級(ji)(ji)自(zi)(zi)動(dong)(dong)駕(jia)駛在2024年的(de)(de)市(shi)場份額預計分(fen)別為64.4%和34.0%。盡管目前L3-L5級(ji)(ji)自(zi)(zi)動(dong)(dong)駕(jia)駛技術的(de)(de)應用具(ju)有開(kai)拓(tuo)性(xing)意義,L1-L2級(ji)(ji)自(zi)(zi)動(dong)(dong)駕(jia)駛將(jiang)依然(ran)是未(wei)(wei)來5年內帶動(dong)(dong)全球自(zi)(zi)動(dong)(dong)駕(jia)駛汽(qi)車出(chu)貨量(liang)增長的(de)(de)最(zui)大(da)細分(fen)市(shi)場。
我國汽車市場規模不斷增長(chang),自動駕駛由(you)L2向L3過渡。中汽協數據(ju)顯示,2021年1-3月(yue),中國品牌乘(cheng)用車共銷售210.8萬輛,同比增長(chang)81.5%,占(zhan)乘(cheng)用車銷售總(zong)量(liang)的(de)41.5%,占(zhan)有(you)率比上年同期提(ti)升1.4個(ge)百分點。2020年1月(yue)份(fen)至9月(yue)份(fen),L2級智能(neng)網聯乘(cheng)用車銷售量(liang)達196萬輛,占(zhan)乘(cheng)用車總(zong)銷量(liang)的(de)14.7%。
更(geng)有部(bu)分企業加速研發(fa)L3級(ji)自動駕(jia)駛車(che)型,多地開(kai)展自動泊車(che)、自動駕(jia)駛公交車(che)、無(wu)人智能重卡(ka)等方(fang)面的(de)示范應用。到2025年,我國PA(部(bu)分自動駕(jia)駛)、CA(有條件(jian)自動駕(jia)駛)級(ji)智能網聯(lian)汽車(che)銷(xiao)量占當(dang)年汽車(che)總銷(xiao)量比例超過50%,C-V2X(以蜂窩通(tong)信為基(ji)礎(chu)的(de)移動車(che)聯(lian)網)終端新車(che)裝配(pei)率達50%。
隨(sui)著(zhu)(zhu)傳感器、車(che)載(zai)處理器等產(chan)品的(de)(de)進一(yi)步完善(shan),將(jiang)會(hui)有更多(duo)L3級(ji)車(che)型出現(xian)(xian)。而L4、L5級(ji)自(zi)動駕(jia)駛預計將(jiang)會(hui)率先在封閉園(yuan)區中的(de)(de)商(shang)用車(che)平臺上實現(xian)(xian)應用落地,更廣泛的(de)(de)乘(cheng)用車(che)平臺高級(ji)別自(zi)動駕(jia)駛,需要伴隨(sui)著(zhu)(zhu)技術、政策、基礎設(she)施建設(she)的(de)(de)進一(yi)步完善(shan),預計至少在2025年~2030年以(yi)后才會(hui)出現(xian)(xian)在一(yi)般道路上。
▲2016-2030年全球汽車市場自動駕(jia)駛滲透率預測
感知路境,短時處(chu)理海量數(shu)據。行(xing)車(che)過(guo)程中依賴雷達等傳感器對(dui)道(dao)理信息(xi)進行(xing)采(cai)集后(hou),處(chu)理器每(mei)秒需實時數(shu)據解(jie)析幾G量級(ji)數(shu)據,每(mei)秒可以產(chan)生(sheng)超過(guo) 1G 的數(shu)據。對(dui)處(chu)理器的計算量要求(qiu)較高(gao)。
自動規劃,瞬時反應保障(zhang)安全。處(chu)理分(fen)析(xi)實(shi)時數據(ju)后(hou),需要(yao)(yao)在毫秒(miao)的(de)時間精度下(xia)對行(xing)車(che)路徑、車(che)速(su)進行(xing)規劃,保障(zhang)行(xing)車(che)過程安全,對處(chu)理器的(de)計算(suan)速(su)度要(yao)(yao)求較高。
兼具技術成本優(you)勢,GPU為自動(dong)駕駛(shi)領域(yu)主流。
三、國產AI GPU走上快車道
2020年(nian)國內AI芯片行業投融(rong)資金額(e)同比(bi)增長(chang)了52.8%,2021年(nian)1月(yue)至4月(yue)的投融(rong)資事件和金額(e)均已超(chao)過去年(nian)全年(nian),資本對國內半導體、集成電路領域(yu)投資高漲。
從熱門(men)領(ling)域(yu)來(lai)看,人工智能領(ling)域(yu)是2020年資本(ben)青睞度較高的(de)細分賽(sai)道(dao)之一。2020年資本(ben)投資的(de)主(zhu)要是相對(dui)成熟且已獲得1-2輪甚至(zhi)2輪以上融(rong)資的(de)AI芯片企業。
▲AI芯片(pian)行業公司成立時(shi)間、融資(zi)歷史(shi)及估值
AI芯片(pian)(pian)行(xing)業市場預期(qi)(qi)(qi)逐(zhu)漸趨于理性,創業進入市場檢驗期(qi)(qi)(qi)。大量AI芯片(pian)(pian)公(gong)司在15~17年成(cheng)立。未來(lai)1-2年,市場將會對各廠商的(de)產(chan)品和技(ji)術進行(xing)實際檢驗。市場期(qi)(qi)(qi)待更高算力(li)、更低(di)功耗、成(cheng)本更低(di)的(de)AI芯片(pian)(pian)。
▲不同公司的芯片介紹
1、沐曦集成電路:多場景高性能GPU
沐曦集成電路專(zhuan)注于設(she)計(ji)(ji)具有完全自主知(zhi)識產權,針對異構(gou)計(ji)(ji)算(suan)等各(ge)類應用(yong)(yong)的高(gao)性能(neng)(neng)通(tong)(tong)用(yong)(yong)GPU芯片。公司致力于打造國(guo)內(nei)最強商用(yong)(yong)GPU芯片,產品(pin)主要(yao)(yao)應用(yong)(yong)方(fang)向(xiang)包含傳統GPU及移動應用(yong)(yong),人工智能(neng)(neng)、云計(ji)(ji)算(suan)、數據(ju)中心等高(gao)性能(neng)(neng)異構(gou)計(ji)(ji)算(suan)領域,是今后(hou)面向(xiang)社會各(ge)個方(fang)面通(tong)(tong)用(yong)(yong)信息產業提升算(suan)力水平的重(zhong)要(yao)(yao)基(ji)礎產品(pin)。
擬采用業界最先進(jin)的(de)5nm工藝技(ji)術,專注(zhu)研(yan)發(fa)全兼容CUDA及(ji)ROCm生態的(de)國(guo)產高性(xing)能GPU芯片(pian)(pian),滿足HPC、數(shu)據中心及(ji)AI等(deng)方(fang)面的(de)計算需(xu)求。致力(li)(li)于研(yan)發(fa)生產擁有(you)自主(zhu)知識(shi)產權的(de)、安全可靠的(de)高性(xing)能GPU芯片(pian)(pian),服(fu)務數(shu)據中心、云游戲、人工智能等(deng)需(xu)要高算力(li)(li)的(de)諸多重要領域。
2、壁仞科技:推出云端AI芯片
壁仞(ren)科技創(chuang)立于2019年(nian),公司在GPU和(he)(he)DSA(專用加(jia)速器)等領(ling)域具備豐富的技術儲備聚焦(jiao)于云端通用智(zhi)能計算,逐(zhu)步在AI訓練和(he)(he)推理、圖(tu)形渲染、高(gao)性能通用計算等多個領(ling)域趕超現有(you)解決方案,以實現國(guo)產(chan)高(gao)端通用智(zhi)能計算芯片的突破。
▲壁仞科技發展歷程
3、燧原科技:推中國最大AI計算芯片
在2021世界人工智能大會期(qi)間,上海(hai)燧原科技推(tui)出第二代云端AI訓練芯片邃思(si)2.0及(ji)訓練產品云燧T20/T21,以及(ji)全新升級的馭算Topsrider 2.0軟件(jian)平臺。
邃(sui)思(si)(si)2.0是迄今中國最大的(de)AI計(ji)算(suan)芯片,采用(yong)日月(yue)光(guang)2.5D封裝(zhuang)的(de)極限,在(zai)國內率(lv)先(xian)支持TF32精度,單精度張量(liang)TF32算(suan)力可達160TFLOPS。同時,邃(sui)思(si)(si)2.0也(ye)是首個支持最先(xian)進(jin)內存HBM2E的(de)產品。公司主要服務為面向(xiang)消費電子、汽(qi)車電子、計(ji)算(suan)機及周邊、工業、數據處理、物聯網等廣(guang)泛(fan)應(ying)用(yong)市場所提供的(de)一(yi)站式芯片定制服務和半(ban)導體IP 授權服務。
燧原科技成(cheng)(cheng)立(li)于2018年03月19日,成(cheng)(cheng)立(li)至今(jin)連續獲得過5輪(lun)融資(zi),累計融資(zi)額近32億元人民幣。其最新一筆(bi)融資(zi)為今(jin)年1月完成(cheng)(cheng)的18億元C輪(lun)融資(zi),由中信產(chan)業基(ji)金、中金資(zi)本旗下基(ji)金、春(chun)華資(zi)本領投。
4、地平線:智能駕駛及 AI 應用領域服務
基于創新(xin)(xin)的人(ren)工智(zhi)(zhi)(zhi)能(neng)專(zhuan)用(yong)計算架構 BPU,地(di)平線(xian)已成功流片(pian)(pian)量產了中國(guo)首(shou)款邊(bian)緣人(ren)工智(zhi)(zhi)(zhi)能(neng)芯(xin)(xin)片(pian)(pian)——專(zhuan)注于智(zhi)(zhi)(zhi)能(neng)駕駛的征程(cheng)1 和(he)專(zhuan)注于 AIoT 的旭(xu)日1 ;2019 年,地(di)平線(xian)又推出(chu)了中國(guo)首(shou)款車(che)規級 AI 芯(xin)(xin)片(pian)(pian)征程(cheng) 2 和(he)新(xin)(xin)一(yi)代AIoT智(zhi)(zhi)(zhi)能(neng)應(ying)用(yong)加速引擎(qing)旭(xu)日2 ;2020年,地(di)平線(xian)進(jin)一(yi)步加速AI芯(xin)(xin)片(pian)(pian)迭代,推出(chu)新(xin)(xin)一(yi)代高效(xiao)能(neng)汽車(che)智(zhi)(zhi)(zhi)能(neng)芯(xin)(xin)片(pian)(pian)征程(cheng) 3 和(he)全新(xin)(xin)一(yi)代 AIoT 邊(bian)緣 AI 芯(xin)(xin)片(pian)(pian)平臺旭(xu)日 3。
▲地平線發展歷程
智能物聯(lian)網需(xu)求將使云(yun)端(duan)計算(suan)的(de)負荷成(cheng)倍增長。智能物聯(lian)網是未來的(de)趨勢所向,海量的(de)碎(sui)片(pian)化場景與(yu)計算(suan)旭日處理器強大的(de)邊緣計算(suan)能力(li),幫助設備高效(xiao)處理本地(di)數據。
面向AIoT,地平線(xian)推出旭(xu)(xu)日(ri)系列邊緣 AI 芯片(pian)。旭(xu)(xu)日(ri)2采用 BPU 伯努利(li)1.0 架構,可提供 4TOPS 等(deng)效算力,旭(xu)(xu)日(ri)3 采用伯努利(li)2.0 ,可提供 5TOPS 的等(deng)效算力。
地平線(xian)已成為(wei)唯一覆(fu)蓋 L2 到(dao) L4 的(de)全場景整車(che)智能芯(xin)片方案提(ti)供商。從 2019 年量(liang)產(chan)中國首(shou)款(kuan)(kuan)車(che)規(gui)(gui)級(ji) AI 芯(xin)片征程(cheng) 2,到(dao) 2020 年推出第二代車(che)規(gui)(gui)級(ji)芯(xin)片征程(cheng)3。目前,征程(cheng) 2 、征程(cheng) 3 已在(zai)長(chang)安、長(chang)城、東(dong)風嵐(lan)圖(tu)、廣汽、江淮、理想、奇瑞(rui)、上(shang)汽等多家自主(zhu)品牌車(che)企的(de)多款(kuan)(kuan)主(zhu)力爆(bao)款(kuan)(kuan)車(che)型上(shang)實現前裝(zhuang)量(liang)產(chan)。
地平(ping)線 Matrix由征程2 架構加速的車規級計(ji)算平(ping)臺,結合深(shen)度學習感(gan)知技術,為高級別自動駕駛提供(gong)了穩定(ding)可靠的高性能感(gan)知系統。
▲地平線征程系列芯片
5、黑芝麻: 智能駕駛系統解決方案
黑芝麻(ma)智能科技是一家專注于(yu)(yu)視(shi)(shi)(shi)覺(jue)感知(zhi)技術與(yu)自主IP芯片開發的企業。公(gong)司(si)主攻領(ling)域為(wei)嵌入(ru)式圖(tu)像和計算機視(shi)(shi)(shi)覺(jue),提供基于(yu)(yu)光控技術、圖(tu)像處理、計算圖(tu)像以及人工智能的嵌入(ru)式視(shi)(shi)(shi)覺(jue)感知(zhi)芯片計算平臺,為(wei)ADAS及自動(dong)駕(jia)駛提供完整的商業落地(di)方案。
基于(yu)華山二(er)號 A1000 芯(xin)片,黑芝(zhi)麻(ma)提(ti)供了四(si)種智能駕(jia)(jia)(jia)駛(shi)解決方案。單顆(ke) A1000L 芯(xin)片適用于(yu) ADAS 輔助(zhu)駕(jia)(jia)(jia)駛(shi);單顆(ke) A1000 芯(xin)片適用于(yu) L2+ 自動駕(jia)(jia)(jia)駛(shi);雙 A1000 芯(xin)片互聯可(ke)(ke)達 140TOPS 算力,支持 L3 等級(ji)自動駕(jia)(jia)(jia)駛(shi);四(si)顆(ke) A1000 芯(xin)片則可(ke)(ke)以(yi)支持 L4 甚至以(yi)上的(de)自動駕(jia)(jia)(jia)駛(shi)需(xu)求。另外,黑芝(zhi)麻(ma)還可(ke)(ke)以(yi)根據(ju)不同的(de)客(ke)戶(hu)需(xu)求,提(ti)供定(ding)制化服(fu)務。
黑芝麻智能首款芯片(pian)與上(shang)汽(qi)的合作已實現(xian)量(liang)產,第二(er)款芯片(pian)A1000正(zheng)在(zai)(zai)(zai)量(liang)產過程中(zhong),預計今年(nian)下(xia)半年(nian)在(zai)(zai)(zai)商用車領(ling)域(yu)(yu)實現(xian)10萬片(pian)量(liang)級以上(shang)的量(liang)產,明年(nian)將(jiang)在(zai)(zai)(zai)乘用車領(ling)域(yu)(yu)量(liang)產落地。黑芝麻智能已與一(yi)汽(qi)、蔚來(lai)、上(shang)汽(qi)、比(bi)亞(ya)迪、博世、滴(di)滴(di)、中(zhong)科創(chuang)達、亞(ya)太機電等企業在(zai)(zai)(zai)L2、L3級自(zi)動駕駛感(gan)知系統解決方(fang)案上(shang)均有合作。
黑芝(zhi)麻智能科(ke)技最新的(de)華山二(er)號(A1000)芯(xin)片(pian)(pian)(pian)具備 40-70TOPS 的(de)強大(da)算(suan)力、小于 8W 的(de)功耗及(ji)優越的(de)算(suan)力利用率,工藝(yi)制程16nm,符(fu)合 AEC Q-100、單芯(xin)片(pian)(pian)(pian) ASIL B、系統(tong) ASIL D 汽車功能安全要求,是目前能支(zhi)持 L3 及(ji)以上級別自動駕(jia)駛的(de)唯一國產芯(xin)片(pian)(pian)(pian)。為(wei)了應對(dui)不同(tong)的(de)市(shi)場需求,黑芝(zhi)麻同(tong)步發布了華山二(er)號 A1000L。
▲黑芝(zhi)麻(ma)最新產品A1000系列(lie)參數對比
除(chu)了(le)以上玩家,摩爾線程等公司最近也(ye)有新進(jin)展,見下(xia)表。
▲國產GPU最新進展
智東西認為(wei),在(zai)傳統GPU市場中,排名前三的(de)(de)Nvidia、AMD、Intel的(de)(de)營收幾乎(hu)可以代表整個GPU行業的(de)(de)收入。國(guo)產(chan)CPU經(jing)過多年的(de)(de)探索和(he)(he)發(fa)展(zhan),已經(jing)形成(cheng)一定的(de)(de)氣候,產(chan)業和(he)(he)生態也逐(zhu)漸健(jian)全起(qi)來(lai)。然(ran)而,國(guo)產(chan)GPU市場規模和(he)(he)潛力巨(ju)大,發(fa)展(zhan)卻遠(yuan)遠(yuan)落后于國(guo)產(chan)CPU。在(zai)AI加(jia)速(su)計算、國(guo)產(chan)芯片自(zi)主創(chuang)新和(he)(he)摩爾定律放緩(huan)等因素的(de)(de)驅動下,國(guo)產(chan)GPU和(he)(he)海外巨(ju)頭(tou)的(de)(de)差距(ju)會逐(zhu)步減(jian)少。