車東西(公眾號:chedongxi)
文 | 曉寒

車東西6月15日(ri)消息,國(guo)內自動(dong)駕駛(shi)芯(xin)片(pian)公司黑芝麻今(jin)天發布了(le)旗下第二(er)(er)款(kuan)產(chan)品(pin)——華山二(er)(er)號芯(xin)片(pian)。

該(gai)芯(xin)(xin)片(pian)是(shi)黑芝(zhi)麻創業四年來的(de)(de)最重磅產品,單芯(xin)(xin)片(pian)AI算力(li)最高可(ke)達70TOPS(A1000)。由兩(liang)顆(ke)華山二號組成的(de)(de)域控制器,最高可(ke)實(shi)現140TOPS的(de)(de)AI算力(li),功耗25W,可(ke)支持L3級自(zi)動(dong)駕(jia)駛。

最強國產自動駕駛芯片出爐!兩顆就能玩轉L3級自動駕駛

▲黑芝麻華(hua)山二號(A1000)芯片

作(zuo)為(wei)對比,目前量產車中最強自動駕駛芯(xin)(xin)片——特斯(si)(si)拉(la)FSD芯(xin)(xin)片單(dan)顆(ke)為(wei)72TOPS。兩顆(ke)特斯(si)(si)拉(la)FSD芯(xin)(xin)片構(gou)成的(de)域控制器(HW3.0),算(suan)力為(wei)144TOPS,功耗72W。

很明(ming)顯,黑(hei)芝(zhi)麻(ma)華(hua)山二號實(shi)現了接(jie)近特斯(si)拉(la)(la)FSD芯片的算(suan)力,但是能耗卻(que)只是特斯(si)拉(la)(la)差不多(duo)三分之一(yi),同(tong)時成(cheng)本也比特斯(si)拉(la)(la)更低。

從數據上來看(kan),華山(shan)二號毫(hao)無疑問是國內最強自(zi)動駕駛芯(xin)片,性(xing)能已逼近特(te)斯拉FSD芯(xin)片,同時還擁有明顯的(de)功耗和(he)成(cheng)本(ben)優(you)勢(shi)。

那(nei)么問題來(lai)了,作為一家創業公司(si),黑芝麻的(de)(de)(de)華山二號(hao)(hao)芯片究竟是如何實現這種炸裂(lie)性(xing)能的(de)(de)(de)?華山二號(hao)(hao)芯片的(de)(de)(de)問世,又將(jiang)給風(feng)起(qi)云涌的(de)(de)(de)自動駕駛(shi)市場帶來(lai)怎(zen)樣(yang)的(de)(de)(de)改(gai)變呢?

帶著這些疑問,車東西(xi)也與硅谷芯片老炮——黑(hei)芝麻CEO單(dan)記章(zhang)進行了長(chang)達兩個小時的對話,找到了問題(ti)的答(da)案。

一、豪華芯片團隊推王牌產品 性能叫板特斯拉

今天晚(wan)上,芯(xin)(xin)片創企黑芝麻舉行線上發布會,推(tui)出了旗下的第二(er)款產品,也是創業(ye)四年來的最重(zhong)磅產品——華山二(er)號自(zi)動(dong)駕駛芯(xin)(xin)片,包括A1000和A1000 Lite兩個版本。

其中單顆A1000最高(gao)可(ke)實現70 TOPS的(de)AI算力,功耗在8W以內。通過不同的(de)組合(he),A1000可(ke)以支(zhi)持從L0到L4的(de)多種自(zi)動駕駛(shi)系統。

由單顆A1000組成的(de)控制(zhi)器,可以支(zhi)持(chi)(chi)L2+級自動(dong)駕(jia)駛(shi),2顆、4顆并聯,則(ze)分別可以實現140 TOPS和280 TOPS的(de)算力,用來支(zhi)持(chi)(chi)L3,甚至(zhi)是(shi)限定場景的(de)簡單的(de)L4級自動(dong)駕(jia)駛(shi)系(xi)統。

最強國產自動駕駛芯片出爐!兩顆就能玩轉L3級自動駕駛

▲基(ji)于(yu)A1000可組成不同的計算平臺

目(mu)前量產(chan)車中最(zui)強的(de)自(zi)動駕駛芯(xin)片為(wei)(wei)特(te)斯拉的(de)FSD芯(xin)片,單顆算(suan)力為(wei)(wei)72 TOPS,略高于A1000。兩顆FSD芯(xin)片組(zu)成了特(te)斯拉3.0版的(de)自(zi)動駕駛控制器(HW3.0),總算(suan)力144 TOPS,功耗為(wei)(wei)72W。

做個對比,兩(liang)顆黑芝(zhi)麻A1000組成的L3級自動駕駛(shi)控(kong)制(zhi)器(qi)算力(li)為140 TOPS,功耗(hao)(hao)25W,能效比為5.6 TOPS/W。特斯(si)拉FSD控(kong)制(zhi)器(qi)為2 TOPS/W,英偉達Xavier單芯(xin)片則為1 TOPS/W(控(kong)制(zhi)器(qi)功耗(hao)(hao)略(lve)大(da),能效比更低)。

這樣的(de)(de)數據表現,不僅讓A1000成了國內目前(qian)最(zui)強的(de)(de)自動(dong)駕(jia)駛芯片,并且還(huan)有實(shi)力叫(jiao)板特斯(si)拉FSD芯片。

那么到底是怎樣一個團隊,打造出了參數這么優秀的一個自動駕駛芯片呢?

答案是一支(zhi)芯片老炮+車企老將組成的創業團隊(dui)。

最強國產自動駕駛芯片出爐!兩顆就能玩轉L3級自動駕駛

▲左右(you)分別(bie)為黑芝麻COO劉(liu)衛紅、CEO單記(ji)章(zhang)

黑芝(zhi)麻(ma)CEO單記章此(ci)前(qian)是全(quan)球視覺芯(xin)片(pian)領軍企業OmniVision創(chuang)始團隊成員,在(zai)硅谷芯(xin)片(pian)行業打拼了20多年,在(zai)圖(tu)像處理芯(xin)片(pian)和軟件算法上(shang)具有豐富的經驗和技(ji)術積累(lei)。

CTO齊(qi)崢是英(ying)特爾(er)奔(ben)騰二(er)代(dai)芯(xin)片主要設計(ji)成員、CSO曾(ceng)代(dai)兵是中興微(wei)電子(zi)總工(gong)程師,COO劉衛紅(hong)則曾(ceng)是博世中國ADAS主力部門——底(di)盤與(yu)控制系統(tong)事(shi)業(ye)部的中國區總裁(cai)。

正是這(zhe)樣一支豪華(hua)創業(ye)團隊,也讓其(qi)在成(cheng)立之(zhi)初就(jiu)迅速獲得了資本(ben)的青睞。

2017年(nian),蔚來(lai)、芯動能等資(zi)方向其投(tou)資(zi)了(le)近(jin)億元。2019年(nian)4月,黑芝(zhi)麻又(you)獲得了(le)上汽、SK中國(guo)、招商局(ju)等機構的B輪投(tou)資(zi)。

最強國產自動駕駛芯片出爐!兩顆就能玩轉L3級自動駕駛

▲黑芝麻美國辦公室

蔚來(lai)和上(shang)汽分別是國內最強的新造車和傳統車企,芯動能背后(hou)是國家集成電路產業投資基(ji)金和屏(ping)幕巨頭京東(dong)方(fang),SK則是韓國電信巨頭。

黑(hei)芝麻的股東背景(jing)同樣豪華,尤其是蔚來和上汽的入(ru)局,也讓華山(shan)二(er)號芯(xin)片的量(liang)產落地充滿了看點(dian)。

二、如何做到高算力?自研AI加速器和ISP是關鍵?

自動(dong)駕駛系統非常依賴神經網絡,對芯片(pian)的AI算力要求極高。

各大芯(xin)片(pian)玩家們(men)則紛紛推出了整合有CPU、GPU、ISP、DSP等多個處理器的(de)SoC芯(xin)片(pian)來予(yu)以(yi)對應——黑芝麻(ma)的(de)華山二號芯(xin)片(pian)就(jiu)是一顆整合了20多個核心的(de)SoC。

在(zai)SoC內部,不同(tong)芯片(pian)企(qi)業也(ye)選擇了不同(tong)的技術(shu)路徑。

比如英(ying)偉(wei)達Xavier內(nei)部使用(yong)了自家極強的GPU來增(zeng)強AI算力,賽(sai)靈思的MPSoC內(nei)部則(ze)整合了自己擅長的FPGA,特斯拉(la)FSD芯片則(ze)靠自研的NPU加(jia)速。

在單記章(zhang)看來,GPU加(jia)速確實性能(neng)很強,但(dan)問題是(shi)(shi)GPU相比專用的AI加(jia)速器(qi)還是(shi)(shi)太通用了,它(ta)可以適配各類神經網絡是(shi)(shi)一(yi)個優(you)勢,但(dan)問題是(shi)(shi)功(gong)耗大成本高。

FPGA的優(you)點是硬(ying)(ying)件(jian)可編程,可以適配不同(tong)算法。但是對車企和Tier1的軟件(jian)工程師來(lai)(lai)說,還需要(yao)掌(zhang)握硬(ying)(ying)件(jian)編程語言,用起來(lai)(lai)太(tai)復雜。

最終,黑芝(zhi)麻選擇(ze)了跟特斯(si)拉一樣的(de)NPU路(lu)線,在SoC里面集成了一個名(ming)為DynamAI NN引擎的(de)NPU來進行AI加速。

這個(ge)NPU內部(bu)最多(duo)可搭載4個(ge)3D卷積MAC陣列、1個(ge)2D GEMM陣列,以及1個(ge)EDP運(yun)算單元和5個(ge)DSP,支持4/8/16位多(duo)種(zhong)運(yun)算精度,工作頻率為1.2GHz。

這么多(duo)的計(ji)算單元,既保(bao)證了大算力,同(tong)時(shi)又能夠(gou)適(shi)配不同(tong)的神經網絡(luo),并進行(xing)壓縮和稀(xi)疏性(xing)加速,從而(er)讓A1000最高可以實現(xian)70 TOPS的AI算力,以及超過80%的硬件利用率。

最強國產自動駕駛芯片出爐!兩顆就能玩轉L3級自動駕駛

▲A1000芯片的(de)AI加(jia)速引擎

自動駕駛系統對攝像頭的依賴極強,視頻畫面又是進行AI計算的基礎。對于一款自動駕駛芯片來說,能夠對圖像進行優質的前端處理至關重要。

這(zhe)方面,基于單記章等核(he)心(xin)成員在圖像處理芯片領域的(de)積累,黑(hei)芝麻在A1000這(zhe)顆SoC內還(huan)集成了(le)自研的(de)高性能ISP,以保證讓汽(qi)車看(kan)的(de)更(geng)清。

單記章告訴(su)車東西,得益于高性能ISP,A1000可(ke)以最多(duo)接入(ru)12路高清攝像頭的(de)畫面(mian),(最高甚至可(ke)以達到4K分(fen)辨率(lv))。再加上高達30Gbps的(de)高帶寬(kuan),讓其可(ke)以每(mei)秒處理12億像素(su)。

此外,A1000還支持HDR處理(li),通過講長曝(pu)光和短曝(pu)光的圖像進行擬合,來讓汽(qi)車在黑暗、逆光等不利環境(jing)下(xia)也能看的清楚。

最強國產自動駕駛芯片出爐!兩顆就能玩轉L3級自動駕駛

▲A1000支(zhi)持HDR技術

一款自動駕駛芯片想要大規模量產,高算力只是第一步,適配性、安全性和經濟性也是重要指標。

單記章介紹(shao)稱(cheng),A1000不僅支(zhi)持毫米(mi)波(bo)雷達(da)、超聲波(bo)雷達(da)、攝像頭、IMU、GPS等(deng)常見傳(chuan)感器,并且還(huan)可(ke)接入高(gao)等(deng)級自(zi)動駕駛常用的激光雷達(da)、V2X等(deng)數據(ju)。

該芯片從研發之初就嚴格(ge)遵循了車規(gui)標(biao)準,滿足AEC-Q100 G2、ISO26262 ASIL-B的(de)要求。

在A1000內(nei)部(bu),專(zhuan)門(men)部(bu)署了一個安(an)全(quan)核(he)(he)心(xin)(xin),在其他核(he)(he)心(xin)(xin)失效時來保證基礎功(gong)能(neng)。同時在實現L3及以上級別自動(dong)駕駛時候,多顆A1000芯片(pian)互為冗余,則可以達(da)到(dao)ASIL D級認證。

經濟性(xing)上,A1000選擇了目前汽車芯片主流的(de)16nm工(gong)藝,并(bing)通(tong)過巧妙(miao)的(de)設(she)計(ji),將SoC封裝(zhuang)尺寸降低至90平方毫米。

作(zuo)為(wei)對比,特斯(si)拉采用(yong)的是(shi)三星14nm工(gong)藝,尺寸為(wei)260平方毫米。英特爾家Mobileye的最新(xin)產品(pin)EyeQ5則采用(yong)了7nm工(gong)藝。

較(jiao)成(cheng)熟的(de)工藝以及較(jiao)小的(de)封裝面積,讓A1000擁有(you)了(le)不錯的(de)成(cheng)本優勢。再加(jia)上強大的(de)AI算力(li)、較(jiao)低(di)的(de)功(gong)耗和廣泛(fan)的(de)傳感器(qi)適配性,讓這款芯片(pian)真正具備了(le)大規模前(qian)裝量產的(de)潛力(li)。

三、自動駕駛產業迎來中國芯 將加速L2/L3量產

從谷歌2009年成立自動駕駛(shi)(shi)團隊開始計算,自動駕駛(shi)(shi)產(chan)業(ye)已經走過了(le)10個(ge)年頭。

雖(sui)然(ran)(ran)研發進(jin)程依然(ran)(ran)熱火(huo)朝(chao)天,但業界目前(qian)對L4級(ji)以上高等(deng)級(ji)自動駕(jia)(jia)駛系統的(de)量產落地則較為悲觀——L4級(ji)無人(ren)車仍(reng)然(ran)(ran)需(xu)要安全員隨時(shi)監督,自動駕(jia)(jia)駛系統僅能在簡單環境行駛,真正規模化部署遙遙無期。

不過好消息是L1/L2級(ji)自(zi)動駕駛已(yi)經迎來爆(bao)發(fa)期(qi)——甚至成了新(xin)車標配功能。而(er)L3級(ji)自(zi)動駕駛,也到(dao)了量產前夜。

博(bo)(bo)世底盤控制系(xi)統中國區駕駛員(yuan)輔助業務單元副總裁(cai)蔣京芳此(ci)前表示,僅(jin)2019年,就至少有40款新車搭載了博(bo)(bo)世的(de)L2級(ji)自動駕駛,呈(cheng)現出井(jing)噴(pen)的(de)態勢。

最強國產自動駕駛芯片出爐!兩顆就能玩轉L3級自動駕駛

▲A1000開發板

到了2020年,廣汽、長安等(deng)自(zi)主(zhu)車(che)企又加速了L3級自(zi)動駕(jia)駛(shi)技術(shu)(shu)的(de)(de)量產進(jin)程(cheng),先后(hou)進(jin)行了L3級自(zi)動駕(jia)駛(shi)技術(shu)(shu)的(de)(de)演示,并發(fa)布了支持L3級自(zi)動駕(jia)駛(shi)系(xi)統的(de)(de)量產車(che)型。

L1~L3級(ji)自(zi)動(dong)駕駛技術(shu)火熱的同時,卻也存在著明顯的缺芯現象(xiang)。

對于L0/L1級系統(tong),使用傳(chuan)統(tong)的車規級CPU/MCU即可滿足需(xu)求,但(dan)到(dao)了L2以及L2+、L3級別,就需(xu)要引(yin)入越來越多的AI算法,也意味著需(xu)要AI加速器的支持。

目前使用(yong)較多的(de)是FPGA和(he)GPU加速,但是都(dou)不(bu)是最合適的(de)產品(pin)。

“有Tier1就向我(wo)們反饋,現在(zai)使用(yong)的FPGA芯片雖然算力足,但是硬(ying)件編程復雜性太(tai)高,用(yong)起來并不(bu)順(shun)手。”單記章這樣向車(che)東西說(shuo)道,“GPU算力也強(qiang),但功耗和價格又太(tai)高了(le),不(bu)適合大規模量產。”

單記章(zhang)說的不無道理。

特斯拉(la)的(de)車型早期就選用了(le)英偉達的(de)計算平臺(tai),但隨后(hou)又果斷(duan)下決心(xin)自研了(le)FSD芯片,降低了(le)對GPU的(de)依(yi)賴。

奧迪是全球(qiu)首(shou)個發布L3級自動駕駛(shi)量產車(現款A8)的(de)玩家,但因為(wei)沒有現成的(de)芯(xin)片(pian)可用(yong),無奈只能用(yong)Mobileye EyeQ3、英偉達K1、Altera Cyclone等多款芯(xin)片(pian)并聯起來,自己(ji)做了一(yi)個名為(wei)zFAS的(de)域控(kong)制器。

最強國產自動駕駛芯片出爐!兩顆就能玩轉L3級自動駕駛

▲奧迪zFAS架構

“多(duo)(duo)個(ge)芯片(pian)一起使用的協同(tong)難度肯(ken)定(ding)比單個(ge)SoC芯片(pian)高的多(duo)(duo),總結一下就是(shi)效率(lv)低功耗還高。”單記章這樣說道。

面對這一(yi)現狀,技(ji)術實力極(ji)強的(de)特斯拉選(xuan)擇自(zi)研芯片(pian)來解決(jue),但其他(ta)車(che)企則只能(neng)等待供應商推出更適合(he)汽(qi)車(che)的(de)自(zi)動(dong)駕駛芯片(pian)。

這次發布的高算力(li)、低(di)功耗和低(di)成本的華山二號,就是為了解(jie)決了這一問題而推出。

單(dan)記(ji)章(zhang)告訴車東西,華山二號已經(jing)送至多個(ge)車企(qi)展(zhan)開測試。

“爭取今年能有多個(ge)落(luo)地突(tu)破。”單(dan)記章說道,“多個(ge)車企對我(wo)們的芯片都很有興(xing)趣(qu)。”

事實上,就在今晚的線上發布會上,中國一汽黨委常委、副總經理王國強,博世中國總裁陳玉東、蔚來汽車創始人李斌、上汽集團副總裁兼總工程師祖似杰等汽車行業大佬也都錄制了視頻對黑芝麻表示支持。
王國強在發布會上表示:“黑芝麻已經與中國一汽在智能駕駛超算平臺、軟硬件開發、人工智能視覺感知算法等方面展開全方位合作,在不遠的將來必將結出豐碩的成果。希望黑芝麻能夠打造出中國領先、世界一流、滿足用戶需求的智能駕駛核心算法和芯片。”

很明(ming)顯,華山二號的推出,將為(wei)汽車行業提供了一個更加(jia)合(he)適(shi)的自動(dong)駕駛(shi)芯片,從而促進(jin)更多新的自動(dong)駕駛(shi)功能逐(zhu)步落地。

最后,自動(dong)駕駛技術(shu)(shu)作(zuo)為各個國(guo)家激烈(lie)競爭(zheng)的(de)未來技術(shu)(shu)高地,極具(ju)戰略意(yi)義。我(wo)國(guo)政府在《智能汽(qi)車創新發(fa)展戰略》等文件中指出,要加快推動(dong)車載高性能芯片技術(shu)(shu)的(de)發(fa)展,實現自主(zhu)可控。

黑芝(zhi)麻華山二號的(de)發布,就為增強我國(guo)自動駕駛產業的(de)整體實力,實現自主可控(kong)做出了貢獻。