智東西(公眾號:zhidxcom)
文 | 心緣

智東西6月27日消(xiao)息(xi),最近,脫胎于清華大學微(wei)電子(zi)所Thinker團隊的AI芯片創企(qi)清微(wei)智能迎(ying)來新進展(zhan):

全球首款可重構超(chao)低功耗(hao)語音人工(gong)智能(neng)(AI)芯片TX210已實現規模化(hua)量(liang)產,于(yu)6月中(zhong)旬正式交付市(shi)場,而此時清微智能(neng)距成(cheng)立還不到1年。

這(zhe)是一(yi)款(kuan)語音(yin)SoC芯片,針(zhen)對(dui)手機(ji)、可穿戴設備、智(zhi)能家居(ju)等多種應用場景的智(zhi)能終(zhong)端(duan)產(chan)品開發,工作功耗不(bu)超(chao)過2mW,語音(yin)活動檢測(VAD)功耗小于100uW,延時不(bu)到10ms。

清微(wei)智能(neng),拆(chai)開(kai)來,就是清華、微(wei)電子(zi)、人(ren)工智能(neng),也就代表了這家公司的(de)(de)定(ding)位——專注可重構計算(suan)芯(xin)片(pian),提供以端側為基礎,并向云側延(yan)伸的(de)(de)芯(xin)片(pian)產品及(ji)解決方(fang)案。

其(qi)核(he)心技(ji)(ji)術團隊來自清華微電子學(xue)研究所(suo)(suo)(以下簡稱微電子所(suo)(suo)),其(qi)芯(xin)片所(suo)(suo)采用(yong)的架構正是(shi)中(zhong)國芯(xin)片技(ji)(ji)術學(xue)術領軍(jun)者——中(zhong)國半(ban)導體行業協會(hui)IC設計(ji)分(fen)會(hui)理事長、清華大學(xue)微電子所(suo)(suo)所(suo)(suo)長魏少軍(jun)教授所(suo)(suo)帶領研發的可重構計(ji)算架構。

今日(ri),智東西來到(dao)清微智能的辦公室,和創始人兼CEO王(wang)博深入(ru)交流,看(kan)這家出身“名門”、即將滿1周歲(sui)的AI芯片(pian)新秀,如(ru)何帶著(zhu)清華大學前沿的創新架(jia)構(gou)踏入(ru)產業的大門,如(ru)何快(kuai)速在逐漸(jian)火熱的AI芯片(pian)市場站穩(wen)腳跟(gen)。

清華創新架構芯片量產!全球首款可重構超低功耗語音AI芯片

一、謀定而后動,脫胎清華微電子系

清微智(zhi)能成立于2018年7月(yue),其技(ji)術脫胎于清華大學微電子(zi)學Thinker團隊。

如今的(de)(de)芯片產(chan)業,放眼望(wang)去,數不勝數的(de)(de)國(guo)內外半導體企業高管從(cong)清華(hua)大學電(dian)子(zi)工程系和微電(dian)子(zi)所走(zou)出。

而(er)微電(dian)子所(suo)的(de)靈魂人物——現任(ren)清華大學微電(dian)子研究(jiu)所(suo)所(suo)長、中國半導體行業協會(hui)IC設計分會(hui)理事長魏少軍教授,在(zai)過去(qu)的(de)十(shi)幾(ji)年間一直(zhi)深耕(geng)于一項核(he)心(xin)技術——“軟件定義(yi)芯片”,即可重構計算(suan)芯片技術。

意識到可重構(gou)計算(suan)架構(gou)對于芯片算(suan)力(li)提升和功(gong)耗降(jiang)低的巨大優(you)勢,2006年,魏少(shao)軍教(jiao)授牽(qian)頭成立了清華(hua)大學(xue)可重構(gou)計算(suan)研究團隊,而這支團隊后來成為清微智能的核(he)心(xin)。

2015年(nian),AI復興(xing),對芯片運算能力(li)產生了(le)遠高(gao)于傳統芯片的要求,這個時候,沉(chen)寂了(le)9年(nian)的可(ke)重構計算因其(qi)與AI算法契合的特(te)性,開始(shi)重新進(jin)入“聚(ju)光燈下”。

自2016年起,基于可重構計算架構,魏少軍教授團隊中的清華大學微納電子系副系主任尹首一副教授帶隊設計研發了4款Thinker系列的低功耗終端AI芯片,分別是實驗性質的驗證芯片Thinker I、人臉識別芯片Thinker II、語音識別芯片Thinker S、語音識別芯片Thinker IM。(AI芯片終極難題 被清華大學IC男神解決了!

清華創新架構芯片量產!全球首款可重構超低功耗語音AI芯片

這(zhe)三款芯片的設計(ji)方案一問(wen)世,就收獲了(le)國(guo)(guo)際學術界的認可。比如Thinker-I首次出現在2017VLSI國(guo)(guo)際研(yan)討(tao)會上(shang)時,外(wai)界評價(jia)它“突破了(le)神經(jing)網(wang)絡(luo)計(ji)算和訪存瓶頸(jing),實現了(le)高能效多模態混合神經(jing)網(wang)絡(luo)計(ji)算。”

而清微智能CEO王博的(de)本科和碩士(shi)均在北京郵電大(da)學計算機通信(xin)專業就讀,他與清華大(da)學Thinker團隊(dui)的(de)相識,卻來自一段(duan)同學緣分。

彼時,王博還在一家云計算方案(an)提供商工作(zuo),負(fu)責智能(neng)硬件產品,他在做一款人臉識別(bie)智能(neng)門鎖時,想要找到合適(shi)的(de)芯片,卻(que)發現市(shi)面(mian)上的(de)高通等公司無法(fa)滿(man)足他們對能(neng)耗比等性(xing)能(neng)的(de)需求。

尹首一副教授的(de)大學(xue)同學(xue)是王博的(de)高中同學(xue),兩(liang)人(ren)因此結識。

王(wang)博(bo)得知尹(yin)首一副教授在(zai)帶領Thinker團隊做AI芯(xin)(xin)片(pian),看到(dao)其芯(xin)(xin)片(pian)設(she)(she)計方(fang)案擁有出(chu)色的(de)能耗比,再經(jing)過深入了解他們所設(she)(she)計的(de)可重構計算架構的(de)技術,王(wang)博(bo)對這一架構的(de)擴展性(xing)感(gan)到(dao)認可,覺得這條路(lu)線是可行(xing)的(de)。

預測到AIoT市場將步入(ru)全面爆發期(qi)后(hou),2018年(nian)7月,王博(bo)牽頭在北京中關村成立了(le)清微智能公司,將技術產品化,由王博(bo)任(ren)CEO,尹(yin)首(shou)(shou)一(yi)副教授為(wei)首(shou)(shou)席科(ke)學家(jia),歐陽鵬博(bo)士(shi)任(ren)CTO和(he)Thinker芯片主架構師。

Thinker團隊(dui)原本就分(fen)為兩(liang)部(bu)(bu)分(fen),一(yi)部(bu)(bu)分(fen)是(shi)尹首一(yi)副教(jiao)授帶領(ling)一(yi)些博士生(sheng)從事整個架構的(de)(de)設計和優(you)化工作,另一(yi)部(bu)(bu)分(fen)是(shi)清華以(yi)社招形(xing)式招進來的(de)(de)專門負責芯片實(shi)現的(de)(de)工程(cheng)師。

清微智能的初始技術團隊(dui)主(zhu)要來自Thinker團隊(dui)中負責實現芯片的工程師們,約一二十人,如今其團隊(dui)數(shu)量已擴展到(dao)70多(duo)人。團隊(dui)成員(yuan)來自清華(hua)大學、NVIDIA、Sony等(deng)知名高(gao)校和企(qi)業,在半(ban)導體行業具(ju)備多(duo)年經驗(yan)。

去年第三季(ji)度,清微智能拿到百度戰投領投的近億元天使輪(lun)融(rong)資(zi),由(you)百度戰投、分眾(zhong)傳媒、禧筠資(zi)本、國隆資(zi)本、西子聯合控股等聯合投資(zi),而新一輪(lun)融(rong)資(zi)計劃(hua)也將于近期(qi)啟(qi)動(dong)。

而清微智能(neng)在成立(li)不(bu)足一年(nian)的時間(jian),就(jiu)交出了TX210語(yu)音芯(xin)片(pian)百萬數量級的量產(chan),圖像芯(xin)片(pian)也將(jiang)于今年(nian)12月量產(chan),這一成就(jiu),源自清華大學十多年(nian)扎實的技術(shu)積累、200多項技術(shu)專利。

二、軟件定義芯片:可重構計算芯片架構

在今年(nian)的全球AI芯(xin)片(pian)(pian)峰會GTIC 2019上,魏少(shao)軍教授(shou)曾展(zhan)示這樣一張PPT。他將芯(xin)片(pian)(pian)分(fen)(fen)成三部(bu)分(fen)(fen):第(di)(di)一部(bu)分(fen)(fen)是可更多編(bian)程(cheng)的,如(ru)CPU;第(di)(di)二部(bu)分(fen)(fen)是能(neng)少(shao)量編(bian)程(cheng)的,如(ru)GPU;第(di)(di)三部(bu)分(fen)(fen)是不能(neng)編(bian)程(cheng)的,如(ru)專用芯(xin)片(pian)(pian)。

清華創新架構芯片量產!全球首款可重構超低功耗語音AI芯片

除了可編程(cheng)性,這(zhe)些(xie)不同計算架構(gou)的(de)主要(yao)(yao)差(cha)別在(zai)于能(neng)效。專用芯(xin)片到GPU之(zhi)間有1000倍的(de)能(neng)效差(cha)距,而(er)1000倍是一個很重要(yao)(yao)的(de)分界線。

魏(wei)少軍教授表(biao)示(shi),如果(guo)我們(men)的AI芯片(pian)做不(bu)到比GPU高1000倍的能效,就不(bu)能滿足人們(men)在終端側的需求。

傳統的終端AI芯片,主要基于(yu)CPU、DSP、GPU、NPU等架構(gou),這些架構(gou)本質(zhi)屬于(yu)指(zhi)令驅動的計算模式,屬于(yu)馮·諾依曼架構(gou)。

這(zhe)些架構在具體計算過程(cheng)中(zhong),面向某一特定領域(yu),往(wang)往(wang)存在高(gao)能效和靈活(huo)性不(bu)可兼得的問(wen)題,比如(ru)華為(wei)旗艦手機中(zhong)強大的麒麟芯片,就(jiu)不(bu)適用(yong)于安防攝(she)像頭、智能家(jia)居等場景(jing)。

它(ta)們需要從指(zhi)令存儲器中加(jia)載(zai)指(zhi)令并解析指(zhi)令,然后指(zhi)導執行(xing)單元進行(xing)計算。在數(shu)據(ju)計算中,這是一(yi)種靈活但是低效的時域計算模式。

此(ci)外,在AI芯片的(de)(de)(de)研發過(guo)(guo)程中,也有團隊利用單指令(ling)流多(duo)數據流(SIMD)的(de)(de)(de)方式來提高數據復(fu)用,從(cong)而減少指令(ling)解析(xi),但是SIMD面向的(de)(de)(de)是同構的(de)(de)(de)操作,當指令(ling)功能變換時,仍需要重復(fu)前面的(de)(de)(de)過(guo)(guo)程。

清華創新架構芯片量產!全球首款可重構超低功耗語音AI芯片

為了兼具高能效(xiao)和可編程(cheng)性,清華大學Thinker團隊(dui)致力(li)于研究的是一種無需指(zhi)令驅動(dong)的計算(suan)(suan)模式,即動(dong)態可重構計算(suan)(suan)架構(CGRA,Coarse grain reconfigurable architecture),也就是上(shang)圖紅色(se)區(qu)域。

它是一種(zhong)非馮·諾(nuo)依曼架(jia)構(gou),簡單而言,就是將軟件通(tong)過不同的(de)管(guan)道輸送到(dao)硬(ying)件中來(lai)執行功能(neng),使得芯片能(neng)夠實(shi)時地根據軟件/產品的(de)需求改變功能(neng),實(shi)現更加靈活的(de)芯片設計。

傳統的(de)(de)芯片需要讓應(ying)用(yong)來適應(ying)架構,而CGRA架構更(geng)加靈活,能(neng)夠根據(ju)數(shu)據(ju)流的(de)(de)特點(dian),讓軟件來調整芯片的(de)(de)計(ji)算(suan)能(neng)力,在(zai)最合理分配和(he)使用(yong)算(suan)力的(de)(de)同時,成倍(bei)節約了數(shu)據(ju)存儲和(he)傳輸帶寬。

王博介紹(shao)說,CGRA架(jia)構適(shi)(shi)合AI、視(shi)頻編解碼(ma)、語音處理等計(ji)算(suan)密集(ji)型場景(jing),但不適(shi)(shi)用(yong)于以(yi)邏輯判(pan)斷為主的非計(ji)算(suan)密集(ji)型場景(jing)。

清華創新架構芯片量產!全球首款可重構超低功耗語音AI芯片

CGRA基于(yu)數(shu)據流(liu)圖(tu),面(mian)向的(de)是異構的(de)空域計算,一(yi)次配置形成固定(ding)的(de)電路結構,從而(er)以接近ASIC效率(lv)(lv)反(fan)復執行,資源利用率(lv)(lv)和數(shu)據復用率(lv)(lv)高。

同(tong)時(shi),相比專(zhuan)用(yong)集成(cheng)電(dian)路(lu)(ASIC)方式的(de)(de)固定電(dian)路(lu)結構(gou),它又可以根據應(ying)用(yong)或者(zhe)算(suan)法進行(xing)電(dian)路(lu)配(pei)置,使得(de)硬(ying)件重(zhong)新形成(cheng)不(bu)同(tong)的(de)(de)計算(suan)電(dian)路(lu)結構(gou),具有非常(chang)強的(de)(de)靈活性。

清華創新架構芯片量產!全球首款可重構超低功耗語音AI芯片

▲“指令驅動(dong)”的時域計算模式 v.s. “數據(ju)驅動(dong)、動(dong)態重構”的空間計算模式

以這個更低能(neng)耗和(he)更強靈活性的架構(gou)為基(ji)礎,清微(wei)智能(neng)CTO歐陽鵬透露,清微(wei)智能(neng)在(zai)具體的芯片設(she)計(ji)上,又做了(le)兩方面深化。

1、支持混合精度計算

主流神經網絡算法具(ju)有混合數據(ju)(ju)精度(du)表(biao)示的(de)特點,即不(bu)(bu)同的(de)神經網絡層(ceng)可(ke)用(yong)不(bu)(bu)同數據(ju)(ju)位寬來表(biao)達中間數據(ju)(ju)或者權重數據(ju)(ju)的(de)精度(du)。

然而,傳統(tong)AI架構無法高效支持(chi)混(hun)合精度計算,通常只能支持(chi)單一精度計算,或者只能通過(guo)擴展(zhan)資源方式支持(chi)少數幾(ji)種精度。

相較而言(yan),清微AI芯(xin)片(pian)產品能支持(chi)從1bit-16bit的(de)混合精度(du)計算,同(tong)時(shi),不同(tong)的(de)神經網絡層可(ke)以采用(yong)不同(tong)的(de)精度(du)表示(shi),可(ke)以實(shi)時(shi)切(qie)換精度(du)。

這源自CGRA架構的特(te)點,在具體實現(xian)過程中,可重構模式(shi)動態重組計算(suan)資源和(he)帶(dai)寬(kuan)(kuan)(kuan),根(gen)據精度(du)表(biao)示,讓(rang)計算(suan)資源和(he)帶(dai)寬(kuan)(kuan)(kuan)接近滿負荷進行計算(suan),從而將混合精度(du)網絡下的計算(suan)資源和(he)帶(dai)寬(kuan)(kuan)(kuan)的利用率逼(bi)近極限,高(gao)效支持(chi)多(duo)種混合精度(du)的神經網絡。

2、優化非神經網絡計算效率

AI算法不止有神(shen)經網絡(luo)中卷積層、全連(lian)接層等邏輯,還(huan)有非神(shen)經網絡(luo)計算邏輯。

比如在人臉檢測和識別中,有NMS(非極大值抑制)以及仿射變換;在語音識別中,有FBANK/MFCC特征提取以及聲學解碼等。
而與此同(tong)時,非神經網(wang)絡算法(fa)也在快速演(yan)進。比如(ru)最新NMS已經演(yan)化到Soft-NMS。

傳統(tong)AI芯片(pian)架構強調了(le)(le)神(shen)經網(wang)絡邏(luo)(luo)輯的(de)(de)計算效率,卻忽視了(le)(le)非神(shen)經網(wang)絡邏(luo)(luo)輯的(de)(de)計算效率。

針對非神經網絡邏輯,一般仍(reng)然采用(yong)CPU或(huo)者(zhe)DSP進(jin)行(xing)處理,或(huo)者(zhe)采用(yong)ASIC進(jin)行(xing)固化。

清微AI芯片產品針(zhen)對神經網絡部(bu)分和非神經網絡部(bu)分均進行了(le)計算效率考慮。

針對(dui)非神經網絡處(chu)理邏輯,從算法數據流圖進(jin)行空間映射(she),以接近ASIC效(xiao)率計算。

同(tong)時,其(qi)產(chan)品通過配置形(xing)成不(bu)同(tong)的電(dian)路結構(gou)來(lai)動態處理不(bu)同(tong)非神(shen)經網絡(luo)計算(suan)邏輯,在(zai)保(bao)證(zheng)靈活性前提(ti)下,計算(suan)效率有(you)極大提(ti)升。

三、首款語音AI芯片量產,超強能效比

基于創新的CGRA架構,清微智能第一款實(shi)現規模化量產的語音AI芯片TX210擁有業界領先的算力、能耗比、時延、面積和成本(ben)。

清華創新架構芯片量產!全球首款可重構超低功耗語音AI芯片

據介紹,TX210采用(yong)臺積電40nm ULP工藝,支持(chi)WLCSP和(he)QFN兩(liang)種產品(pin)封(feng)裝。

該芯片支(zhi)持(chi)離線語音喚醒功能,支(zhi)持(chi)5個喚醒詞(ci)和10個命令詞(ci),還支(zhi)持(chi)聲(sheng)紋識(shi)別。它支(zhi)持(chi)3-5m的遠場(chang)語音喚醒和識(shi)別,工作頻率為50MHz,延遲不(bu)到10ms。

繼(ji)承CGRA架構的(de)特點,TX210芯片可編(bian)程(cheng)、可重構,在結構上有著極強的(de)靈(ling)活性,支(zhi)持多比特DNN神(shen)經網絡,可以(yi)支(zhi)持1-16bit位寬的(de)神(shen)經網絡計算,也(ye)支(zhi)持FFT/MEL FILTER等。

由于語音AI芯片的(de)應用場(chang)景非(fei)常豐富(fu),可以應用至智能(neng)手機、可穿戴智能(neng)設備、小家(jia)(jia)電、大家(jia)(jia)電、玩(wan)具及車載等眾多場(chang)景中,而低能(neng)耗又是從終端設備到(dao)用戶都非(fei)常重視的(de)性能(neng)。

對(dui)(dui)此,TX210針對(dui)(dui)語音交互場景做了(le)更多優化。

比如為了保持(chi)在低功(gong)耗(hao)狀態(tai),它采用多(duo)級功(gong)耗(hao)喚(huan)醒模式,只有在通(tong)過麥克風檢測到人(ren)聲時,它才會被激活(huo),準(zhun)確監聽到“喚(huan)醒詞(ci)”后(hou),TX210才會去喚(huan)醒處于休眠狀態(tai)的主(zhu)控處理器(qi)芯(xin)片。

另外,芯片支(zhi)持一語(yu)直達功能,處(chu)理器只需(xu)要處(chu)理喚醒(xing)詞之后的語(yu)音信號內容。

經過多(duo)重優(you)化,TX210將工作功耗(hao)控制在2mW內,將語音活動(dong)檢測(ce)(Voice Activity Detection,VAD)功耗(hao)降至100uW內。

清華創新架構芯片量產!全球首款可重構超低功耗語音AI芯片

該語音(yin)AI芯片的另一個特點是用極(ji)小(xiao)的芯片面(mian)積支持豐富的接口和電源管理。

TX210的(de)(de)WLCSP封裝面積僅有2.3 x 1.9mm2,適(shi)用于手機,藍牙耳(er)機等對體積要求(qiu)苛刻的(de)(de)應用場景;同時TX210集(ji)成(cheng)了LDO/ADC/BANDGAP/PGA等模擬器(qi)件,支持32K crystal輸入,極大降低了用戶的(de)(de)使用成(cheng)本。

除此之外,在降噪方面,TX210也做了進(jin)一步優化,單麥基(ji)于深度學(xue)習進(jin)行降噪,雙麥則(ze)是將(jiang)傳統算法與深度學(xue)習相結合(he),在典型(xing)信噪比下,TX210的喚醒識別(bie)率達(da)95%,誤(wu)識別(bie)率小于24小時一次。

據介(jie)紹,在TX210正式上(shang)市(shi)前(qian),清微智能(neng)已與(yu)一些大型(xing)的互(hu)聯(lian)網公司、智能(neng)手機及家電廠商建立了合作關(guan)系。

而這只(zhi)是清微(wei)智能基于CGRA架構(gou)芯片的(de)開(kai)始,他(ta)們的(de)視覺芯片預計將(jiang)在(zai)今(jin)年12月(yue)量產(chan)。

王博告(gao)訴(su)智東西,目前他們規(gui)劃CGRA架構(gou)(gou)18個月一(yi)迭(die)代,下一(yi)代架構(gou)(gou)有望將(jiang)算力再提(ti)高5-10倍。隨著Thinker團隊持續迭(die)代更新CGRA架構(gou)(gou),未(wei)來其語(yu)音(yin)芯片和(he)(he)視覺芯片的算力和(he)(he)能(neng)效比都將(jiang)進一(yi)步提(ti)升(sheng)。

在算(suan)法(fa)方面(mian),清(qing)微智能在在算(suan)法(fa)壓縮,量化(hua)以及硬(ying)件友好化(hua)設計方面(mian)有長期(qi)的積(ji)累,并與(yu)中科院、清(qing)華(hua)大(da)學、喬治理工大(da)學等開展了深入合作。

清(qing)微智(zhi)能(neng)還(huan)研發了一套CGRA軟件開(kai)發平臺,這(zhe)個平臺兼容TensorFlow、Caffe等(deng)主流AI框架,可自(zi)動(dong)完成轉換、解析、編譯(yi)、生成等(deng)過程(cheng)。他(ta)們自(zi)己的編譯(yi)平臺,允許用(yong)戶從其它框架無縫遷移清(qing)微智(zhi)能(neng)的芯片。

清華創新架構芯片量產!全球首款可重構超低功耗語音AI芯片

清微智能(neng)選擇(ze)先切入終端AI芯片(pian)市場,這與(yu)當下的大環境不無關(guan)聯。

去(qu)年(nian),智(zhi)(zhi)(zhi)能終端產品(pin)呈井噴式發展,智(zhi)(zhi)(zhi)能音箱在2018年(nian)第(di)四季度的(de)出貨量增長了95%。日(ri)前,工(gong)信部電(dian)子科(ke)技委副主任莫(mo)瑋曾表示:“中國已成為全球最大的(de)智(zhi)(zhi)(zhi)能終端生產和消費國。”

但業界普(pu)遍認為,終端(duan)智(zhi)能的滲(shen)透率尚不足1%。這意(yi)味(wei)著,智(zhi)能終端(duan)市場(chang)規(gui)模遠未達到預期(qi),也意(yi)味(wei)著終端(duan)AI芯片市場(chang)的巨(ju)大(da)潛力(li)。

基于CGRA架構(gou)研發芯(xin)片(pian)的不止(zhi)清(qing)微智能一家,美國創企Wave Computing采用這一架構(gou)的第二代DPU芯(xin)片(pian)預計將(jiang)在(zai)明(ming)年面世,是一款7nm云(yun)端AI芯(xin)片(pian)。

至于清微智能(neng)是否(fou)有進(jin)軍云端(duan)AI芯片(pian)的計(ji)劃,王(wang)博表示,Thinker團(tuan)隊(dui)之前(qian)曾(ceng)做出過成功的云端(duan)芯片(pian),考(kao)慮到(dao)公司規模和投入階段問題,他們想先在端(duan)側驗證架構的表現是出色的,等下(xia)一階段有了足(zu)夠積累(lei),再去做云端(duan)芯片(pian)。

四、創新架構是AI芯片發展的關鍵

目前AI芯片產(chan)業化還在(zai)起(qi)步階段,從算(suan)法(fa)到算(suan)力(li),能耗比剛剛能滿足用戶基礎(chu)的需(xu)求。

由于AI計算需要很(hen)大算力,但傳統(tong)的馮(feng)·諾依曼(man)架(jia)(jia)構(gou)在(zai)計算密集型任務方(fang)面遇到(dao)了瓶頸,芯片設計底層架(jia)(jia)構(gou)的創(chuang)新成(cheng)為(wei)未來持續發展關鍵,王博(bo)認(ren)為(wei),這也是很(hen)多AI創(chuang)業(ye)公司集中(zhong)出現的原因,大家都(dou)在(zai)同(tong)一(yi)起(qi)跑線(xian)上(shang)。

即便采用同一類架構,如CGRA,設計思路在本質(zhi)上不會(hui)有太多差(cha)別,但每(mei)個處(chu)理元素(su)(PE,Processing Element)中怎(zen)么設計、讓它實現怎(zen)樣的功能、處(chu)理元素(su)之間怎(zen)樣連接更高效……這些細節的設計與創新會(hui)決定(ding)各(ge)家芯片的差(cha)異。

除了架(jia)構(gou)創新(xin),工藝、近閾值(zhi)的技術等方法的進化也很重要,他們能在先進架(jia)構(gou)的基(ji)礎上進一步提升芯片的性能。

王(wang)博也談到,做(zuo)芯片的本質上(shang)還是要獨立(li)流(liu)片以及建立(li)一個(ge)完整的生態系統,而(er)不是把各種(zhong)功能的IP堆在一起就行。做(zuo)好(hao)芯片的前提(ti),是要擁有(you)大量(liang)的芯片行業(ye)積累。

芯片(pian)還需面臨越來越多的場景(jing)去定義(yi)創新,才能將(jiang)前期費用分攤下去,才能盈(ying)利,如(ru)果沒有幾(ji)千萬的場景(jing)去支(zhi)撐,做芯片(pian)的意義(yi)就不存在了。

對(dui)于終端(duan)智(zhi)能而言(yan),上傳(chuan)云(yun)端(duan)的穩定性、延時、隱(yin)私、部(bu)署成本(ben)等問題仍亟待解(jie)決,即將出現的5G將使得更多設(she)備能夠聯網互通,使得這些設(she)備對(dui)終端(duan)智(zhi)能的要求更加明確和(he)豐富。

結語:終端AI芯片落地新戰在即

從清微智(zhi)能(neng)身上,我們看到更加新穎的(de)(de)(de)一種芯片團隊組合,他們不僅擁有(you)來自學術大(da)牛帶隊研(yan)發的(de)(de)(de)前沿創新架構,還擁有(you)產業經驗豐富(fu)的(de)(de)(de)工(gong)程師們。兩強結合之下,清微智(zhi)能(neng)既(ji)擁有(you)高性(xing)能(neng)+極低功耗的(de)(de)(de)芯片,又能(neng)快速推(tui)進產品完成變現。

近(jin)一兩年,一批新(xin)玩家(jia)涌入終端AI芯片市(shi)場,但撇除那些為(wei)了實現垂(chui)直化(hua)整合(he)或優化(hua)自身整體方案(an)的AI算法公司、設備供應商(shang)等跨界玩家(jia),市(shi)場機會逐(zhu)漸聚攏(long)在少(shao)數擁有(you)創新(xin)架構的玩家(jia)身上。

終端AI芯片(pian)的(de)落地之戰(zhan)才剛剛開(kai)始(shi),技(ji)術路(lu)徑、覆蓋場(chang)(chang)景、落地速(su)度、生態擴(kuo)張(zhang)等因素都(dou)有可能將這些玩家(jia)拉(la)開(kai)差距,市場(chang)(chang)將檢驗出(chu)誰是能打持久戰(zhan)的(de)企業。