智東西(公眾號:zhidxcom)
文 | Lina

導語:最近半年以來,人工智能的發展重心逐漸從“軟”到“硬”,相伴而生的是全新一代AI芯片產業的全面崛起。智東西歷經數月,首次對AI芯片全產業鏈上下近百間核心企業進行報道,覆蓋國內外各大巨頭玩家、新興創企、場景應用、代工生產等,全面深入地對芯片產業發展、創新創業進行了追蹤報道。此為智東西AI芯片產業系列報道之一。

在機(ji)器學習算(suan)法(fa)不(bu)斷變化、人(ren)(ren)工智(zhi)能應用不(bu)斷增多(duo)的(de)當下(xia),神經網(wang)絡(luo)計算(suan)芯(xin)片(AI芯(xin)片)的(de)設計者(zhe)們所思考的(de)一個關鍵問題開始浮(fu)出水面——如何(he)在保證AI芯(xin)片性能/功耗表(biao)現優(you)秀的(de)同時,盡可能的(de)在更多(duo)人(ren)(ren)工智(zhi)能算(suan)法(fa)上通(tong)用。

目前市面上陸續涌(yong)現(xian)的AI芯(xin)片(pian)(pian)中,有不少都采用(yong)了重新設(she)計芯(xin)片(pian)(pian)底層架(jia)構的方式,來平衡AI芯(xin)片(pian)(pian)的性(xing)能與AI算法通用(yong)性(xing)之(zhi)間“魚與熊(xiong)掌(zhang)不可兼(jian)得”的矛盾(dun),突出玩家(jia)有寒(han)武紀、谷歌TPU項目等等。

AI芯片終極難題 被清華大學IC男神解決了!

產業界如(ru)此熱火產天的(de)發展,離不(bu)(bu)開學術界此前的(de)長(chang)久積(ji)累。在過(guo)去的(de)十幾年(nian)里,清華(hua)微(wei)電子所的(de)可重構計算團隊一(yi)直在研究一(yi)項核心技術——“軟件定(ding)義芯片”,前年(nian),他們推出了一(yi)款(kuan)代號為Thinker 1的(de)AI芯片,這款(kuan)芯片不(bu)(bu)僅能夠支(zhi)持人臉識(shi)別、語音識(shi)別的(de)AI算法,而(er)且芯片的(de)功耗非(fei)常小(xiao)——只需要7號AA電池就夠讓它(ta)運行一(yi)整年(nian)。

在(zai)2018年(nian)的春節前夕,智東西專(zhuan)門來到清(qing)華大學(xue)校園里,與GTIC 2018重磅嘉賓之(zhi)一,清(qing)華大學(xue)微電子研究(jiu)所所長(chang)(chang)、中國半導(dao)體(ti)行業(ye)協(xie)會(hui)IC設計(ji)分會(hui)理事長(chang)(chang)、我國半導(dao)體(ti)行業(ye)“男(nan)神(shen)”級人物魏(wei)少(shao)軍教授(shou)圍(wei)繞(rao)著AI芯片的話(hua)題(ti)展開了獨家對話(hua)。魏(wei)少(shao)軍教授(shou)有著數十年(nian)半導(dao)體(ti)行業(ye)經驗,對我國半導(dao)體(ti)產業(ye)有著深刻(ke)的認識,看(kan)法往(wang)往(wang)一針見血。

AI芯片終極難題 被清華大學IC男神解決了!

他認為(wei),目前芯(xin)片(pian)架構創新已經引(yin)起了(le)全球各個學(xue)院/企業的(de)廣泛關注,尤(you)其是(shi)“軟件定義芯(xin)片(pian)”相關研(yan)究(jiu),更是(shi)提升AI芯(xin)片(pian)的(de)應用范疇、適(shi)應AI算法不(bu)斷(duan)變化的(de)重(zhong)要(yao)研(yan)究(jiu)方向。在今明兩年之內AI芯(xin)片(pian)將持(chi)續火熱,但(dan)是(shi)到了(le)2020年前后則會行業洗(xi)牌,出(chu)現第一批出(chu)局者。

一、性能 vs 靈活:魚與熊掌不可兼得

芯(xin)片(pian)的性(xing)能跟(gen)通(tong)用性(xing)常常是(shi)一(yi)個(ge)“魚和(he)熊(xiong)掌(zhang)不可兼得”的選項,傳(chuan)統架構下,一(yi)個(ge)芯(xin)片(pian)在某些(xie)特(te)定(ding)領域(yu)的性(xing)能越(yue)強、功(gong)耗越(yue)低,它往(wang)往(wang)就越(yue)不靈活(huo)(huo)、越(yue)不通(tong)用。舉個(ge)例子,華為Mate 10里的麒麟(lin)970芯(xin)片(pian)用于手機的性(xing)能非常強大(da)(da),但(dan)是(shi)它并不適用于安防攝像頭、可穿戴手環等場景;同理,一(yi)個(ge)CPU能夠靈活(huo)(huo)地處理眾多不同任務,但(dan)是(shi)它在某些(xie)特(te)定(ding)任務上往(wang)往(wang)性(xing)能不夠強大(da)(da),比如(ru)在深度神經網絡訓練上的性(xing)能不如(ru)GPU。

而ASIC這(zhe)類(lei)(lei)專用(yong)(yong)芯(xin)(xin)(xin)(xin)片的(de)位(wei)置,則(ze)介(jie)乎于(yu)手機(ji)SoC這(zhe)類(lei)(lei)標準芯(xin)(xin)(xin)(xin)片、與CPU這(zhe)類(lei)(lei)通(tong)用(yong)(yong)芯(xin)(xin)(xin)(xin)片之間——這(zhe)是一(yi)個非(fei)常(chang)尷尬(ga)的(de)地位(wei),標準芯(xin)(xin)(xin)(xin)片雖然單(dan)(dan)個開發(fa)成(cheng)本高(gao),但(dan)是單(dan)(dan)一(yi)品(pin)類(lei)(lei)出貨(huo)(huo)量非(fei)常(chang)大,很大程度上降低了芯(xin)(xin)(xin)(xin)片的(de)單(dan)(dan)個價(jia)格;而通(tong)用(yong)(yong)芯(xin)(xin)(xin)(xin)片則(ze)相反(fan),雖然總體出貨(huo)(huo)量不(bu)高(gao),但(dan)是單(dan)(dan)一(yi)品(pin)類(lei)(lei)的(de)價(jia)格很高(gao),也能夠(gou)分攤研(yan)發(fa)成(cheng)本。

隨著芯(xin)片制(zhi)造工(gong)藝的日益先進(jin)(目前已經逼近7nm),芯(xin)片制(zhi)造成本(ben)也水漲船(chuan)高(gao),如今設計制(zhi)造一顆10nm芯(xin)片的成本(ben)要幾千萬(wan)美(mei)元,綜合(he)成本(ben)高(gao)達上億美(mei)元。

因(yin)此,如(ru)果不能保(bao)證某款單一(yi)應用(yong)(yong)場景下能夠(gou)大量出(chu)貨(huo),專用(yong)(yong)芯(xin)片(pian)需要保(bao)持一(yi)定的通用(yong)(yong)性與靈活度。

最近(jin)兩(liang)年間,產業界(jie)開始陸續涌(yong)現出神經(jing)網(wang)絡計算專用(yong)芯(xin)(xin)片(pian)(AI芯(xin)(xin)片(pian)),寒武紀、深鑒(jian)科技、中星微電子等玩家(jia)的(de)AI芯(xin)(xin)片(pian)產品采用(yong)的(de)都是28nm的(de)芯(xin)(xin)片(pian)工藝(yi),前期從投入到流片(pian)的(de)成本超過400萬美元,單一品類出貨量沒(mei)有百萬的(de)級別將很難收回成本。

而除了(le)成本之外,AI算(suan)法(fa)的(de)(de)演進(jin)也需要納(na)入(ru)考慮。由于(yu)目前(qian)人工智能(neng)算(suan)法(fa)還(huan)在不斷變化、不斷演進(jin)的(de)(de)過程中,人工智能(neng)經歷(li)了(le)六(liu)十(shi)多年的(de)(de)發展才迎來了(le)深度(du)學習的(de)(de)大(da)規模爆發,然而現在深度(du)學習算(suan)法(fa)還(huan)有眾多有待(dai)優化的(de)(de)方面,比如稀疏化、低功耗(hao)、小數據訓練(lian)等(deng),算(suan)法(fa)尚未(wei)定型(xing)。

此外,目(mu)前(qian)語音/文字/圖像/視頻等不(bu)(bu)同(tong)應用(yong)無法使(shi)用(yong)統一算法,然(ran)而許多實際生活中的(de)(de)AI應用(yong)程序(xu)(識別圖像中的(de)(de)對象或(huo)理(li)解(jie)人類語言(yan))需要不(bu)(bu)同(tong)類型(xing)的(de)(de)具有不(bu)(bu)同(tong)層(ceng)數的(de)(de)神經網(wang)絡的(de)(de)組(zu)合。

因此,在確(que)保AI應用(yong)性能(neng)的前提下,AI芯片(pian)需要(yao)盡可能(neng)地保持芯片(pian)通用(yong)性。

目(mu)前AI芯片(pian)(pian)企(qi)業(ye)們采(cai)用(yong)(yong)(yong)的(de)技術方(fang)案(an)各不相同,如果(guo)將(jiang)芯片(pian)(pian)通(tong)用(yong)(yong)(yong)性(xing)(xing)作(zuo)為評測坐標軸,最(zui)左邊、最(zui)激進(jin)的(de)企(qi)業(ye)會采(cai)用(yong)(yong)(yong)算(suan)(suan)法(fa)固化方(fang)案(an),這一(yi)做法(fa)成(cheng)本低、芯片(pian)(pian)落(luo)地時間(jian)短、單(dan)一(yi)算(suan)(suan)法(fa)的(de)性(xing)(xing)能與(yu)(yu)功耗(hao)比(bi)能夠做到(dao)極(ji)致,但是極(ji)大減少了芯片(pian)(pian)的(de)通(tong)用(yong)(yong)(yong)型和靈活(huo)性(xing)(xing);最(zui)右邊的(de)團隊(比(bi)如寒(han)武紀、谷歌TPU等)則會設計一(yi)款全(quan)新的(de)芯片(pian)(pian)架(jia)構,這一(yi)做法(fa)成(cheng)本高昂、芯片(pian)(pian)研發周期長,但是能夠在性(xing)(xing)能與(yu)(yu)芯片(pian)(pian)通(tong)用(yong)(yong)(yong)性(xing)(xing)上達到(dao)極(ji)好的(de)平衡(heng)。

AI芯片終極難題 被清華大學IC男神解決了!

▲清華微(wei)電子所所長魏少軍教(jiao)授

清華微電(dian)子所的可重構計(ji)算團隊(dui)就屬于坐標軸右邊(bian)的一類(lei),從2006年(nian)開始,清華微電(dian)子所所長(chang)魏少軍(jun)教授就帶領著團隊(dui)在(zai)持續深(shen)入研(yan)究這項重要技術——“軟件定義芯片”,又稱“可重構計(ji)算技術”。

“軟(ruan)(ruan)件(jian)定(ding)義(yi)芯片(pian)”顧名思義(yi)就(jiu)是讓芯片(pian)根據軟(ruan)(ruan)件(jian)進(jin)行適應與調整,這(zhe)是一(yi)項專用芯片(pian)架構(gou)設(she)計上的(de)創新(xin),與傳統的(de)馮諾依曼架構(gou)有著很大的(de)區別。簡單來說就(jiu)是將(jiang)軟(ruan)(ruan)件(jian)通過不同(tong)的(de)管道輸送到(dao)硬件(jian)中來執行功能,使得芯片(pian)能夠實時地根據軟(ruan)(ruan)件(jian)/產品的(de)需求改(gai)變(bian)功能,實現更加靈活的(de)芯片(pian)設(she)計。

也(ye)就是(shi)說,沿用(yong)這(zhe)種架(jia)(jia)構(gou)設(she)計(ji)出來的(de)(de)專用(yong)芯(xin)片(pian),可以讓(rang)芯(xin)片(pian)的(de)(de)計(ji)算(suan)能(neng)力按照軟件的(de)(de)需求來調整適應(ying),而(er)不是(shi)沿用(yong)傳統(tong)芯(xin)片(pian)設(she)計(ji)的(de)(de)剛性架(jia)(jia)構(gou),讓(rang)應(ying)用(yong)適應(ying)架(jia)(jia)構(gou)。對(dui)于(yu)現在(zai)尚未定型/統(tong)一(yi)的(de)(de)各類AI算(suan)法而(er)言,可重(zhong)構(gou)計(ji)算(suan)成了AI芯(xin)片(pian)設(she)計(ji)的(de)(de)一(yi)個重(zhong)要研(yan)究方向。

二、Thinker AI芯片:語音圖像雙識別、一節電池用一年

前(qian)年(2016年),依照可重構計算芯(xin)片(pian)的(de)框架,魏少軍教(jiao)授團隊中的(de)尹首一副教(jiao)授帶隊設計研發了一款代號為(wei)Thinker 1的(de)可重構混合(he)神經網(wang)絡(luo)計算芯(xin)片(pian)。

這款(kuan)芯(xin)片(pian)不僅可以動(dong)態地調(diao)整(zheng)計算(suan)和內存需(xu)求,使得芯(xin)片(pian)能(neng)夠(gou)支持人臉識別和語(yu)音識別的(de)神經網絡應(ying)用,而且(qie)芯(xin)片(pian)的(de)功耗非常小——只需(xu)要八節7號AA電(dian)池就夠(gou)讓(rang)它運行一整(zheng)年。

AI芯片終極難題 被清華大學IC男神解決了!

Thinker 1不僅(jin)在AI性能與算法通用性上(shang)取得了突破性的進(jin)展,還獲(huo)(huo)得了學(xue)(xue)術界的重要(yao)認可,在2017 ACM/IEEE ISLPED國(guo)際低功耗電子(zi)學(xue)(xue)與設計會議上(shang),Thinker1獲(huo)(huo)得了設計競(jing)賽獎,這是中國(guo)大陸單位(wei)首次(ci)以(yi)第(di)一完成單位(wei)獲(huo)(huo)得此獎項(xiang)。

魏少軍教授告訴智東西,Thinker 1是(shi)一塊實驗性質(zhi)的驗證(zheng)芯(xin)(xin)(xin)片(pian),為了證(zheng)明“軟(ruan)件定義(yi)芯(xin)(xin)(xin)片(pian)”這一架構(gou)在AI芯(xin)(xin)(xin)片(pian)設計(ji)中的可(ke)行(xing)(xing)性——效果出(chu)奇的好。隨后,可(ke)重構(gou)計(ji)算團隊又打(da)造(zao)了兩款Thinker系列芯(xin)(xin)(xin)片(pian),分別(bie)為Thinker 2人(ren)臉(lian)識別(bie)芯(xin)(xin)(xin)片(pian),能(neng)夠做到(dao)6ms人(ren)臉(lian)識別(bie)(iPhone X為10ms)、準確率超過98%;以及Thinker S語音(yin)識別(bie)芯(xin)(xin)(xin)片(pian),不僅功(gong)耗只有200多微瓦(wa),只需要一節7號AA電池(chi)就運行(xing)(xing)一整年,而且可(ke)以進(jin)行(xing)(xing)聲(sheng)紋識別(bie)。

AI芯片終極難題 被清華大學IC男神解決了!

▲清華大學微電子所提供的Thinker芯片的顯微照(zhao)片

Thinker可以嵌(qian)入到(dao)很多小型設(she)備中,包括(kuo)智能手機(ji)、手表(biao)、家用機(ji)器人、或遠程控制(zhi)的(de)(de)儀器設(she)備等。目前,研究團隊(dui)與廠商(shang)溝通(tong)Thinker芯(xin)片的(de)(de)產業化(hua)方案,此前也有報道稱最快今(jin)年(nian)三月我們就能看(kan)到(dao)第一款(kuan)搭載Thinker芯(xin)片的(de)(de)端智能產品。不過清華微電(dian)子所將會將這一技術授權予企(qi)業使用,高(gao)校本身不會進行產業化(hua)。

魏少軍(jun)教授說(shuo),清華微(wei)電子(zi)所在可重(zhong)構計(ji)算上已經投(tou)入(ru)了十多年的(de)研發,此(ci)前一(yi)直將重(zhong)心放在在其他芯片的(de)研究上,將這一(yi)架構用于AI芯片的(de)設計(ji)并(bing)且(qie)能取得如此(ci)好的(de)效果,完全(quan)是“意(yi)外之(zhi)喜”。下一(yi)步,可重(zhong)構計(ji)算團隊將會加(jia)大基礎研究(尤其是編(bian)譯器等相關軟件(jian))的(de)研發投(tou)入(ru),并(bing)且(qie)進(jin)一(yi)步推動(dong)產業(ye)應用與企(qi)業(ye)合作的(de)進(jin)程。

除了(le)人工智能(AI)外,這項技(ji)術在(zai)信息安全芯片、可編程邏輯(ji)器(qi)件(jian)、可穿戴計(ji)算芯片等領(ling)(ling)域都獲(huo)得了(le)批量應用(yong)。魏少軍教授(shou)帶領(ling)(ling)的可重(zhong)構(gou)計(ji)算團隊也獲(huo)得了(le)國家(jia)863計(ji)劃(hua)兩(liang)期支(zhi)持(chi)、2015年國家(jia)技(ji)術發(fa)明二等獎、2014年教育部技(ji)術發(fa)明一等獎等國家(jia)榮譽。

去年(nian)12月,清(qing)華微電子(zi)所、瀾起科技、英特爾(er)還聯(lian)合(he)推出了(le)基于此(ci)項技術(shu)研發的(de)(de)津逮服務器CPU,不僅(jin)能夠(gou)大幅提升(sheng)云端服務器的(de)(de)計算能效,還能實時(shi)監測、甄別和管(guan)控,極大增強CPU芯片的(de)(de)硬件安全性。

三、AI芯片廣泛用于安防監控?“可能走錯路了”

目前AI應用(yong)仍處(chu)(chu)于早(zao)期階段,主要還是集中(zhong)在互聯網(wang)應用(yong),需要在云(yun)端處(chu)(chu)理,端智能方(fang)面并沒有較多普及。

在這一輪興起的(de)(de)人工智能(AI)浪潮(chao)中,最為(wei)火熱(re)、最頻繁地(di)(di)被人提(ti)起的(de)(de)落地(di)(di)行(xing)業(ye)莫過(guo)于安(an)(an)防了——或(huo)者更準確來說,是基(ji)于安(an)(an)防監控攝像頭(tou)的(de)(de)人臉識別應用。這不僅是眾多AI芯(xin)片、AI平(ping)臺(tai)應用廠(chang)商都在瞄準的(de)(de)行(xing)業(ye),各家(jia)傳統(tong)安(an)(an)防巨頭(tou)也都躍躍欲(yu)試瞄準了AI+安(an)(an)防。

然(ran)而在(zai)交談中(zhong),魏少軍教授向智(zhi)東西提到,現在(zai)的AI芯片(pian)應用在(zai)視(shi)頻(pin)監控上,很有可能是走錯路了。

由(you)于目前的安防(fang)監控(kong)(kong)智能化還(huan)是以人(ren)臉識別為主,然而在廣場、車站等遠距(ju)離(li)、廣泛監控(kong)(kong)的場景下,根本(ben)沒可能看清人(ren)臉,

這些場(chang)景的(de)人臉識(shi)別項(xiang)目雖(sui)然是個看(kan)似純技術角度可行的(de)項(xiang)目,然而一旦(dan)設(she)計光照、遮擋、攝像頭清晰度、以及可承載的(de)芯(xin)片(pian)算力(li)、網絡帶寬等工程化問題,情況(kuang)就會變(bian)得(de)非(fei)常復雜。

AI芯片終極難題 被清華大學IC男神解決了!

▲2008年北京奧運(yun)會(hui)人臉票證

一位有(you)著傳(chuan)統芯(xin)片廠商與(yu)安(an)(an)防廠商雙背景,曾參與(yu)過(guo)2008年奧運(yun)會“刷臉(lian)(lian)門票(piao)”、天(tian)安(an)(an)門廣場安(an)(an)防布(bu)控等項(xiang)目(mu)的(de)(de)AI芯(xin)片初(chu)創CEO也曾經(jing)告訴我類(lei)似的(de)(de)結果,中遠(yuan)距離內大型(xing)廣場內的(de)(de)人(ren)臉(lian)(lian)識別項(xiang)目(mu)——比如天(tian)安(an)(an)門廣場人(ren)臉(lian)(lian)識別項(xiang)目(mu)——根據(ju)去年天(tian)安(an)(an)門分局的(de)(de)調研結果顯示,這項(xiang)目(mu)仍舊(jiu)有(you)著巨大的(de)(de)實現難(nan)度(du),是(shi)個美好(hao)的(de)(de)“理論幻(huan)想(xiang)”。

如果我們按照智能(neng)攝像頭車牌(pai)(pai)識(shi)別(bie)的技術類(lei)推,經過了(le)(le)十幾(ji)年的技術演(yan)進(jin)、形態變遷后,目前北京市共(gong)有65萬(wan)路(lu)交通攝像頭,其中能(neng)夠進(jin)行(xing)智能(neng)車牌(pai)(pai)識(shi)別(bie)的只有公安的3000路(lu)、停車場的3萬(wan)路(lu),而且是只有在光照、畫面對(dui)其等問題都(dou)解(jie)決了(le)(le),才能(neng)在特定路(lu)口、特定場景下實(shi)現——而人臉識(shi)別(bie)遠比車牌(pai)(pai)識(shi)別(bie)要復雜(za)得多。

因此(ci),AI安防雖然可以在(zai)局部場景(比如中(zhong)短距離、室(shi)內(nei)監控、門(men)禁刷臉、車輛識別等)落地,但是(shi)離真正的(de)安防廣泛應用(yong)還差得很遠。魏少軍教授說,AI只是(shi)方法、AI芯片(pian)只是(shi)手段,但是(shi)最重要的(de)還是(shi)AI的(de)應用(yong)落地。

結語:AI芯片2020年或將進入洗牌期

魏少軍教授認為,我(wo)國的芯片工(gong)藝技(ji)術與發達國家相比,還存在兩三代工(gong)藝的差(cha)距;我(wo)們(men)原(yuan)來希(xi)望在2020年以前,與國際最先進制(zhi)造(zao)工(gong)藝水平(ping)的差(cha)距,不要(yao)大于兩代,現在看來實現較(jiao)為困難。此外(wai),在芯片行(xing)業的人才、產能(neng)、研發、設計(ji)等幾大重要(yao)因素上,我(wo)們(men)的產業缺口仍就比較(jiao)明顯。

我國的芯(xin)(xin)片(pian)(pian)(pian)產業目前(qian)在高端(duan)芯(xin)(xin)片(pian)(pian)(pian)的發展上遇到了很多挑戰,如果我們依舊遵循傳統的架構以跟隨的腳步進行發展,將(jiang)會始終(zhong)落后于(yu)人——因此(ci),從芯(xin)(xin)片(pian)(pian)(pian)設計底層架構上的創(chuang)新尤為重要。目前(qian)我們在軟件定義芯(xin)(xin)片(pian)(pian)(pian)、AI芯(xin)(xin)片(pian)(pian)(pian)等這類傳統芯(xin)(xin)片(pian)(pian)(pian)業的“破(po)冰者”方面已經取得了不錯的研究成績(ji),值得加大投入力度。

魏少軍(jun)教(jiao)授(shou)認(ren)為(wei),從產業(ye)發展規律來看(kan),在今明兩年(nian)之內AI芯片將(jiang)持續火熱,大家(jia)扎堆進(jin)入;但是到了2020年(nian)前后,則將(jiang)會出現一(yi)批(pi)出局者(zhe),行業(ye)洗牌開始(shi)。由于目前AI算法還在不斷演進(jin)匯總(zong)的過(guo)程中,最(zui)終的成功與否則將(jiang)取決于各家(jia)技(ji)術路(lu)徑的選擇和產品落地的速度。


每日一頭條

趨勢·深度·犀利·干貨,最專業的行業解讀

深喉(hou)爆料、投稿:guoren@sanyasheying.cn

AI芯片終極難題 被清華大學IC男神解決了!