智東西(公眾號:zhidxcom)
文 | Lina

昨天,英偉達2017 GTC China(GPU技術大會中國分會場)在北京舉行,智東西作為特邀媒體,從Keynote大廳第一排發來CEO黃仁勛主題演講的重磅報道(黃仁勛北京激情演講2小時:搞定國內10大科技巨頭 發布最強AI引擎!【附百張完整PPT】)。

專訪黃仁勛:5年革命機器人產業;AI芯片將會無處不在

演講(jiang)后(hou),黃(huang)仁勛又(you)接受了智東西等媒體的專訪,這位(wei)粉絲愛(ai)稱(cheng)“老黃(huang)/黃(huang)教主”的CEO幽默且(qie)健談,不僅談及計算力、機器人、AI醫療、自動駕駛等問題、還與智東西交流探討(tao)了關(guan)于(yu)“英偉達云”以(yi)及最近大火的“AI芯片(pian)”。

專訪黃仁勛:5年革命機器人產業;AI芯片將會無處不在

(智東西記者與老(lao)黃的合影)

一、“AI芯片”將無所不在

從最(zui)近的華(hua)為(wei)麒麟970、到蘋(pin)果的A11,AI芯(xin)片/端智能似乎(hu)已經(jing)越來越成為(wei)趨勢(shi)所在,AI在終端的落(luo)地也已經(jing)從軟(ruan)件層(ceng)步入(ru)硬件層(ceng)。那么這是否(fou)意味著未來我(wo)們(men)將從云智能走向(xiang)端智能呢(ni)?

面對智東西的(de)這個問題,黃仁(ren)勛首先回答——未來是“云智能(neng)+端智能(neng)”的(de)時代,AI將無處不在。

未來(lai),像咖啡(fei)機(ji)、保溫杯、麥克風、甚至耳環、鞋(xie)子這些小物件(jian)都會智(zhi)(zhi)能(neng)化(hua),但(dan)是(shi)(shi)它們的處(chu)理(li)(li)芯片并(bing)不(bu)需要特別強大的通用智(zhi)(zhi)能(neng),而是(shi)(shi)針對非常窄的專(zhuan)門領域進行智(zhi)(zhi)能(neng)化(hua),比如一(yi)個麥克風,只需要聲音方面(mian)的AI處(chu)理(li)(li)能(neng)力。

而云智能(neng)將(jiang)會是通用(yong)智能(neng),視覺、聲(sheng)音、數(shu)據等(deng)等(deng),需(xu)要擁(yong)有一(yi)切(qie)(qie)AI處理的(de)能(neng)力。而英(ying)偉(wei)達這(zhe)些高性(xing)能(neng)、大功耗的(de)GPU在云數(shu)據中心上有著切(qie)(qie)實的(de)用(yong)武之地(比(bi)如老黃在上午的(de)演講中就特別提到(dao)了與BAT三朵云的(de)合作,以及又宣傳了一(yi)下(xia)基于新GPU Tesla V100推出的(de)HGX云計算服務器)

不過,目前英偉達主打終(zhong)端的(de)GPU板卡是(shi)Jetson TX2,這塊搭載4核CPU的(de)Pascal架構GPU標(biao)準功(gong)耗為(wei)7.5W,遠小于英偉達其他(ta)動輒幾十上百W的(de)GPU,但對于功(gong)耗極為(wei)敏感(gan)的(de)超小型設(she)備,這個功(gong)率還是(shi)太大。

為了解決(jue)這一問題,英偉達(da)于昨(zuo)天正式開源了DLA(深度學(xue)習加速器)架構,廠商可以(yi)免費(fei)下載(zai)這個專(zhuan)為IoT設備設計的AI架構,自(zi)己打造低功耗(hao)的AI芯片。

二、“英偉達云”在十月第一周推出

在(zai)今(jin)年(nian)5月時,英偉達曾在(zai)美國主會場舉辦2017 GTC,并且推出了(le)“英偉達GPU云(NVIDIA GPU Cloud)”。

專訪黃仁勛:5年革命機器人產業;AI芯片將會無處不在

先別誤會,英偉達(da)(da)并(bing)不是在(zai)和亞(ya)馬遜AWS、微軟Azure搶生意的,這個“英偉達(da)(da)云”是在(zai)這些云上運行的,并(bing)不為用戶提供儲(chu)存、計算等能(neng)力,而是可(ke)以理(li)解成(cheng)一套線上深度學習軟件(jian)集合。

這個英偉達(da)云能讓(rang)人輕(qing)易地(di)從零開(kai)始(shi)搭(da)建一個深度學(xue)習(xi)的(de)項(xiang)目(mu),不(bu)用買(mai)GPU、也不(bu)用搭(da)環境,控制中心還是可(ke)視化(hua)的(de),可(ke)以看到你的(de)賬號之前的(de)項(xiang)目(mu)和正在運(yun)行中的(de)項(xiang)目(mu),非常方便。

專訪黃仁勛:5年革命機器人產業;AI芯片將會無處不在

從(cong)當時的DEMO中可以看出(chu),用戶登錄了英(ying)偉達云之后,只需(xu)要3步就可以創建自己的深度學習項目:

1、選擇計算環境(既可以選擇英偉達云、亞馬遜云等,也選擇本地GPU計算)
2、接入數據庫(可以選擇現有數據庫如ImageNet,或者自己上傳)
3、選擇框架(jia)(如Caffe、TensorFlow等(deng))

在本次GTC China上,黃仁(ren)勛(xun)并沒有宣布關于這個(ge)英偉(wei)達云的新進展,智東西專(zhuan)門就這個(ge)問(wen)題詢(xun)問(wen)了黃仁(ren)勛(xun)。老(lao)黃表示,英偉(wei)達云項目進展很順利(li),如無意外今(jin)年十(shi)月(yue)的第一周就能正式跟大家見面了。

三、5-10年內革命機器人產業

同樣是在昨天上午的Keynote演(yan)講里,黃仁勛(xun)再次(ci)介紹了(le)ISSAC機(ji)器人(ren)訓練(lian)平臺,并且(qie)正式(shi)宣布推出了(le)世(shi)界第一款用于自動(dong)機(ji)器人(ren)的處理器(芯片)Xavier,為機(ji)器人(ren)提供從軟件到(dao)硬件的全方位(wei)支持。

專訪黃仁勛:5年革命機器人產業;AI芯片將會無處不在

Xavier芯片已經用在(zai)(zai)京東的(de)倉儲(chu)機(ji)器(qi)(qi)人(ren)jROVER+京東送貨無人(ren)機(ji)jDRONE等一(yi)(yi)系列自主機(ji)器(qi)(qi)當中(zhong)。它集(ji)成了(le)8核CPU、Volta TensorCore & CUDA GPU、傳感器(qi)(qi)、8K HDR VP、以及CVA。可以應用在(zai)(zai)30TOPS的(de)計(ji)算(suan)機(ji)視覺、深度學(xue)習等機(ji)器(qi)(qi)人(ren)所(suo)需要的(de)技(ji)能領域,有著超高計(ji)算(suan)力與超高能效(xiao)比。這款(kuan)處理器(qi)(qi)將于2018年第一(yi)(yi)季(ji)度提供給早期合作伙伴,2018年第四季(ji)度全(quan)面推出。

專訪黃仁勛:5年革命機器人產業;AI芯片將會無處不在

ISSAC則是今年5月英偉(wei)達推出的(de)用于訓練機器(qi)人的(de)增(zeng)強學習世界(jie)模擬器(qi)(ISAAC Robot Simulator)模擬真實(shi)世界(jie)的(de)邏輯、原理(li)、物理(li)定(ding)律等,然后再將(jiang)機器(qi)放進(jin)這個世界(jie)里不斷訓練,并且不用遵循物理(li)時(shi)間規(gui)律,將(jiang)原本(ben)需要幾年的(de)訓練壓縮到幾天甚至幾個小時(shi)。

老黃認為,現在(zai)再看機器(qi)人,需(xu)要忽略傳(chuan)感器(qi)、電(dian)氣化、自動化等(deng)等(deng)傳(chuan)統機械問題,轉而關注(zhu)于AI及自主(zhu)機器(qi)(Autonomous Machine)。而想要打造自主(zhu)機器(qi)人,則(ze)需(xu)要解決(jue)三個:

1)創造一個用于自主機器的AI平臺,比如增強學習。
2)創造一個虛擬環境,讓這些機器人在其中自己學會”怎么當一個機器人(learn to be a robot)”
3)當(dang)這些機器(qi)人學會怎么當(dang)機器(qi)人之后,我(wo)們海需(xu)要把AI大腦拿出來,放進一個專(zhuan)用的自主(zhu)機器(qi)處理器(qi)中。

目前的這三個(ge)問題還沒有(you)完全(quan)解(jie)決,但是(shi)老黃表示,我(wo)們已經在努(nu)力啦!AI引擎(qing)、ISSAC虛擬機器人(ren)訓練平臺、還有(you)Xavier處(chu)理器,英偉達的這三項(xiang)工作正在并行推進中,屬于一(yi)個(ge)打(da)造產業基礎架(jia)構的“打(da)地(di)基”過程。預計到了(le)明天,這些“地(di)基”就能(neng)打(da)好了(le)。

基礎都打好后,產(chan)(chan)業界就可以在(zai)這(zhe)些基礎架構上快速推動生產(chan)(chan)。老黃預測,在(zai)未(wei)來(lai)5-10年間(jian),這(zhe)些將會為機器人(ren)產(chan)(chan)業帶(dai)來(lai)難以置信的進(jin)步。

智東西隨后(hou)也(ye)針對Xavier、ISSAC等(deng)話題跟(gen)英(ying)偉達智能機器副(fu)總裁Deepu Talla進行了專訪,后(hou)續將會有詳細報道,敬請(qing)期待(dai)~

四、GPU、CPU、ASIC之爭

1)GPU不會取代CPU

首先是CPU,雖然在(zai)昨天上午的(de)主題(ti)演講中,老(lao)黃拿(na)CPU開了(le)不少(shao)涮,但是他(ta)認為歸根(gen)到(dao)底(di),GPU永遠不會取代CPU。CPU擅長(chang)處(chu)理所有(you)問題(ti),是通用(yong)處(chu)理器,而GPU則更適合處(chu)理專用(yong)問題(ti),有(you)時(shi)甚至能有(you)著數(shu)十上百倍的(de)性能優勢。

因此,CPU+GPU的(de)架構才(cai)是(shi)合理的(de)。

2)比ASIC更靈活,市場更大、生態系統更豐富

正(zheng)如(ru)前文所說,隨著谷(gu)歌(ge)TPU、蘋(pin)果A11等產品(pin)的推出(chu),各公司打造(zao)自(zi)己定(ding)制(zhi)化(hua)的AI芯片似乎已經(jing)越來越成(cheng)為趨(qu)勢(shi)所在。這種(zhong)定(ding)制(zhi)化(hua)AI芯片屬于ASIC(專用(yong)集(ji)成(cheng)電路,Application Specific Integrated Circuit),是根(gen)據(ju)特定(ding)的需求而(er)專門設計并(bing)制(zhi)造(zao)出(chu)的板卡(ka)。

由于(yu)是針對某種(zhong)AI功能打造的(de),ASIC較之(zhi)GPU,在某些單點(dian)性(xing)能上(shang)會有(you)著明顯的(de)優(you)勢(shi)。比如(ru)谷歌的(de)TPU,在TensorFlow框(kuang)架下的(de)計算性(xing)能比GPU更(geng)有(you)優(you)勢(shi),而一些IoT的(de)定制AI板卡也會比GPU功耗更(geng)小。

老黃認為(wei),GPU的通用性使(shi)得它不僅支持(chi)(chi)TensorFlow框(kuang)架(jia),還支持(chi)(chi)Caffe2、mxnet、PaddlePaddle等市(shi)面上所有深(shen)度學(xue)習開源框(kuang)架(jia),而且能做視頻編解碼、圖像(xiang)處理、語音等一系列(lie)AI應(ying)用,更加靈(ling)(ling)活。而更靈(ling)(ling)活則意(yi)味著市(shi)場機會更多、市(shi)場更大,研發預算更多,生態(tai)系統更豐富。

三年前,英偉達(da)選擇將(jiang)GPU打(da)造成一(yi)個(ge)專注于(yu)Tensor架構的執行處理(li)(li)器(qi)(qi)(如果覺得這個(ge)概念太生澀,那就大概理(li)(li)解(jie)成AI網絡(luo)架構處理(li)(li)器(qi)(qi)吧),隨后又衍生出TensorRT、TensorCore等輔助軟(ruan)件平臺/加速器(qi)(qi),使得GPU現在成為世界上最(zui)好的通用Tensor處理(li)(li)器(qi)(qi)。

其(qi)實,關于GPU和ASIC板卡(ka)的爭論(lun)早已有之,尤其(qi)是谷歌(ge)的TPU,從(cong)項目(mu)宣布的那一刻起(qi)就(jiu)有無數人拿TPU去跟GPU比較,比性能(neng)、比功耗、比延時等等,本(ben)次采訪中也有不少人就(jiu)此(ci)問(wen)題向老黃提問(wen)。

但(dan)也許,這個問題(ti)不應該這么比較。

現(xian)在市面上需(xu)要(yao)AI計(ji)算(suan)能力的(de)公司(si)成(cheng)千上萬(wan),類(lei)似谷歌這樣的(de)科技(ji)巨頭們,有(you)技(ji)術、有(you)資源、同時也(ye)有(you)強(qiang)烈的(de)需(xu)求(公司(si)的(de)大體量決定了,只要(yao)每塊(kuai)板卡(ka)功耗降低(di)一點,總體功耗就能降低(di)許多)打造(zao)一塊(kuai)更加適(shi)合自(zi)己業務的(de)AI板卡(ka)。

他們可以選擇和芯(xin)片(pian)公司合作(zuo)打造專用(yong)AI芯(xin)片(pian),但是英偉達似乎(hu)更(geng)希(xi)望做一個通(tong)用(yong)的(de)AI計算平臺,瞄準更(geng)大的(de)市場,這也是為什么老黃一再強調(diao),往上看(kan)英偉達的(de)GPU支持所(suo)有深(shen)度學習開源框(kuang)架,往下(xia)看(kan)它支持所(suo)有AI應(ying)用(yong)。

從這兩天傳言(yan)特斯拉要(yao)“拋(pao)棄(qi)英(ying)偉(wei)達”聯(lian)合(he)AMD開發專用自(zi)動(dong)駕駛芯(xin)(xin)片的新(xin)聞中也可見,英(ying)偉(wei)達似(si)乎(hu)并沒有(you)為(wei)哪家巨頭獨(du)立打造(zao)專屬AI芯(xin)(xin)片的意思。

至于谷(gu)歌(ge)或(huo)是特斯(si)拉是否會(hui)靠售賣這些芯(xin)(xin)片(pian)(pian)盈利呢?短期內應(ying)該不(bu)會(hui)。兩(liang)者產(chan)業(ye)鏈構(gou)成完(wan)全不(bu)同,賣芯(xin)(xin)片(pian)(pian)并不(bu)是谷(gu)歌(ge)或(huo)是特斯(si)拉擅長的領(ling)域。

而(er)對(dui)于更為(wei)廣(guang)闊的(de)(de)(de)市場而(er)言,其他中小型公司(si)并不具備這樣的(de)(de)(de)技術與資源(yuan),他們(men)需要(yao)購買AI計(ji)算能力(li),而(er)一(yi)塊(kuai)通用的(de)(de)(de)、支持所(suo)有AI網絡(luo)架構、支持所(suo)有、并且計(ji)算性能非常強大的(de)(de)(de)GPU自(zi)然(ran)成了首(shou)選。當使(shi)用GPU的(de)(de)(de)AI公司(si)數量(liang)達到(dao)一(yi)定水平后,生態的(de)(de)(de)力(li)量(liang)也就顯(xian)露(lu)了出來。

這也是為什么,在人工智能(neng)時代,英偉達的股(gu)價(jia)能(neng)夠一路(lu)飆升,成(cheng)為AI屆的“當紅(hong)辣(la)子雞”。

如果真要(yao)說對英(ying)偉達(da)可能造成(cheng)的影(ying)響(xiang),那大概就是谷歌會(hui)減少對GPU的購買吧(ba)。

當然(ran)從長(chang)期(qi)來(lai)看(kan),英偉(wei)達(da)也(ye)可(ke)能面臨(lin)著AI計算能力(li)云端化,AI芯(xin)片專業化并且(qie)平價化的趨勢。對(dui)于前者(zhe)而(er)(er)言,現在(zai)英偉(wei)達(da)正努力(li)推進云數據中心業務(wu),而(er)(er)對(dui)于后者(zhe)而(er)(er)言,英偉(wei)達(da)也(ye)開源了(le)DLA框架,暫時(shi)讓廠家免費(fei)使用,打造自己的低(di)功耗(hao)AI芯(xin)片。至于未來(lai)是否會靠DLA框架來(lai)收(shou)取專利費(fei),成(cheng)為新型商業變現模式,那(nei)就是另(ling)一個故事了(le)。

專訪黃仁勛:5年革命機器人產業;AI芯片將會無處不在