芯東西(ID:aichip001
編輯 |? 溫淑

GTIC 2020全(quan)球AI芯(xin)片(pian)創新(xin)峰會(hui)剛(gang)剛(gang)在北京圓滿(man)收官!在這(zhe)場全(quan)天(tian)座無(wu)虛席、全(quan)網直播觀看人數(shu)逾150萬次的高規(gui)格AI芯(xin)片(pian)產業峰會(hui)上(shang),19位(wei)產學界重磅嘉賓(bin)從不同維度分(fen)享了對中國AI芯(xin)片(pian)自(zi)主創新(xin)和應用落(luo)地的觀察與(yu)預判。

在峰會上午場,地平線首席戰略官鄭治泰,發表了題為《軟件2.0時代AI芯(xin)片(pian)的(de)挑(tiao)戰》的(de)演講。

地平線鄭治泰:深度解讀軟件2.0時代AI無人化“玩法” | GTIC2020

▲地(di)平線首(shou)席(xi)戰略官鄭治泰

鄭治泰認為,AI系統的數據系統和計算系統,是軟件2.0時代的兩大要素。在未來,機器將解決AI系統中的大部分問題,而人類科學家則負責對AI系統的算法參數進行調優。據此,地平線推出MAPS(在精度有保障范圍內的平均處理速度)評估方法,為人類科(ke)學家調優AI系(xi)統提(ti)供(gong)輔助。MAPS系(xi)統可通過可視化、量(liang)化的(de)方(fang)式,在合(he)理(li)的(de)精度范圍內,從“快(kuai)”和“準”兩個維度評估芯片對數據的(de)平均處(chu)理(li)速度。

此外,鄭治泰透露,地平(ping)線征程(cheng)5芯片正在研(yan)發中,將于(yu)明(ming)年發布(bu)。相比(bi)業界某品牌同(tong)樣計(ji)劃于(yu)明(ming)年發布(bu)的(de)GPU新(xin)品,征程(cheng)5芯片有(you)望實現至少3倍的(de)性(xing)能提升。

一、軟件2.0時代,AI系統具備兩大要素

在過去的五年中,地平線取得了比較好的商業成就。去年到今年,地平線的AI芯片實現量產上車,并已達到10萬的出貨量。明年,地平線將挑戰100萬的AI芯片出貨量。

這些商(shang)業(ye)結(jie)(jie)果源于地平線對技術棧(zhan)、技術趨(qu)勢(shi)的把握。在(zai)今(jin)天看(kan)得到的商(shang)業(ye)化落地結(jie)(jie)果背后,最(zui)根本的是面向未來的思(si)考。

借助GTIC 2020 AI芯片創新峰會的平臺,鄭治泰分享了其對軟件2.0時代的思考(kao),并(bing)回顧(gu)了人工智能(neng)發展的歷史。

鄭治泰認為,在軟件2.0時代,數據系統和計算系統兩個部分構成了整個AI系統。這其(qi)(qi)中,無論是數據系統還是計算系統,均由機器學習技術來解決最困難、最復雜的部(bu)分,人已經(jing)不在其(qi)(qi)中發揮太多的作用。

當人和專家不再成為數據系統和計算的瓶頸的時候,人類社會將會發生質變,人類將大踏步地進入到AI時代(dai)。到那時,由(you)自動駕(jia)駛引發的機器人時代(dai)也(ye)必將開啟。

地平線鄭治泰:深度解讀軟件2.0時代AI無人化“玩法” | GTIC2020

二、未來要實現AI系統的閉環無人化應用

鄭治泰認為,AI問題,特別是面向一個復雜物理世界的問題,需要一個新的解決范式。

傳(chuan)統的(de)算(suan)法(fa)采用的(de)是拆解問題(ti)的(de)范式(shi),即把(ba)問題(ti)分解為子系統、子系統被分解為子模塊、在(zai)子模塊應用核心(xin)的(de)算(suan)法(fa)。現在(zai)看來,這種方式(shi)幾(ji)乎(hu)失靈(ling)了。

大家可以想見,假設一臺車在北京出廠,它的用戶可能在新疆、海南、沙漠等地。如果這臺車產生的巨量corner case(極端(duan)情況),只能依靠專家、標定(ding)人(ren)員、測(ce)試人(ren)員進行重新(xin)優化和迭代算法,那(nei)么我們(men)可能永遠(yuan)無法實(shi)現人(ren)工(gong)智能驅動(dong)的自動(dong)駕駛。

也就是說,在未來的時候,我們需要實現整個人工智能系統的閉環無人化應用。

回顧(gu)機(ji)器(qi)視覺的(de)發展(zhan),非常經(jing)典的(de)應用是(shi)用機(ji)器(qi)視覺方法識(shi)別圖(tu)片中(zhong)的(de)貓狗。這(zhe)一應用中(zhong),計算(suan)機(ji)識(shi)別不同(tong)的(de)點陣數(shu)據,并進行數(shu)據計算(suan)。最終(zhong),計算(suan)機(ji)給出一個(ge)范式,確定圖(tu)片中(zhong)是(shi)貓還(huan)是(shi)狗。這(zhe)個(ge)問題剛被提(ti)出時,大家認(ren)為它的(de)難度僅相當于(yu)一個(ge)本科生暑假(jia)作業的(de)難度。

但是人類社會對AI走(zou)進物理世界的(de)追求并(bing)未(wei)停止(zhi)。在(zai)整個科(ke)技向前發展的(de)過程中,盡(jin)管(guan)面臨失敗(bai),科(ke)學家仍一(yi)次又一(yi)次地嘗試,去掌控發展的(de)節(jie)奏和參與(yu)其中。

地平線鄭治泰:深度解讀軟件2.0時代AI無人化“玩法” | GTIC2020

最初,機器視覺鼻祖馬爾提出分解的機器視覺方法。1986年到1990年間,人們(men)用分解(jie)(jie)的方案解(jie)(jie)決機器(qi)視覺(jue)問題,即對(dui)(dui)整個圖(tu)進行描(miao)邊,形成有景深(shen)信息的二維圖(tu)片(pian)(pian),再(zai)通過(guo)完(wan)整的幾何計(ji)算,抽(chou)象出三維物體(ti)(ti)。后來,人們(men)發現這(zhe)一解(jie)(jie)決方案存在局(ju)限性,這(zhe)是因(yin)為當面對(dui)(dui)不同(tong)(tong)角度下同(tong)(tong)一物體(ti)(ti)的圖(tu)片(pian)(pian),或者同(tong)(tong)一角度不同(tong)(tong)光影下的物體(ti)(ti)圖(tu)片(pian)(pian)時(shi),計(ji)算機無(wu)法用上(shang)述的拆解(jie)(jie)數學模型(xing)去定義物體(ti)(ti)。

1990年(nian)代,人工智(zhi)能進入到下一個階段。科學家往后退了一步,將所有的(de)物體(ti)類(lei)別(bie)(bie)定義出來,全部(bu)由數據系統使用機器識別(bie)(bie)方法去實現,通過不(bu)斷調(diao)優、不(bu)停移(yi)動分類(lei)面,提(ti)升識別(bie)(bie)的(de)精度和準確率。

后來(lai),人們(men)又發現這一方(fang)法仍(reng)無(wu)法解決所有問題(ti)。在整(zheng)個物理世界中,一臺車(che)面對著十分復雜的(de)外部環境,人類想(xiang)用幾(ji)個簡單(dan)的(de)數學(xue)公式集合完成整(zheng)個定(ding)義(yi)是不可能的(de)。

2012年至今,機器視覺發生了一個深刻的變革。科學家和碼農開始把整個計算過程全部交由機器去做,讓計算機做識別,而科學家則承擔模型結構和算法超參數調優的工作。這一過程中,基于隨機的算法和參數,科學家評估輸入輸出的結果,不斷對不正確的gap進行反向調優。

2017年,專(zhuan)家又后退一步(bu),將模型(xing)(xing)結構設(she)計也交由機(ji)器(qi)(qi)學習來設(she)計,依(yi)賴TPU提供的(de)充沛(pei)算力。到2019年,機(ji)器(qi)(qi)設(she)計的(de)模型(xing)(xing)性能遠超過人(ren)類專(zhuan)家設(she)計出來的(de)模型(xing)(xing)。

在軟件2.0時代,不增(zeng)(zeng)加(jia)數據(ju)的(de)(de)(de)量(liang)(liang)(liang),而增(zeng)(zeng)加(jia)計(ji)算量(liang)(liang)(liang)的(de)(de)(de)時候,人(ren)們(men)發現模型識(shi)(shi)別(bie)的(de)(de)(de)錯(cuo)(cuo)誤(wu)率(lv)(lv)下降一半。如(ru)果(guo)數據(ju)量(liang)(liang)(liang)和計(ji)算量(liang)(liang)(liang)都提升的(de)(de)(de)話,模型識(shi)(shi)別(bie)錯(cuo)(cuo)誤(wu)率(lv)(lv)下降三(san)分之二(er)。增(zeng)(zeng)加(jia)計(ji)算量(liang)(liang)(liang)、增(zeng)(zeng)加(jia)數據(ju)量(liang)(liang)(liang),都可(ke)以自動化進行。這意味著機(ji)器(qi)自動化、持續降低識(shi)(shi)別(bie)錯(cuo)(cuo)誤(wu)率(lv)(lv)是可(ke)能的(de)(de)(de)。

為什么在海量數據和大模型的時代,機器會比人更加厲害?鄭治泰稱,這(zhe)是因為人類專家在抽象、局部(bu)有限的(de)(de)小(xiao)數據、小(xiao)模型應用中占據優(you)勢。但在大數據、大模型的(de)(de)應用中,計算機的(de)(de)準確識別(bie)和網絡(luo)設計能力,能夠超常發(fa)揮。

現在,利用機器學習重新開發和設計網絡模型、重新計算識別的精度協議的趨勢,并沒有顯示出終止的跡象,這就催生出一個非常重要的可能性,即我們可以面向物理世界,提供AI服務,即全自動無人駕駛汽車等像人一樣的智能

三、借助MAPS評估方法為產業鏈賦能

針對AI系統的數據和計算,這兩大軟件2.0時代的(de)核心要(yao)素,人(ren)類工程(cheng)師(shi)在打造數據系統的(de)閉環、提(ti)升數據閉環效率(lv)的(de)同時,還要(yao)結合軟(ruan)件(jian)和(he)硬(ying)件(jian)底層的(de)邏(luo)輯設計(ji),逐步提(ti)高計(ji)算的(de)效率(lv)和(he)性能。

基于此,地平線提出MAPS(在精度有保障范(fan)圍(wei)內的平均(jun)處理速度)的概念和評估方法。借助這套方法,客戶可以直接面向物理世界,評估AI系統的效能。這一方法并不是單純計算峰值算力或軟件的算法效率,而是計算這兩者在物理世界可接受的精度范圍內的處理速度。地平線計算的是什么?是AI系統能(neng)跑得(de)多(duo)快、跑得(de)多(duo)準。

為實現數據閉環,幾乎所有的AI公(gong)司都(dou)在(zai)圍繞數據(ju)的搜集(ji)、采集(ji)、標注、模(mo)型(xing)訓(xun)練進行部(bu)署。相(xiang)較(jiao)而言,地平線(xian)是利用自(zi)身的核心(xin)技術能(neng)力(li),給整(zheng)個行業賦能(neng)。如果客戶需要打造一套完(wan)整(zheng)的數據(ju)閉(bi)環,地平線(xian)可以為(wei)其(qi)提供技術支持和服務。

鄭治泰透露,目前,地平線正與國內頭部的汽車企業攜手,打造不少于35個聯合實驗室

通過這種聯合實驗室,地平線計劃為車企提供毫無保留的技術支持。地平線秉持開放賦能的宗旨,可以提供芯片,也可以提供芯片+工具鏈,還可以提供芯片+工具鏈+算法。此外,就算客戶想要完全脫離地平線的技術產品來打造AI能力,地平線也會100%為客戶賦能。針對物理世界中的海量數據問題,地平線以幫助合作伙伴具備真正的AI生產力為目標。

地平線鄭治泰:深度解讀軟件2.0時代AI無人化“玩法” | GTIC2020

2015年(nian),地平線成立,初創團(tuan)隊(dui)具備算法(fa)背景。當時,團(tuan)隊(dui)發(fa)現在(zai)處理(li)(li)邊(bian)緣計算時,需要在(zai)物理(li)(li)世界中(zhong)定義一個問題,提出算法(fa)模型(xing)。根據算法(fa)模型(xing)重新(xin)定義適合這個算法(fa)模型(xing)的芯片(pian)架構,芯片(pian)流片(pian)后,再回到物理(li)(li)世界中(zhong),求得一個最優(you)解。

鄭治泰認為,在計算閉環中,人類科學家需要做到三件事:

第一(yi),人類科(ke)學家(jia)要持(chi)續提升(sheng)這顆芯片的有效計(ji)算效率和計(ji)算能力(li);

第二,人類科學(xue)家要持續提升算法的效(xiao)率;

第三,人類(lei)科學家需根(gen)據要(yao)解決的實際(ji)問題,進行聯(lian)合(he)調優,得(de)到最(zui)優解。

地平線團隊認為,用(yong)傳(chuan)統模(mo)型來(lai)進行計算能力評估的(de)方式(shi)是(shi)有局(ju)限性(xing)的(de)。

首先,一些模型早已過時,而要解決未來自動駕駛場景中的實際問題,需要更先進的模型。芯片在設計的時候,就需要考慮到對未來模型、算法的引進。其次,同(tong)一個芯片(pian)搭載不同(tong)的(de)模(mo)型(xing),其(qi)利用率也會(hui)表(biao)現出差異。

基于這兩點,地平線從算法開(kai)始進(jin)行產品(pin)開(kai)發,然后再(zai)設(she)計芯片,進(jin)而回到場(chang)景中去解(jie)決實際問題。

四、地平線征程5芯片明年發布,性能有望超競品3倍

據鄭治泰分享,地平線團隊MAPS評測結果顯示,市場上的高能效芯片,通常達到約30%的利用率。

人工智能面臨識別、檢測兩個問題。在識別方面,相比市面上現有最好、最普遍的端側GPU產品,地平線的征程3芯片用8%的功耗實現了50%MAPS,具備46倍的能耗優勢;征程5芯片用50%的功耗實現了5倍的MAPS,實現了將近10倍的能耗優勢。

檢測方面,地平線征程5芯片用50%的功耗實現了13倍的MAPS,達到26倍的提升。據稱,明年上述GPU品牌推出的新品,相比其上代產品實現了7倍的性能提升。基于此,地平線將于明年推出的征程5芯片,相比該品牌明年發布的GPU新品,將有至少3倍的提升。

近期,地(di)平線科(ke)學家定義的有效評估人工智(zhi)能(neng)計算效能(neng)的方法,正為整個(ge)產(chan)業鏈(lian)賦能(neng)。鄭(zheng)治泰提到,地(di)平線希(xi)望,產(chan)業鏈(lian)伙(huo)伴都能(neng)使用(yong)這(zhe)一方法,讓整個(ge)產(chan)業進(jin)入非常(chang)良性的循環。

展望未來,人類科學家要做的事情并不多,其中包括搭建和調優整個系統、看著機器用海量數據輸出結果等。這就是軟件2.0所暗示的未(wei)來,自動駕駛、無(wu)人(ren)駕駛等人(ren)工智能應用(yong),將(jiang)普惠到每個人(ren)的生活。

以上是鄭治泰演講內容的完整整理。除鄭治泰外,在本屆GTIC 2020 AI芯片創新峰會期間,清華大學微納電子系尹首一教授,比特大陸、燧原科技、黑芝麻智能、壁仞科技、光子算數、知存科技、億智電子、豪微科技等芯片創企,全球FPGA領先玩家賽靈思,知名IP供應商安謀中國、Imagination,全球EDA巨頭Cadence,以及北極光創投、中芯聚源等知名投資機構,分別分享了對AI芯片產業的觀察與思考。如感興趣更多嘉賓演講的核心干貨,歡迎關注芯東西后續推送內容。