車東西(公眾號:chedongxi)
編| 陳思揚

現階段,自(zi)動(dong)駕駛(shi)浪潮正席(xi)卷全球(qiu),各大車(che)企都在(zai)積極(ji)研發汽車(che)的(de)自(zi)動(dong)駕駛(shi)功能,但(dan)各自(zi)采用的(de)方向卻并不(bu)相(xiang)同。

與谷歌(ge)、Waymo等自動駕駛公(gong)司不同,特斯(si)拉堅持走純(chun)視覺(jue)路線(xian),即使用成本更低(di)的8枚攝像頭進(jin)行識別。

低(di)成本(ben)的(de)硬件(jian)在幫助特斯拉(la)獲取大(da)量數(shu)據(ju)上起到了(le)至(zhi)關(guan)重要的(de)作用。而特斯拉(la)使用PyTorch語言編寫(xie)的(de)系統可以自(zi)動處理數(shu)據(ju)并對(dui)自(zi)身進行升級。特斯拉(la)的(de)自(zi)動駕駛(shi)之所以能夠快速的(de)迭(die)代,正是因為軟硬件(jian)的(de)完美結(jie)合。

日(ri)前特斯拉(la)的人(ren)工智能和計算機視(shi)覺主管Andrej Karpathy做了(le)一個10分鐘左右的演講,介紹了(le)特斯拉(la)如何訓練(lian)其自(zi)動駕駛系統實現自(zi)我進化。

一、完善算法的關鍵 普及自動駕駛硬件收集車主海量數據

特斯(si)拉的(de)自(zi)動駕駛方(fang)案與其它公司(si)不同,并不基于激光雷達或高精度地圖(tu),而(er)是采(cai)用由8顆攝像(xiang)頭組(zu)成的(de)計算機視覺系統(tong),用攝像(xiang)頭拍攝的(de)圖(tu)像(xiang)識別道(dao)路環境。

與(yu)此同時,特(te)斯(si)拉的(de)所(suo)有(you)的(de)車型都搭(da)載了(le)自動駕(jia)駛(shi)硬件,并(bing)通過軟件更新的(de)形(xing)式向車主逐步開放其(qi)自動駕(jia)駛(shi)功(gong)能,這樣,特(te)斯(si)拉就可(ke)以獲取(qu)大(da)量的(de)真實數據。

截(jie)至目前,特斯拉的Navigate on Autopilot(自動輔助(zhu)導(dao)航駕駛(shi)系統)已經在全球 50 個(ge)國家累計行駛(shi)里程 16 億公里,自動變道 20 萬次(ci)。

智能召喚功(gong)能也(ye)已(yi)經推送(song)到全球(qiu)多(duo)個地(di)區,車(che)主實際完成了超(chao)過(guo) 50 萬(wan)次車(che)輛召喚。

二、使用PyTorch語言實現自我進化 提高數據處理效率

這些(xie)數據如果通過人(ren)工進行處理(li),難以想象需要多少時(shi)間。Andrej Karpathy 在(zai)這里引入(ru)了PyTorch和(he)Torch的概念。

據了解,Torch 是一個(ge)基(ji)于?BSD License?的開源機(ji)器學(xue)習(xi)框架,主要用(yong)于圖像(xiang)和視頻(pin)的深(shen)度學(xue)習(xi)。

而PyTorch,是使用(yong) Python 語言編寫的(de)Torch機器學(xue)習框架(jia) 。相比Torch,PyTorch擁(yong)有了(le)更高的(de)編譯和運行效率(lv),為特(te)斯拉的(de)自動駕駛系統奠定(ding)了(le)良(liang)好(hao)的(de)基礎。

基于PyTorch,Karpathy的(de)團隊開(kai)發(fa)了一個(ge)內部戲稱(cheng)為“假期計(ji)劃(hua)”的(de)計(ji)算機自(zi)我(wo)訓練系(xi)(xi)統。使(shi)得(de)特斯拉的(de)自(zi)動駕駛系(xi)(xi)統不光能夠收集(ji)數(shu)據(ju),甚至(zhi)還能夠對數(shu)據(ju)進(jin)行處理并實現自(zi)我(wo)進(jin)化(hua)。

這就對系統的數據處理(li)邏輯(ji)及處理(li)速度有著極強的要求(qiu)。Karpathy為我們闡述(shu)了這套系統是如何工作的。

首先,該(gai)系統會把收(shou)集到的(de)圖(tu)像解構成多(duo)個獨立(li)的(de)物(wu)體,如(ru)紅綠燈(deng)、路緣石、道(dao)路標識、移動物(wu)體等。而所有這(zhe)些數(shu)據組合起來,就可以完整的(de)描繪(hui)當前道(dao)路的(de)信息。

接下(xia)來(lai),每個物體(ti)的(de)數(shu)據(ju)都有相對應的(de)處(chu)理器進(jin)行(xing)分析處(chu)理。這些(xie)處(chu)理器的(de)數(shu)據(ju)處(chu)理是協同進(jin)行(xing)的(de),以避免(mian)數(shu)據(ju)之間相互孤立。微觀上(shang)(shang),系統能夠監測某一物體(ti)的(de)各項數(shu)據(ju);宏觀上(shang)(shang),系統能夠把(ba)各物體(ti)的(de)數(shu)據(ju)進(jin)行(xing)匯總,良好的(de)還原當時的(de)道路情況。

三、數據互聯協同分析 多傳感器宏觀判斷路況

Karpathy還介紹了(le)該(gai)系統的(de)一個特點:汽車(che)的(de)8個攝像(xiang)頭也是協同工作的(de)。在很多情(qing)況(kuang)下(例如距離和深(shen)度(du)的(de)判(pan)斷),單張圖像(xiang)無法提供足夠的(de)數據(ju)量。而多攝像(xiang)頭協同工作將有助于自動駕(jia)駛(shi)系統更好的(de)理解(jie)該(gai)場景。

在(zai)車輛(liang)行駛的過程中(zhong),針對同一個場景,8個攝像(xiang)頭(tou)會用(yong)不同的距離和焦距拍攝總(zong)計4096張(zhang)照片。這些照片最終都會被以上述(shu)的方法進行加工處理。

特斯拉的(de)這套(tao)訓練系(xi)統最終形成了一個(ge)多攝(she)像頭,多傳(chuan)感器共同協作(zuo)的(de)系(xi)統。這套(tao)系(xi)統不光能夠(gou)分析車(che)輛外部的(de)道(dao)路環境,還(huan)能收集車(che)輛在應(ying)對各種(zhong)情況時(shi)的(de)處理及結果(guo)。

結語:軟硬件結合是特斯拉方案的關鍵

先用低成本的(de)硬件(jian)完(wan)成普及,然后再(zai)用交(jiao)付的(de)硬件(jian)收(shou)集數(shu)據(ju),最后用合理的(de)編(bian)程語言訓練機(ji)器獨(du)立(li)處(chu)理數(shu)據(ju),完(wan)成自我升級。特斯拉的(de)每一步(bu)棋都(dou)下的(de)精妙無(wu)比。

數據樣本(ben)大,數據處理能(neng)力(li)強是特(te)斯拉(la)這套自動駕駛系統的兩大核心(xin)優勢(shi)。

根據這兩(liang)點,我更(geng)加(jia)看(kan)好特斯(si)(si)拉(la)(la)未來的全自動駕(jia)駛系(xi)統,但對于馬斯(si)(si)克給出(chu)的2020年特斯(si)(si)拉(la)(la)實現(xian)全自動駕(jia)駛的承諾,我持懷疑態(tai)度。