端(duan)到(dao)端(duan)自動駕駛(shi)是(shi)自動駕駛(shi)技術(shu)的(de)(de)重要發展(zhan)方向之一。而要實(shi)現(xian)端(duan)到(dao)端(duan)自動駕駛(shi),離不(bu)開高精度3D信(xin)息輸入,因(yin)此如何實(shi)現(xian)高精度的(de)(de)3D感知尤(you)為關鍵。

從3D感(gan)知的實(shi)現技術路徑來看,主(zhu)要包(bao)括稠密(mi)算法和稀疏算法兩(liang)個范疇(chou)。

在稠密(mi)(mi)算(suan)法范(fan)疇,主要通過點云(yun)轉換、多視圖立體視覺(jue)等(deng)方法,來獲取場(chang)景中每(mei)一個點的(de)(de)(de)深度(du)信息,從而更準(zhun)確地描述場(chang)景中的(de)(de)(de)物體。其中最具代表性的(de)(de)(de)就是近兩(liang)年非常火熱的(de)(de)(de)BEV感(gan)知,其多傳感(gan)器數據(ju)從圖像空(kong)間(jian)到BEV空(kong)間(jian)的(de)(de)(de)轉換過程,就是典型的(de)(de)(de)稠密(mi)(mi)特(te)征(zheng)到稠密(mi)(mi)特(te)征(zheng)的(de)(de)(de)重新(xin)排列組(zu)合過程。目前,BEV已在業界得到廣泛關(guan)注以及應用部署。

稠密算(suan)(suan)(suan)法(fa)(fa)也面臨著一(yi)些(xie)挑戰,比如巨大的(de)數(shu)據(ju)量,需(xu)要(yao)高(gao)效的(de)數(shu)據(ju)處(chu)理和存(cun)儲方法(fa)(fa)來(lai)(lai)提(ti)高(gao)計(ji)算(suan)(suan)(suan)效率,減(jian)少內存(cun)占用。此外,考(kao)慮到多傳(chuan)感器數(shu)據(ju)結構的(de)復雜性,需(xu)要(yao)高(gao)效的(de)計(ji)算(suan)(suan)(suan)方法(fa)(fa)和計(ji)算(suan)(suan)(suan)平臺(tai)來(lai)(lai)提(ti)升處(chu)理速度,并滿(man)足實(shi)時性要(yao)求。而在(zai)大多數(shu)實(shi)際應用場景中(zhong),自(zi)動駕駛(shi)系統需(xu)要(yao)計(ji)算(suan)(suan)(suan)的(de)目標在(zai)空(kong)間(jian)中(zhong)通常呈稀疏狀(zhuang)態分布,這也就意味著在(zai)稠密算(suan)(suan)(suan)法(fa)(fa)范疇中(zhong),大量的(de)計(ji)算(suan)(suan)(suan)是被浪費了的(de)。

稀(xi)疏感(gan)(gan)知(zhi)(zhi)算(suan)(suan)(suan)(suan)法(fa)通過減(jian)少Query數量(liang)以及降(jiang)低(di)特征(zheng)交互(hu)量(liang)來加快計(ji)算(suan)(suan)(suan)(suan)速度(du)并降(jiang)低(di)存儲需(xu)求,大大提高感(gan)(gan)知(zhi)(zhi)模型的(de)計(ji)算(suan)(suan)(suan)(suan)效率(lv)和系(xi)統性能。基于(yu)稀(xi)疏算(suan)(suan)(suan)(suan)法(fa)的(de)感(gan)(gan)知(zhi)(zhi)方(fang)案(an)在2D到3D的(de)轉換效率(lv)和長(chang)距離(li)感(gan)(gan)知(zhi)(zhi)方(fang)面具有一定優(you)勢(shi),也(ye)是目(mu)前業(ye)界正在積極探索的(de)方(fang)向(xiang)。

近期,地(di)平線發表了關于稀疏感知(zhi)方案的系列工作:Sparse4D v1 & v2,從(cong)Query構(gou)建方式(shi)、特征采樣方式(shi)、特征融合方式(shi)、時序(xu)融合方式(shi)等(deng)多個方面提(ti)升模型感知(zhi)效果。Sparse4D在nuScenes檢測任務(wu)上達到(dao)了SOTA的效果,超(chao)過了VideoBEV、SOLOFusion和(he)StreamPETR等(deng)算法的指標。

為了讓大家進一步了解Sparse4D,10月18日19點,地平線聯合智猩猩策劃推出新一期地平線「你好,開發者」自動駕駛技術專場,主題為《面向端到端自動駕駛的稀疏感知通用架構探索》,由地平線感知算法工程師林天威主講。

林天威首先(xian)會介紹(shao)3D感知的研(yan)究背景和發展現狀,并(bing)對(dui)稀(xi)疏(shu)通(tong)用感知架構進行解(jie)析。之后(hou)(hou),林天威將重點介紹(shao)和講解(jie)長(chang)時序稀(xi)疏(shu)化3D目標檢測算法(fa)Sparse4D v1 & v2相關工作。最后(hou)(hou)他會分享(xiang)稀(xi)疏(shu)感知新范(fan)式的未來探索方向。

地平線林天威:面向端到端自動駕駛的稀疏感知通用架構探索|直播預告

專場內容

主題:面向端到端自動駕駛的稀疏感知通用架構探索
提綱:
1、3D感知研究背景與現狀
2、稀疏通用感知架構解析
3、長時序稀疏化3D目標檢測算法Sparse4D v1 & v2
4、稀疏感知新范式的未來探索方向

主講人

林天(tian)威,地平(ping)線感知算法(fa)工程(cheng)師,主(zhu)要研究領域(yu)包括(kuo)端到端自動駕駛(shi)、生(sheng)成模型、視頻(pin)時序理解(jie)等(deng)(deng);在(zai)CVPR、ICCV、ECCV、AAAI、TPAMI等(deng)(deng)會議(yi)期刊上發表論文二(er)十(shi)余篇(pian),引用達2500余次。

課程信息

直播時間:10月18日19:00
直(zhi)播地點:智猩(xing)(xing)猩(xing)(xing)直(zhi)播間