從高速到城(cheng)區,自動駕駛汽車正面臨著(zhu)更復雜的(de)(de)(de)路況(kuang),強交(jiao)互的(de)(de)(de)長(chang)尾(wei)場景(jing)(jing)不計其數。而直接在(zai)城(cheng)區進行測(ce)試存在(zai)極高的(de)(de)(de)成(cheng)本與風險。因此,在(zai)仿(fang)真(zhen)(zhen)測(ce)試基準上進行針(zhen)對(dui)長(chang)尾(wei)場景(jing)(jing)的(de)(de)(de)規(gui)控能(neng)力評測(ce)成(cheng)為(wei)了業界的(de)(de)(de)共同選擇。但基于(yu)學(xue)(xue)(xue)習方法中的(de)(de)(de)模(mo)仿(fang)學(xue)(xue)(xue)習方案高度依賴(lai)于(yu)對(dui)所有可能(neng)出(chu)現(xian)情況(kuang)的(de)(de)(de)全覆蓋,強化學(xue)(xue)(xue)習方案又需要在(zai)仿(fang)真(zhen)(zhen)中進行大規(gui)模(mo)的(de)(de)(de)試錯探(tan)索學(xue)(xue)(xue)習規(gui)控策略(lve),其低效性(xing)難以應對(dui)多達(da)幾十種的(de)(de)(de)長(chang)尾(wei)場景(jing)(jing)。

針對當前技術難題,上海交通大學嚴駿馳老師領導的ReThinkLab提出了一種基于隱世界模型下的高效強化學習自動駕駛模型Think2Drive,并成為首個完成CARLA V2全部長尾場景的模型,實現100%的路線完成率。與Think2Drive相關的論文收錄于ECCV 2024上。

首次(全)解鎖CARLA V2! 上交大RethinkLab提出隱世界模型下的強化學習自動駕駛模型Think2Drive

Think2Drive通過(guo)訓練(lian)世界(jie)模(mo)型建模(mo)自(zi)動駕駛環境的(de)變化規律,并(bing)在隱特(te)(te)征空間(jian)中進行(xing)(xing)下游規控網絡(luo)的(de)策略探索(suo)。該模(mo)型有以下特(te)(te)點:1)隱世界(jie)模(mo)型可以進行(xing)(xing)快速狀態推理,具備極高(gao)的(de)數據效率;2)針(zhen)對(dui)將強化學習應用到至(zhi)自(zi)動駕駛任務面(mian)臨的(de)策略退化、長(chang)尾分布、駕駛不穩(wen)定性等挑戰,提出了周期性重置、自(zi)動場景生成、終(zhong)止優先回放(fang)等特(te)(te)制模(mo)塊,可實(shi)現(xian)同一規控網絡(luo)應對(dui)幾十種(zhong)復雜(za)場景。

Think2Drive建模的(de)(de)世界模型(xing)是隱世界模型(xing),通過在該低維空(kong)間(jian)上基于(yu)動作預測未(wei)來狀態,以避(bi)免在高(gao)維空(kong)間(jian)上進行計算(像(xiang)素空(kong)間(jian)、3D物(wu)理空(kong)間(jian)),極大地加速推(tui)理效(xiao)率。經過訓練,整個(ge)(ge)(ge)隱世界模型(xing)便可以作為一(yi)個(ge)(ge)(ge)低維的(de)(de)“小(xiao)世界”,它可以對駕(jia)駛策略采取(qu)的(de)(de)動作給予獎懲,也可預測基于(yu)該動作的(de)(de)未(wei)來狀態,此時它表現(xian)為一(yi)個(ge)(ge)(ge)神(shen)經網(wang)絡(luo)模擬器(qi),是對駕(jia)駛環境的(de)(de)一(yi)個(ge)(ge)(ge)最小(xiao)仿真。

首次(全)解鎖CARLA V2! 上交大RethinkLab提出隱世界模型下的強化學習自動駕駛模型Think2Drive

基(ji)于Think2Drive專家模(mo)型,上(shang)海交通大學ReThinkLab又推(tui)出了首個端到端自動駕駛綜合能(neng)力閉(bi)環評估開放平(ping)臺Bench2Drive。

首次(全)解鎖CARLA V2! 上交大RethinkLab提出隱世界模型下的強化學習自動駕駛模型Think2Drive

Bench2Drive具有一個(ge)(ge)由最先進的專家模型Think2Drive收集的官方訓練數(shu)據集,包(bao)含200萬(wan)個(ge)(ge)完全標(biao)注的幀,來源于10000個(ge)(ge)片段。這些數(shu)據涵(han)蓋了44種不同(tong)的交(jiao)互(hu)式場景(jing)。評估協議(yi)包(bao)括220條短(duan)路線,每條路線大約只有150米長,并包(bao)含一個(ge)(ge)特定的場景(jing)。

通過(guo)這(zhe)種方(fang)式(shi),對單個技能(neng)的(de)評(ping)估被隔離出來,從而允許對44種不同(tong)技能(neng)集的(de)自(zi)動駕(jia)駛(shi)(shi)(shi)系統熟練程(cheng)度(du)進行詳(xiang)細(xi)的(de)比較。此(ci)外,每條路線(xian)的(de)簡短性減輕了(le)指(zhi)數(shu)衰減函(han)數(shu)對駕(jia)駛(shi)(shi)(shi)分(fen)數(shu)的(de)影響,使得不同(tong)系統之間(jian)的(de)性能(neng)比較更加準確(que)和(he)有意義。該基準為(wei)研究人員提供(gong)了(le)一種在現實、全面(mian)和(he)公平的(de)環(huan)境(jing)中(zhong)細(xi)化和(he)評(ping)估其端(duan)到端(duan)自(zi)動駕(jia)駛(shi)(shi)(shi)系統的(de)重(zhong)要工具。

首次(全)解鎖CARLA V2! 上交大RethinkLab提出隱世界模型下的強化學習自動駕駛模型Think2Drive

7月31日(ri)晚7點,智猩猩邀請到論文一作、上海交通大學ReThinkLab嚴駿馳組在讀博(bo)士(shi)李(li)奇峰參與(yu)「智猩猩自(zi)動駕駛新(xin)青年講座」第37講,主講《首(shou)解CARLA V2:基(ji)于隱世(shi)界模(mo)型(xing)的自(zi)駕強化模(mo)型(xing)Think2Drive》。

講者

李奇峰(feng),上海交(jiao)通大學(xue)ReThinkLab嚴駿馳組在(zai)讀博士

李(li)奇峰(feng),上海交通大學(xue)ReThinkLab在讀(du)博士,師(shi)從(cong)嚴駿馳老師(shi)。主要研究方向為基于強(qiang)化學(xue)習的(de)自(zi)動駕(jia)(jia)駛(shi)規控、端(duan)到端(duan)自(zi)動駕(jia)(jia)駛(shi)等。

上海(hai)交通(tong)大學ReThinkLab近(jin)年來在自動駕(jia)駛(shi)(shi)方(fang)向上的(de)成果(guo)橫跨自動駕(jia)駛(shi)(shi)中(zhong)的(de)感知、預(yu)測、決策領(ling)(ling)域,并(bing)開創性的(de)深入探索(suo)了(le)感知決策一體(ti)化(hua)自動駕(jia)駛(shi)(shi)。其(qi)中(zhong)包括清華A/CCF-A類論文10余篇,CVPR2023最佳(jia)論文、CVPR2024最佳(jia)論文候選, 兩(liang)篇Oral (<3%)工作。在CARLA V1/V2,nuScenes, Waymo等多個公開數據集(ji)上取得了(le)國(guo)際(ji)領(ling)(ling)先的(de)性能,尤其(qi)是(shi)在端到端自動駕(jia)駛(shi)(shi)方(fang)面的(de)工作已成為領(ling)(ling)域經典(dian)算法。

第 37 講

主 題

《首解CARLA V2:基于隱世界模型的自駕強化模型Think2Drive》

提 綱

1、CARLA v2 閉環仿真測評基準簡介
2、隱世界模型概述及其在自動駕駛中的應用
3、基于隱世界模型的強化學習自動駕駛模型Think2Drive
4、端到端自動駕駛閉環評估開放平臺Bench2Drive
5、先進E2E-AD方法測試及(ji)評估

直 播 信 息

直播時間:7月31日19:00
直播(bo)地點:智猩猩GenAI視(shi)頻號

成果

論文標題1
《hink2drive: Efficient reinforcement learning by thinking in latent world model for quasi-realistic autonomous driving (in carla-v2)》

論文鏈接1
//arxiv.org/abs/2402.16720

論文標題2
《Bench2Drive: Towards Multi-Ability Benchmarking of Closed-Loop End-To-End Autonomous Driving》

論文鏈接2
//arxiv.org/abs/2406.03877

項目地址2
//thinklab-sjtu.github.io/Bench2Drive/

入群申請

本(ben)次講座組建了學(xue)習交(jiao)流(liu)群(qun)。加入學(xue)習交(jiao)流(liu)群(qun),除了可(ke)以觀(guan)看直播,并(bing)提(ti)(ti)前拿到課(ke)件外,你還能結(jie)識更多研究人員和開發(fa)者(zhe),所(suo)提(ti)(ti)問題(ti)也(ye)將會優先(xian)解(jie)答(da)。

希望入群的朋友可以掃描下方二維碼,添加小助手陳新進行申請。已添加過陳新的老朋友,可以給陳新私信,發送“自動駕駛37”進行申請。

首次(全)解鎖CARLA V2! 上交大RethinkLab提出隱世界模型下的強化學習自動駕駛模型Think2Drive