
自2019年起,百度(du)Apollo開(kai)(kai)發者社區(qu)在智東西公開(kai)(kai)課(ke)持續推出(chu)八場公開(kai)(kai)課(ke)和專場直播,對Apollo中(zhong)的激光雷達感知、仿真(zhen)可視化、高精(jing)地圖與(yu)定位、預測引擎(qing)、低速微型車開(kai)(kai)發套件(jian)等核心技(ji)術和解決方案進行(xing)了深(shen)入講(jiang)解。
3月31日,「百(bai)度(du)(du)Apollo強(qiang)化學習(xi)公開(kai)課」上線。百(bai)度(du)(du)高級架(jia)構(gou)師、百(bai)度(du)(du)PNC強(qiang)化學習(xi)方向技(ji)術負責人“向往藍天的(de)鷹”將(jiang)圍繞主題《 深度(du)(du)強(qiang)化學習(xi)在自動駕駛運動規(gui)劃中的(de)應用》,直(zhi)播講(jiang)解(jie)自動駕駛決策規(gui)劃DRL架(jia)構(gou)。
運(yun)動規(gui)(gui)劃是無(wu)人駕駛系統的核心模(mo)(mo)塊(kuai)之(zhi)一(yi)。運(yun)動規(gui)(gui)劃模(mo)(mo)塊(kuai)承接上游感知(zhi)、定位、地圖等模(mo)(mo)塊(kuai),規(gui)(gui)劃無(wu)人駕駛車一(yi)段時間(jian)內的具體的駕駛行為,以軌跡的形(xing)式輸出給下游控制模(mo)(mo)塊(kuai)執行。常規(gui)(gui)做(zuo)法是劃分(fen)成預測、決策、路徑規(gui)(gui)劃和速度(du)規(gui)(gui)劃等模(mo)(mo)塊(kuai),混(hun)合Learning、優化、規(gui)(gui)則等多種(zhong)手段、采(cai)用場景化的方式分(fen)治(zhi)解決問(wen)題,但存在模(mo)(mo)塊(kuai)間(jian)不匹(pi)配和缺乏聯動協(xie)同(tong)等問(wen)題,并(bing)且由(you)于自動駕駛場景復(fu)雜和各種(zhong)不確定性問(wen)題,導致迭代效率較低。
而深度(du)(du)強化學(xue)習(xi)(xi)在(zai)大規模游(you)戲領域(yu)的成功,以及(ji)大量的理(li)論研究成果也證實了深度(du)(du)強化學(xue)習(xi)(xi)的可行(xing)性(xing)。因此(ci)越(yue)來越(yue)多的無人(ren)駕駛科技公司也開(kai)始相信強化學(xue)習(xi)(xi),將深度(du)(du)強化學(xue)習(xi)(xi)和(he)自動駕駛實踐相結(jie)合(he),并(bing)取得了一定的成果。
當然,深度(du)強(qiang)(qiang)化學(xue)(xue)習(xi)(xi)雖然已(yi)經被證實(shi)能(neng)夠解(jie)決無(wu)人駕駛中的(de)部分問題,但(dan)還面臨諸多(duo)挑(tiao)戰(zhan)。比如深度(du)強(qiang)(qiang)化學(xue)(xue)習(xi)(xi)在(zai)解(jie)決復雜問題需(xu)要大量的(de)訓練(lian)時間和反復模(mo)型優化。需(xu)要設計一(yi)個穩定(ding)的(de)智能(neng)系統解(jie)決仿真(zhen)和現實(shi)之間的(de)gap差距。同時,模(mo)型的(de)精度(du)和整個智能(neng)系統的(de)架(jia)構(gou)設計也會影響深度(du)強(qiang)(qiang)化學(xue)(xue)習(xi)(xi)的(de)可(ke)用性。
在本次(ci)公開課中,百(bai)度(du)PNC強化(hua)(hua)學(xue)(xue)(xue)習(xi)方向技術負責人“向往藍天的(de)鷹”將(jiang)圍繞自動(dong)駕駛決策規劃宏觀建模與DRL架構(gou)、基(ji)(ji)于(yu)(yu)深(shen)度(du)學(xue)(xue)(xue)習(xi)的(de)Mid2Mid的(de)運(yun)動(dong)規劃系統、強化(hua)(hua)學(xue)(xue)(xue)習(xi)落地(di)經驗以(yi)及ApolloRL這四(si)個方面(mian),深(shen)度(du)解析百(bai)度(du)Apollo基(ji)(ji)于(yu)(yu)深(shen)度(du)學(xue)(xue)(xue)習(xi)的(de)Mid2Mid的(de)運(yun)動(dong)規劃系統,以(yi)及基(ji)(ji)于(yu)(yu)預監督和大(da)規模仿真的(de)深(shen)度(du)強化(hua)(hua)學(xue)(xue)(xue)習(xi)相結合(he)來優化(hua)(hua)模型效果的(de)方案。
“向(xiang)往藍天(tian)的鷹”是百度高級(ji)架(jia)構師(shi)、百度PNC強化(hua)學習(xi)方向(xiang)技術負責(ze)人,致力于Robotaxi 決策(ce)規劃(hua)系統(tong)的提升和數(shu)據驅動(dong)路徑(jing)探索和研(yan)究(jiu)。
本次公開課(ke)將以視頻直播形式(shi)進行,包含40分鐘主講(jiang)和(he)20分鐘問答(da)。同時(shi),針對本次公開課(ke),也組(zu)建了專(zhuan)屬交流(liu)群(qun),屆時(shi)主講(jiang)人也將加(jia)入,歡迎(ying)感(gan)興趣(qu)的開發(fa)者申請。
公開課信息
主 題?
《深(shen)度強化(hua)學習在自動駕駛(shi)運(yun)動規(gui)劃(hua)中的應用(yong)》
提 綱
1、自動駕駛決策規劃宏觀建模和DRL架構
2、基于深度學習的Mid2Mid的運動規劃系統
3、強化學習落地經驗
4、ApolloRL解析
主 講 人
向(xiang)往藍天(tian)的鷹,現擔任百度高(gao)級(ji)架構師、百度PNC強化學(xue)習方向(xiang)技術負責人,致力于Robotaxi 決策規劃系統的提升(sheng)和(he)數據驅動路徑探(tan)索和(he)研(yan)究。
直 播 時 間
3月31日(ri)19:00-20:00