
「CV研究合輯(ji)」,是智東(dong)西公(gong)開課(ke)針(zhen)對計(ji)算機(ji)視(shi)覺推(tui)出的一(yi)檔合輯(ji),聚焦于計(ji)算機(ji)視(shi)覺前沿領域研究成果與(yu)進展的講(jiang)(jiang)(jiang)解(jie)。每一(yi)講(jiang)(jiang)(jiang)由(you)主講(jiang)(jiang)(jiang)與(yu)答疑兩個(ge)環節組成,其中,主講(jiang)(jiang)(jiang)60分鐘(zhong),采用(yong)視(shi)頻直(zhi)播(bo)形(xing)式,答疑30分鐘(zhong),將(jiang)在相應(ying)交流群(qun)進行。
我們都知道,機器學(xue)習(xi)(xi)方(fang)法主要可以(yi)(yi)分為(wei)四(si)類,監督(du)(du)學(xue)習(xi)(xi)、半監督(du)(du)學(xue)習(xi)(xi)、無監督(du)(du)學(xue)習(xi)(xi)、以(yi)(yi)及強化(hua)學(xue)習(xi)(xi)。不同于(yu)連接主義(yi)的監督(du)(du)學(xue)習(xi)(xi)方(fang)法,強化(hua)學(xue)習(xi)(xi)是(shi)智(zhi)能(neng)體通(tong)過(guo)與(yu)環境(jing)的交(jiao)互,觀測交(jiao)互結果以(yi)(yi)及獲得(de)相應的回報。這種(zhong)學(xue)習(xi)(xi)的方(fang)式(shi)是(shi)模擬人或(huo)動物的一種(zhong)學(xue)習(xi)(xi)方(fang)式(shi),因此(ci)強化(hua)學(xue)習(xi)(xi)在(zai)機器人領域有著廣泛的應用。
傳統的(de)強化學(xue)(xue)習(xi)(xi)(xi)局(ju)限于動(dong)(dong)作空(kong)(kong)間和樣本空(kong)(kong)間都很(hen)小,且(qie)一般是離(li)散(san)的(de)情(qing)(qing)境(jing)下。然而(er)實際情(qing)(qing)況的(de)任務則往(wang)(wang)往(wang)(wang)有著很(hen)大的(de)狀態(tai)空(kong)(kong)間和連續的(de)動(dong)(dong)作空(kong)(kong)間。當輸(shu)入數據(ju)為(wei)圖像(xiang),聲音時,往(wang)(wang)往(wang)(wang)具有很(hen)高維度(du),傳統的(de)強化學(xue)(xue)習(xi)(xi)(xi)很(hen)難處理,此(ci)時就(jiu)需要結合深度(du)學(xue)(xue)習(xi)(xi)(xi)的(de)方(fang)法(fa),將高緯(wei)度(du)數據(ju)進行降維處理,即(ji)深度(du)強化學(xue)(xue)習(xi)(xi)(xi)方(fang)法(fa)。
然而深度強化學習到底是什么樣的方法,又有哪些應用,尤其在機器人領域又有怎樣的進展呢?北京時間4月11日上午10點(硅谷時間4月10日晚7點、賓夕法尼亞州時間4月10日晚10點),智東(dong)西(xi)公開課「CV研究(jiu)合(he)輯」第3講直播開講,由卡內基梅隆大(da)學博士胡亞飛和輕(qing)舟智航高級感(gan)知工程師陳鈺,為大(da)家講解(jie)《深(shen)度(du)強化學習在機器人領域(yu)的研究(jiu)》。
胡亞飛(fei)是卡(ka)內基梅隆大學(xue)博(bo)士,目前在(zai)計算機學(xue)院下的(de)機器(qi)人(ren)系進行研究(jiu)工作,主要研究(jiu)方(fang)向為動態場景下的(de)視(shi)覺SLAM(包括深(shen)度學(xue)習(xi)方(fang)法和傳統幾何方(fang)法)、強(qiang)化學(xue)習(xi)在(zai)機器(qi)人(ren)決策(ce)與規劃中(zhong)的(de)應用以及2D/3D多目標跟蹤等問題。他(ta)曾(ceng)任(ren)ICRA, Autonomous Robot審稿人(ren)。
陳鈺是(shi)輕舟智航高級(ji)感知工(gong)程師(shi),工(gong)作內(nei)容主要是(shi)多傳(chuan)感器(qi)融(rong)合的追蹤(zong);卡(ka)內(nei)基梅(mei)隆大學(xue)電子與(yu)計(ji)算(suan)機工(gong)程碩(shuo)士、中(zhong)山大學(xue)數據科學(xue)與(yu)計(ji)算(suan)機學(xue)院本科;曾在阿(a)里巴巴達摩院機器(qi)智能部(bu)門(men)、瑞(rui)芯微電子核心(xin)算(suan)法部(bu)門(men)實習(xi),有(you)多項(xiang)美國專利;在CMU MLD Katerina Fragkiadaki實驗(yan)室(shi)做研究(jiu)助理;在知乎上撰寫了深度學(xue)習(xi)專欄:CMU 10-703 深度強化(hua)學(xue)習(xi)筆記。
CV研究合輯」此前已經(jing)完(wan)結兩講(jiang)。第一講(jiang)由電子科(ke)技大(da)學李文教授主講(jiang),主題(ti)為《領域適應(ying)在計(ji)算機視覺中的(de)(de)研究和(he)應(ying)用(yong)》;第二講(jiang)是(shi)由小牛動(dong)漫(man)資深算法工程師盧薇薇主講(jiang)的(de)(de)《生成式(shi)對抗網(wang)絡(luo)GAN在動(dong)漫(man)領域的(de)(de)應(ying)用(yong)》。更多(duo)講(jiang)次也已陸(lu)續敲定,會盡快公布。敬請期(qi)待。
直播信息
直播時間:4月11日10:00-11:30(北京時間)
直播平臺:智東西公開課小程序
答疑地址:強化學習交流(liu)群(qun)
課程內容
主題:深度強化學習在(zai)機器人(ren)領域(yu)的研究
提綱:
1、深度強化學習的研究進展
2、深度強化學習在機器人領域的應用
3、仿真器如何解決自動駕駛領域長尾問題
4、imitation learning快速學習可操作的駕駛策略
5、使用A3C,DDPG進行smart agent方(fang)面的研究
講師介紹
胡(hu)亞(ya)飛(fei),卡內基梅隆大學(xue)博士(shi),目前在(zai)計算機(ji)學(xue)院下(xia)的(de)機(ji)器人系(xi)進(jin)行(xing)研究工作;主要研究方向為動態場景下(xia)的(de)視覺SLAM(包括深度學(xue)習方法(fa)和傳(chuan)統幾何方法(fa)),強化(hua)學(xue)習在(zai)機(ji)器人決策與規(gui)劃中的(de)應用,以(yi)及2D/3D多目標跟蹤等問題;曾任ICRA, Autonomous Robot審稿人。
陳鈺,輕舟智航高級感知(zhi)工(gong)程(cheng)師,工(gong)作內(nei)(nei)容主要是(shi)多傳感器融合的(de)追蹤;卡(ka)內(nei)(nei)基梅隆(long)大學電(dian)(dian)子與(yu)計算(suan)(suan)機(ji)工(gong)程(cheng)碩(shuo)士、中山大學數據科學與(yu)計算(suan)(suan)機(ji)學院本科;曾(ceng)在阿里巴巴達摩院機(ji)器智能部門、瑞芯微電(dian)(dian)子核(he)心算(suan)(suan)法部門實習(xi),有多項美國專利(li);在CMU MLD Katerina Fragkiadaki實驗室做研(yan)究助(zhu)理;在知(zhi)乎(hu)上撰寫(xie)了深(shen)度學習(xi)專欄(lan): ?CMU 10-703 深(shen)度強化(hua)學習(xi)筆記。
申請入群
本次(ci)課程的(de)講解分(fen)為主講和(he)答疑兩(liang)部分(fen),主講以視頻直播形式,答疑將在「強化學習(xi)交流群」進行(xing)。
加入交流群,除了可以(yi)免費收聽直播之外,還能認識(shi)講師,與更多同行和同學一起學習,并進行深度討論。
掃碼(ma)添加小助手小開(ID:hikai19)即可申請,備注(zhu)“姓名-公司/學校/單(dan)位-職位/專業”的(de)朋友將會優先(xian)審(shen)核通過哦~