
4月11日,智東西(xi)創(chuang)課(ke)邀請(qing)到速感科技CTO張一茗,就《從0到1了(le)解SLAM》這一主題在智東西(xi)旗下「機器人」社群(qun)(有入群(qun)需(xu)求請(qing)天(tian)驕智小西(xi)微信zhidxrobot)開講(jiang)。本(ben)文(wen)為本(ben)場創(chuang)課(ke)的全程(cheng)圖文(wen)實(shi)錄,分(fen)為主講(jiang)+Q&A二部分(fen)。全文(wen)共計5026字,讀完(wan)大概需(xu)要(yao)15分(fen)鐘,你(ni)可以(yi)掌握:
1、SLAM的定義、發展史;
2、機器人視覺傳感器的演進史;
3、三維深度傳感器的不同技術路線及差異比較;
4、SLAM如何實現,尤其是vSLAM;
5、vSLAM應用在機器人上(shang)存在的問題;
關于嘉賓:張一茗,速感科技CTO,畢業于北京航空航天大學,參與總裝備部、火箭軍等多型號慣性及其組合導航定位系統設計,負責慣性/衛星/光學組合導航系統及算法設計,具有豐富的定位導航系統設計經驗。
主講實錄
張一茗:感謝大家的(de)支持,也感謝何總(注:智東西聯合創始人(ren)(ren)何峰)的(de)邀請,來到這里跟(gen)大家分享我(wo)在SLAM領域的(de)認識(shi)和理解,也歡迎分享后和大家一起探討SLAM技術在機器人(ren)(ren)行(xing)業的(de)應用。
各位千萬(wan)別客氣,我(wo)(wo)先來按照我(wo)(wo)的思路來跟大家分享以下我(wo)(wo)對SLAM的理(li)解吧。
SLAM全稱(cheng)simultaneous localization and mapping大家應該都比較熟悉了,字(zi)面可(ke)見分為兩大部分:定位、構(gou)圖。
定(ding)位(wei)(嚴格來說是定(ding)位(wei)、定(ding)姿(zi))這(zhe)個問題(ti)幾千(qian)(qian)年來都(dou)是個炒的(de)火(huo)熱的(de)問題(ti)。定(ding)位(wei)的(de)場景(jing)千(qian)(qian)差萬別,對精度的(de)要(yao)求也越來越苛刻。與此(ci)同時,定(ding)位(wei)也是個細分市場,出(chu)于不(bu)同場景(jing)對于體(ti)(ti)積(ji)、成本、精度、更新(xin)頻率需求的(de)差異,衍生了多(duo)種多(duo)樣(yang)的(de)定(ding)位(wei)方式。比如GPS、慣導、DR、無線電甚至(zhi)藍牙、wifi等(deng)等(deng)。GPS具有體(ti)(ti)積(ji)小、米級(ji)定(ding)位(wei)精度、無累計(ji)誤差可(ke)做差分、可(ke)授時等(deng)優(you)勢(shi),缺點是要(yao)工作在室外,更新(xin)頻率低,易受多(duo)徑效應等(deng)影響(xiang)。
慣(guan)性導(dao)航系統具(ju)有短時定(ding)位(wei)精度極(ji)高(gao)(gao)、輸出頻率極(ji)高(gao)(gao),但是它(ta)的(de)(de)高(gao)(gao)成本(ben)、大(da)體積、需初(chu)始(shi)對(dui)準的(de)(de)特性使它(ta)不會大(da)規模(mo)進入消費類市場(chang)。消費級機(ji)器人(ren)領域,通(tong)過DR(Dead reckoning)航位(wei)推算方(fang)法,能(neng)夠(gou)(gou)(gou)用很低成本(ben)的(de)(de)編碼器,實(shi)現(xian)精準的(de)(de)速度控(kong)制和(he)短時間(jian)的(de)(de)位(wei)置(zhi)朝向估計(ji),但是具(ju)有比較大(da)的(de)(de)累(lei)計(ji)誤(wu)差且不能(neng)實(shi)現(xian)重定(ding)位(wei)。隨著Rangefinder、CMOS、高(gao)(gao)性能(neng)CPU的(de)(de)發展(zhan),人(ren)們能(neng)夠(gou)(gou)(gou)用足夠(gou)(gou)(gou)的(de)(de)算力和(he)存儲,采集足夠(gou)(gou)(gou)的(de)(de)信(xin)(xin)息,利用場(chang)景模(mo)型(xing)等參數作(zuo)為先(xian)驗信(xin)(xin)息融入到位(wei)置(zhi)姿態估計(ji)中。SLAM這種同時建模(mo)與構圖(tu)的(de)(de)概念開始(shi)成為一個(ge)研究熱(re)點。
我這(zhe)里有一篇論(lun)文《1991 Simultaneous map building and localization for an autonomous mobile robot》。()
在1991年的(de)(de)時候(hou),SLAM的(de)(de)開山鼻(bi)祖們使用了(le)18個超聲傳(chuan)感(gan)器(qi),利用EKF設計了(le)第一(yi)套(tao)針對移動(dong)機器(qi)人的(de)(de)SLAM系(xi)統。后(hou)來隨著(zhu)激(ji)光雷(lei)達的(de)(de)出現(xian),系(xi)統能夠更容易(yi)的(de)(de)識別2D平面的(de)(de)角點(dian)特征,雷(lei)達SLAM的(de)(de)實用性(xing)上升了(le)一(yi)個級(ji)別。而后(hou)隨著(zhu)CPU算(suan)力(li)的(de)(de)提升,圖像的(de)(de)處(chu)理能力(li)越來越強,基(ji)于(yu)單(dan)攝像頭、多攝像頭、深(shen)度攝像頭的(de)(de)SLAM研究與應用如雨后(hou)春筍(sun)般冒(mao)出來。
基(ji)于視覺(jue)影像的SLAM系統(tong)體積(ji)小(xiao)、功耗(hao)低(di)、可靠性高,在提供準確定位(wei)的同時,也(ye)能夠(gou)建(jian)立或稀疏或稠密的地圖,給人無(wu)限遐想的空間(jian)。十多年(nian)來,學術界針(zhen)對視覺(jue)SLAM的研究日(ri)新月異(yi),創造(zao)了(le)許多優(you)秀的理(li)論。然而到了(le)今(jin)天大(da)家(jia)也(ye)都發現,純視覺(jue)的vSLAM依然有(you)它的缺點,比(bi)如受光照(zhao)條件影響大(da),高動態環境精度(du)下降,對場景復(fu)雜度(du)要求高等特點,以Visual-SLAM為基(ji)礎(chu)的多傳感器融合SLAM成為新的熱點。
2012年美國軍方提出了一個相當宏偉的概念,開展了在GPS服務被干擾、被阻斷,即不能使用GPS服務背景下的高精度定位、導航與授時技術:“全源導航”(ASPN)技術研究,以期在未來對抗條件下的軍事行動中保持、占據精確PNT(Position navigation time)能力的優勢。希望建立一套算法和軟硬件架構兼容10種以上的傳感器。 尤其是最近幾年,microPNT的概念也被軍方炒的越來越火熱。
目前的(de)(de)(de)導(dao)(dao)(dao)(dao)航(hang)定位算(suan)法(fa)大多(duo)被迫在完備性(xing)與效率(lv)之(zhi)間(jian)進(jin)行折中和(he)(he)選擇。“全源(yuan)導(dao)(dao)(dao)(dao)航(hang)”需要發(fa)展新(xin)的(de)(de)(de)濾波算(suan)法(fa),能(neng)夠(gou)全面兼(jian)容各類導(dao)(dao)(dao)(dao)航(hang)算(suan)法(fa),如高斯、非(fei)(fei)高斯統計(ji)算(suan)法(fa),或線性(xing)、非(fei)(fei)線性(xing)測(ce)量模型算(suan)法(fa)等;同(tong)時(shi)(shi),新(xin)的(de)(de)(de)導(dao)(dao)(dao)(dao)航(hang)算(suan)法(fa)必須(xu)滿足真(zhen)實(shi)環境下(xia)實(shi)時(shi)(shi)運(yun)行的(de)(de)(de)要求。新(xin)的(de)(de)(de)導(dao)(dao)(dao)(dao)航(hang)算(suan)法(fa)應當能(neng)夠(gou)處理平(ping)臺運(yun)動和(he)(he)測(ce)量可(ke)用(yong)性(xing)之(zhi)間(jian)產生(sheng)的(de)(de)(de)時(shi)(shi)變狀態空(kong)間(jian)問題,能(neng)夠(gou)對所有(you)導(dao)(dao)(dao)(dao)航(hang)測(ce)量結果進(jin)行統計(ji)。因此,在執行任(ren)務時(shi)(shi),新(xin)的(de)(de)(de)導(dao)(dao)(dao)(dao)航(hang)算(suan)法(fa)應能(neng)夠(gou)靈活地對傳(chuan)感器(qi)(qi)、敏感器(qi)(qi),以及測(ce)量量的(de)(de)(de)引(yin)入和(he)(he)去除進(jin)行調整(zheng),從而提供(gong)準確和(he)(he)可(ke)靠的(de)(de)(de)導(dao)(dao)(dao)(dao)航(hang)解決方案。
這個概念很難(nan),難(nan)在要適用于水(shui)下,地下,叢林(lin),郁(yu)閉森林(lin),郊區,城市峽谷,建筑室(shi)內,開(kai)放區域(yu)等各種環境、同(tong)時還要滿(man)足(zu)步行,無人機(ji)(ji)(所有(you)規格(ge)),潛水(shui)器,輪式車(che)輛,履帶式車(che)輛,飛機(ji)(ji),小型機(ji)(ji)器人等各種平臺,測(ce)量影像,速(su)度,加速(su)度,旋轉速(su)率,時間,位置,海拔高(gao)度,方向,相位來實現組合定位導(dao)航。
除了2D/3D成像系統以外,他們采用了傾角羅盤,,距離/偽距測距儀,氣壓計,溫度傳感器,方位角速率傳感器,GPS,激光雷達,加速度計,陀螺儀,磁力計,回轉羅盤,計時器,毫米波雷達以及其他雷達,1、2、3軸AOA/LOB/TDOA傳感器,計步器,星敏感器,紅外傳感器,無線局域網(WiFi)/射頻接收機,聲學傳感器等等傳感器。也只有用上這些傳感器,才有可能實現真正全天候、全場景、全平臺的定位導航系統。
這是他們大概的架構,可想而知有多復雜。
ASPN的(de)(de)項(xiang)目給了我最大(da)的(de)(de)一個警示就(jiu)是(shi):不談(tan)場景去(qu)談(tan)定位(wei)就(jiu)是(shi)在(zai)耍流氓。所以咱們來好好談(tan)談(tan)針對機器人領域(yu)中的(de)(de)vSLAM方案。
vSLAM在機(ji)器人上最難的問題我認為是這句話:start as a scientist, end as an eigineer。
Dyson出了一款360deg的omnidirectional的vSLAM掃地機,他們的研發起于21世紀初,做了十多年,才把一個掃地機做的漂亮(受一些客觀條件限制,效果沒有它的外觀那么漂亮)。
學(xue)術(shu)界(jie)上各(ge)種各(ge)樣vSLAM算法天花亂(luan)墜(zhui),可是如果沒有自己的(de)技(ji)術(shu)積累和(he)工程化(hua)經(jing)驗(yan),這離實際的(de)產品(pin)化(hua)差距還是太遠。
對于機器(qi)人的vSLAM而(er)言,視(shi)覺(jue)傳(chuan)感器(qi)在其中舉重若輕(qing)。一(yi)個好的視(shi)覺(jue)傳(chuan)感器(qi)就(jiu)是一(yi)個明(ming)亮的眼睛。今天咱們按照維度的高低來簡單介紹下:
傳統面陣相機/多目被動式相機采用面陣CMOS作為核心元件,隨著手機行業對于鏡頭的強勁需求,使得整個CMOS、鏡頭制造行業迅猛發展,低成本廉價的鏡頭成為輕而易舉的事情。滿足了機器人行業對于監控、目標識別與分析、跟蹤與定位的需求。
機器人行業的興起帶火了很多攝像頭公司,如果歸類的話依然脫離不了以下幾類:
對于單目結構光:激光投射器通過DOE投射出特征明顯的散斑,被紅外攝像頭捕獲,然后解算出深度信息。圖中可以看到Kinect(采用primesense方案)透射出去的散斑圖,DOE二維光學結構使得激光穿過DOE時,先擴散成偽隨機散斑,然后衍射為9束,形成看似隨機其實略有玄機的散斑。
然后受投射器功率的影響,單目結構光很難工作在室外。雙目結構光則可以規避這個缺陷當然還有一些其他的結構光
這個是hptg提供的pattern圖(tu)案,他們設計的一體化投射器模組(zu)能(neng)夠實現小體積(ji)低溫(wen)漂移的點陣(zhen)圖(tu)案,他是由兩(liang)幅十分規律的散斑組(zu)成,最后(hou)同(tong)時(shi)被紅外相(xiang)機獲得,精度相(xiang)對較高。
還有一種比較獨特的方案,它采用mems微鏡的方式,類似DLP原理,將激光器進行調頻,通過微鏡反射出去,并快速改變微鏡姿態,進行行列掃描,實現結構光的投射。比如Intel的realsense方案,這種方案可以做到比hptg還要薄的厚度,缺點是信噪比相對較差,動態效果略差一點,也算是體積與性能之間的一種折中。
ToF(time of flight)也是一種被炒的火熱的深度獲取方法,主要分為脈沖式和相位式兩種。這是一種相位式tof的原理,通過采集四個采樣點的相位,解算時間差,獲得對應pixel的深度信息。
傳(chuan)感器發(fa)出經調制(zhi)的近紅外光,遇物體后反(fan)射,傳(chuan)感器通(tong)過(guo)計算光線發(fa)射和反(fan)射時間差或相位差,來換算被拍攝(she)景物的距離,以產(chan)生(sheng)深度信息。
相(xiang)位法可以減(jian)輕背(bei)景光對于深度提取的(de)(de)(de)(de)影響,但是(shi)受這種(zhong)四個采樣點分(fen)時曝光的(de)(de)(de)(de)限制,它對于動態物體的(de)(de)(de)(de)效(xiao)果(guo)要比脈沖式差(cha)一些。脈沖式是(shi)一種(zhong)更(geng)常見的(de)(de)(de)(de)tof測距方(fang)法,從傳統的(de)(de)(de)(de)工業雷達,到現(xian)在(zai)炒(chao)的(de)(de)(de)(de)比較火的(de)(de)(de)(de)面振tof都(dou)大(da)量存在(zai)它的(de)(de)(de)(de)蹤影。
除了以上結構(gou)光、tof和普(pu)通相機(ji)以外,還有一種(zhong)有趣的攝(she)像頭叫(jiao)eventcamera。
他檢測的(de)是變化的(de)像素,大(da)(da)大(da)(da)縮減了(le)輸出的(de)數據量(liang),輕輕松松實現類似光流的(de)算法而且(qie)具有極高(gao)的(de)輸出頻率。學術界也有人在(zai)使(shi)用它在(zai)做slam,大(da)(da)家可以去搜(sou)索相(xiang)關的(de)論文看(kan)看(kan)。
這里找到了一個dyson360的一個有趣的vSLAM展示,通過采集全景鏡頭的視頻數據,只有640*480的分辨率,實現了很有趣的vSLAM定位。
SLAM算法(fa)在實(shi)現(xian)的時候主要要考慮以下4個方面:
1、地圖表示問題比如dense和sparse都(dou)是它(ta)的不同表達方(fang)式(shi),這個需要根據實(shi)際場景需求(qiu)去抉擇。
2. 信息感(gan)知問題,需(xu)要考慮如何全面的(de)感(gan)知這個(ge)環(huan)境,RGBD攝像頭FOV通(tong)常(chang)比(bi)較小,但(dan)激光雷達比(bi)較大。我們也做過一個(ge)類似dyson的(de)方案(an),能(neng)夠實現很低成本,小體積的(de)機器人定位。
3. 數(shu)據關聯問題,不同(tong)的sensor的數(shu)據類(lei)型、時間戳(chuo)、坐標系表達方式各(ge)有不同(tong),需要統一處理
4. 定位(wei)與構圖問(wen)題(ti),就是指(zhi)怎么實(shi)現位(wei)姿估(gu)計(ji)和(he)建模,這里面涉及到很多數學問(wen)題(ti),物(wu)理(li)模型建立(li),狀態估(gu)計(ji)和(he)優化。
我們也做過一個類似dyson的方案,能夠實現很低成本,小體積的機器人定位。
vSLAM里面還(huan)要考慮的有回環檢測問(wen)(wen)題(ti)(ti),探索問(wen)(wen)題(ti)(ti)(exploration),以及綁架問(wen)(wen)題(ti)(ti)(kidnapping)。
vSLAM在算法部分,對數學的基礎要求比較高,對概率統計、最小二乘估計、隨機梯度下降(或者高斯牛頓、LM)、線性系統建模與估計、非線性系統的概念和優化都得有較深的理解,同時也得有一個open的視野,熟練的編程能力,來實現效率更高的算法。
在團隊配置上,更需要要更種各樣的人,算法工程師、嵌入式工程師、光學工程師、傳感器工程師、算法優化工程師、結構工程師、機電工程師以及豐富的產品測試安排。
比(bi)如這就是幾周前(qian)我們對(dui)IMU進(jin)行的(de)一(yi)系列(lie)測試(shi)(shi)的(de)一(yi)部分,受溫漂影響,IMU的(de)輸(shu)出會隨著芯片溫度(du)(du)上升零(ling)偏(pian)發(fa)生漂移(yi)。這就會給一(yi)些絕(jue)對(dui)的(de)姿(zi)態(tai)參考造成(cheng)很大的(de)問(wen)題,需要通過溫度(du)(du)試(shi)(shi)驗摸出imu的(de)噪聲誤差一(yi)致(zhi)性,從而進(jin)行有效的(de)補償。
整個SLAM大概可以分為前端(duan)和(he)后端(duan),前端(duan)做配(pei)準,研究不(bu)同(tong)幀之間的(de)變換(huan)關(guan)系。
首先提取每幀圖像(xiang)(xiang)特征點(dian),利(li)用相鄰幀圖像(xiang)(xiang),進(jin)(jin)行特征點(dian)匹配(pei),然后利(li)用RANSAC去除大噪(zao)聲,然后進(jin)(jin)行ICP匹配(pei),同時(shi)可以利(li)用IMU提供的姿態信息進(jin)(jin)行濾波(bo)融。
后端則主要是研究前端出結果中累積誤差的矯正,利用濾波理論(EKF、UKF、PF)、或者優化理論TORO、G2O進行樹或者圖的優化。最終得到最優的位姿估計。當然,其中還要考慮一些閉環檢測問題。
這是(shi)我(wo)們的傳感器配合上我(wo)們6dof Visual Inertial SLAM算法的一(yi)個簡(jian)單展示(shi)。
vSLAM在機器人上的(de)(de)應用最難(nan)的(de)(de)就(jiu)是產品(pin)化和成本上的(de)(de)考慮(lv),好在機器人的(de)(de)vSLAM不需(xu)要特別(bie)高的(de)(de)實時(shi)性,也沒有(you)VR、AR令人難(nan)受(shou)的(de)(de)眩暈效應,不需(xu)要將(jiang)計算速率提(ti)的(de)(de)特別(bie)高,機器人行(xing)業的(de)(de)vSLAM是一個(ge)真(zhen)正短期(qi)內(nei)看得見的(de)(de)爆(bao)發(fa)點。
配合低頻的(de)visual解(jie)(jie)算,100ms內利用imu純積分(fen)實現高頻率的(de)vSLAM姿態輸(shu)出,基本上可以實現很(hen)低jitter的(de)定位定姿。當然(ran)這(zhe)個(ge)行業(ye)還(huan)遠沒有達到(dao)成(cheng)熟的(de)階段,比如依然(ran)沒有合適的(de)芯片,沒有覆蓋(gai)全場(chang)景全天候的(de)解(jie)(jie)決方(fang)案,這(zhe)也是整個(ge)slam行業(ye)要繼續(xu)解(jie)(jie)決下去的(de)問題(ti)。
時(shi)間差(cha)不多了(le),今天大(da)概先(xian)分(fen)享到這里。
Q&A環節實錄
提問1
劉軍令
目前比較主(zhu)流使用的slam算法(fa)都有哪(na)些?分別都有哪(na)些實際(ji)應用中的優勢(shi)和(he)局限?
張一茗:目前的開源SLAM方法還是很多很多的,國內有一些研究者整理過一個網站。
//slamcn.org/index.php/%E9%A6%96%E9%A1%B5#.E4.B8.BB.E6.B5.81.E5.BC.80.E6.BA.90SLAM.E6.96.B9.E6.A1.88
但(dan)是(shi)(shi)我(wo)的(de)看法(fa)是(shi)(shi),這(zhe)些算(suan)法(fa)都是(shi)(shi)科(ke)研成(cheng)果,是(shi)(shi)屬(shu)于scientist的(de)東(dong)西。他們并(bing)不能(neng)輕松實現產品(pin)化(hua),start as a scientist, end as an eigineer,如果沒有自(zi)己的(de)算(suan)法(fa),別人走過的(de)坑該踩(cai)還是(shi)(shi)要(yao)踩(cai),才(cai)能(neng)真正走向產品(pin)化(hua)的(de)。
提問2
陳進博
目(mu)前市場中做SLAM的(de)公司很(hen)多(duo),如何去識別哪(na)家更有優(you)勢?對于做這一塊的(de)公司,您(nin)認為應該怎樣(yang)才能突圍而(er)出?
張一茗:我(wo)認為識別公(gong)司優勢的(de)指標(biao)就是成(cheng)熟度,demo很容易,出產品很難。必(bi)須有豐富的(de)產品化經驗以(yi)及(ji)腳踏實地的(de)扣(kou)每(mei)一個細(xi)節,才能(neng)夠突圍而出,勝算體現在(zai)一些細(xi)節,比如標(biao)定(ding)(ding)設備、標(biao)定(ding)(ding)方法、測試方法、生(sheng)產線設計(ji)等等。
提問3
何瀟
目前主流(liu)的ORB-SLAM的關鍵點和優化方向(xiang)是什么?
張一茗:ORB-SLAM只(zhi)是開(kai)源(yuan)算(suan)法(fa)的(de)(de)一種,它構建(jian)了一種思路(lu)很清晰(xi)的(de)(de)vslam方法(fa),前(qian)端(duan)后端(duan)嚴謹,框架(jia)清晰(xi),很適合初學者(zhe)學習,但是我(wo)個(ge)人認為在產(chan)品(pin)化的(de)(de)路(lu)上他(ta)并不是一個(ge)特別好的(de)(de)方案。
提問4
林義閩
vslam是否可以用(yong)于室外空曠區(qu)域?
張(zhang)一(yi)(yi)茗:vSLAM在(zai)(zai)室外(wai)(wai)(wai)是(shi)(shi)可(ke)以(yi)用(yong)(yong)的(de),但(dan)是(shi)(shi)有(you)一(yi)(yi)些限制。比(bi)如說基于Depth的(de)SLAM在(zai)(zai)室外(wai)(wai)(wai)是(shi)(shi)幾乎是(shi)(shi)沒法用(yong)(yong)的(de)。因為室外(wai)(wai)(wai)光源(yuan)太(tai)強,很難獲得(de)一(yi)(yi)個準(zhun)確的(de)Depth。所以(yi)深度圖的(de)這種(zhong)(zhong)匹配是(shi)(shi)完全不(bu)起作用(yong)(yong)。然后,對于基于純視覺SLAM在(zai)(zai)室外(wai)(wai)(wai)的(de)話,大部(bu)分(fen)場景(jing)(jing)是(shi)(shi)可(ke)用(yong)(yong)的(de)。但(dan)是(shi)(shi)如果(guo)說,室外(wai)(wai)(wai)的(de)這種(zhong)(zhong)景(jing)(jing)深太(tai)過單調,比(bi)如說十分(fen)空曠,體(ti)現不(bu)出層次感的(de)話,他依(yi)然是(shi)(shi)不(bu)能夠實現一(yi)(yi)個很好(hao)的(de)定(ding)位(wei)的(de)。只要室外(wai)(wai)(wai)的(de)場景(jing)(jing)錯落有(you)致一(yi)(yi)些,它依(yi)然能夠實現一(yi)(yi)個比(bi)較好(hao)的(de)精(jing)度。
(補充(chong)提(ti)問):針對第(di)4點的(de)提(ti)問,是(shi)否可以理解說SLAM主要是(shi)運用在室(shi)內的(de)而不是(shi)室(shi)外呢?
張一(yi)茗:絕大部分(fen)室外場景是可用的,除非特別空曠的一(yi)些極端(duan)環境。我(wo)們測試過我(wo)們的算(suan)法,沒(mei)有問題。
提問5
劉煥云
室內三維重建(jian)有沒有推薦的開源(yuan)算法(fa),剛入(ru)門應該從(cong)何(he)入(ru)手?
張一茗:這個需求跟SLAM領(ling)域略有不同,應(ying)該是屬于(yu)SFM的領(ling)域,這個領(ling)域開源方(fang)法也(ye)很(hen)多,您可以(yi)去SFM領(ling)域的paper中搜尋下(xia)
提問6
Jennifer
機器視覺領域創業(ye)公(gong)司(si)和大公(gong)司(si)比優勢(shi)和劣勢(shi)在哪里(li)?速感科技的核心優勢(shi)是(shi)(shi)什么?公(gong)司(si)面臨(lin)的核心挑(tiao)戰(zhan)是(shi)(shi)?
張(zhang)一茗:我(wo)認(ren)為(wei)定位(wei)這個(ge)行業(ye)最大(da)的(de)(de)(de)特點就在于(yu),沒有萬能的(de)(de)(de)定位(wei)方案,每個(ge)應用場(chang)景(jing)都有不同的(de)(de)(de)需求,大(da)家(jia)都是在搜(sou)尋一個(ge)更大(da)的(de)(de)(de)市場(chang),即(ji)使是大(da)公司(si)(si),也很(hen)難(nan)做(zuo)到類似apple這樣(yang)的(de)(de)(de)壟斷。對(dui)于(yu)創業(ye)公司(si)(si),做(zuo)大(da)公司(si)(si)未來(lai)得及(ji)做(zuo)之事,在大(da)公司(si)(si)做(zuo)起來(lai)之前(qian)的(de)(de)(de)窗口(kou)期搶占對(dui)自己有優勢的(de)(de)(de)市場(chang),賺取(qu)足夠的(de)(de)(de)利(li)潤并成為(wei)新的(de)(de)(de)巨頭,這是我(wo)認(ren)為(wei)創業(ye)公司(si)(si)的(de)(de)(de)生(sheng)存之道(dao) (回答完畢(bi))。
提問7
李海峰
請問SLAM硬件(jian)在(zai)基于(yu)FPGA實(shi)現(xian)的(de)實(shi)踐中(zhong)能做到多高的(de)深度分辨率(lv)和(he)幀率(lv),還(huan)有需要多少邏輯單元(yuan)?
張(zhang)一茗(ming):slam并不適合用純粹的fpga去實現,因為slam中雖(sui)然確實有很多可以并行化的部分,但是(shi)同(tong)時(shi)也有很多串行邏輯運算,我(wo)認(ren)為比較合適的方案還是(shi)arm加(jia)其他并行處理器的soc架構(gou)。我(wo)們目前用一些并行化的dsp去做特征提取,500個特征點可以花(hua)幾個ms來完成,而pc上(shang)需要20ms。
我(wo)們(men)目前(qian)用(yong)一些并行化(hua)的dsp去(qu)做特(te)征提取,500個(ge)特(te)征點可以花幾個(ge)ms來完(wan)成,而pc上(shang)需要20ms。
提問8
張辰
基于SLAM的(de)移動機器人,在行進過程(cheng)中,如何克服周邊環境變(bian)化的(de)影(ying)響?(比如在倉庫物流應用(yong)中,周圍(wei)貨物車輛人員的(de)動態變(bian)化)
張一茗:這個問題可(ke)(ke)以通過兩個方面解決,一個是擴大傳感器(qi)(qi)的視野,比(bi)如(ru)用大視場角的鏡頭或360deg的雷達(da),另一方面利用其他傳感器(qi)(qi)比(bi)如(ru)慣性、編碼器(qi)(qi)進(jin)行組合,都可(ke)(ke)以進(jin)行周(zhou)圍環境變(bian)化的抑制。
提問9
王佳龍
想問(wen)一(yi)下,貴公(gong)司(si)宣(xuan)傳的M-32傳感器定位精(jing)度(du)1cm,這個精(jing)度(du)指的是RMSE嗎?如果是,groundtruth是通過(guo)什么方法得到的?
張(zhang)一(yi)茗:groundtruth采用(yong)的是(shi)(shi)類似vicon的光學方案(an)進(jin)行標定的,精度mm級(ji)別。1cm的定位(wei)精度是(shi)(shi)指的RMSE,是(shi)(shi)在室內環境(jing)進(jin)行的測試。
提問10
吳文欽
張總(zong)好(hao)。我(wo)們(men)在用Tof攝像頭的來做AGV導航。有(you)好(hao)的廠家推薦嗎?你(ni)們(men)有(you)適合的模組嗎?謝(xie)謝(xie)
張一茗:Tof模(mo)組(zu)我(wo)們不設計(ji),做Tof的(de)(de)(de)公司很多,最上(shang)(shang)游(you)的(de)(de)(de)有(you)(you)pmd、ti、epc等(deng)等(deng)公司,下(xia)游(you)的(de)(de)(de)模(mo)組(zu)公司有(you)(you)很多,可能(neng)不太(tai)適合在這里廣告,您(nin)可以(yi)網上(shang)(shang)多搜(sou)尋一下(xia),或者私下(xia)溝通一下(xia)。