
智東西(公眾號:zhidxcom)
編輯 | 李水青
智東(dong)西6月21日消息,近日GTIC 2021嵌入式(shi)AI創新峰(feng)會在(zai)(zai)北京圓滿收官!在(zai)(zai)這場全天座(zuo)無虛席、全網(wang)直播觀看人數逾(yu)150萬(wan)次的高(gao)規格(ge)AI產(chan)業(ye)(ye)峰(feng)會上,來自產(chan)業(ye)(ye)鏈上下游的16位大佬共(gong)聚一(yi)堂(tang),圍(wei)繞嵌入式(shi)AI的軟硬(ying)件生態創新、家居(ju)AIoT、移(yi)動機器人和(he)工業(ye)(ye)制造產(chan)業(ye)(ye)4大版塊(kuai)地圖,帶來了深入淺出的分(fen)享。
會上,極智嘉研發總監陳超(chao)帶來了題(ti)為(wei)《物(wu)流機(ji)器人視覺感知技(ji)術的挑(tiao)戰(zhan)(zhan)與創新》的演講。演講主要包(bao)含三部分:物(wu)流與物(wu)流機(ji)器人,倉儲(chu)與工(gong)業兩(liang)種不同場(chang)景下(xia)物(wu)流機(ji)器人在視覺方面面臨(lin)的挑(tiao)戰(zhan)(zhan)與解法。
物(wu)流行(xing)業是一個巨(ju)大市(shi)場(chang)(chang),但行(xing)業長期(qi)面(mian)臨用(yong)人(ren)難、市(shi)場(chang)(chang)需(xu)求變化快等(deng)痛點。物(wu)流機器(qi)人(ren)在(zai)(zai)這樣(yang)的背景(jing)下(xia)應運(yun)(yun)而生,目前已經演化出(chu)智能分(fen)揀、智能搬運(yun)(yun)、智能叉車、智能倉儲等(deng)多(duo)(duo)場(chang)(chang)景(jing)的產品形態(tai),并在(zai)(zai)眾多(duo)(duo)實際(ji)場(chang)(chang)景(jing)中落(luo)地。
陳(chen)超回顧,在(zai)極智嘉物(wu)流機器人落地(di)行業過程(cheng)中(zhong),在(zai)視覺感(gan)知(zhi)技術方面克服了眾多挑戰。
在(zai)倉儲AMR移動(dong)機器(qi)人(ren)領(ling)域,場景相對簡單,主要包括貨架到人(ren)的(de)(de)揀選和貨箱到人(ren)的(de)(de)揀選兩大場景。針對用(yong)于(yu)導航的(de)(de)地(di)面二維(wei)(wei)碼,團隊遇到了(le)污損(sun)/反光、運動(dong)模糊(hu)等(deng)問題(ti),以及成本降低的(de)(de)訴求(qiu)。為此,極智嘉在(zai)最新機器(qi)人(ren)上引入了(le)基于(yu)地(di)紋融合的(de)(de)V1.5,彌補二維(wei)(wei)碼易污損(sun)的(de)(de)問題(ti);更進一步,極智嘉基于(yu)Marker-Net的(de)(de)V2.0解(jie)決方(fang)案將故障率降低兩個數量(liang)級(ji)。
在工(gong)業AMR移動機(ji)器人領域,面(mian)臨的(de)(de)場(chang)景和挑戰也更加復雜(za)多樣(yang)。比如,針(zhen)(zhen)對(dui)行業樣(yang)本少的(de)(de)問(wen)題(ti),極智嘉采取(qu)學習(xi)仿(fang)真(zhen)方案,快速擴充樣(yang)本;針(zhen)(zhen)對(dui)未知目標檢測(ce)問(wen)題(ti),極智嘉引(yin)入深度相(xiang)機(ji),使得深度學習(xi)模(mo)型有(you)機(ji)結合(he)深度數據,提(ti)高目標檢測(ce)性能(neng)。
而(er)針(zhen)對魯棒性要求高的(de)(de)問題,極(ji)智嘉采(cai)用復合模(mo)型(xing)方法;面對高動(dong)態場景(jing)下的(de)(de)定(ding)位難題,采(cai)用地圖(tu)更新和語(yu)義地圖(tu),從而(er)保證機器人長期穩定(ding)運行;針(zhen)對端側設(she)備低(di)算(suan)力(li)的(de)(de)問題,極(ji)智嘉通過算(suan)法優化(hua)及加速引(yin)擎來突破算(suan)力(li)限制(zhi)。
可以看到,作為自2015年(nian)就成立的(de)物流機(ji)器人(ren)頭(tou)部企業(ye)(ye),極(ji)智嘉已經針(zhen)對倉儲及工業(ye)(ye)特定應用場景,攻克(ke)了嵌(qian)入式AI開(kai)發的(de)一座座山頭(tou)。
我們將陳超演講實錄整理為以下三部分:
一、物流行業占GDP超10%,物流機器人應運而生
關于物(wu)流(liu),除了(le)普通(tong)消費(fei)者經常接觸到的快遞物(wu)流(liu)之外(wai),還包(bao)括倉儲物(wu)流(liu)、工(gong)廠物(wu)流(liu)等細分的物(wu)流(liu)場景。物(wu)流(liu)是一個非(fei)常龐雜(za)的復合型產業,在GDP中占比超10%,可以說物(wu)流(liu)為整個社(she)會(hui)的生產生活物(wu)資供應提(ti)供了(le)保障。
近年來物(wu)流(liu)業面臨(lin)著挑戰:首先是用(yong)人(ren)(ren)(ren)難(nan)的問題。其實每個人(ren)(ren)(ren)的身(shen)邊都可以明顯感覺到這些年來整個社會(hui)的老齡化與少(shao)子化的趨勢。適(shi)齡勞動人(ren)(ren)(ren)口正(zheng)在逐漸減少(shao),與此同(tong)時,現在的年輕人(ren)(ren)(ren)也(ye)更(geng)傾(qing)向(xiang)于去大(da)城市(shi)從事服務型的工(gong)作,不愿意(yi)下到工(gong)廠倉(cang)庫(ku)里面做一些底層枯(ku)燥的物(wu)流(liu)類的工(gong)作,給物(wu)流(liu)相(xiang)關企業的招聘(pin)造成(cheng)一定的困難(nan)。
另一方(fang)面,物流業變化(hua)快。隨(sui)著整個(ge)經濟的(de)發展,居民(min)的(de)消費升(sheng)(sheng)級目(mu)前大規模(mo)標準的(de)工業化(hua)生產(chan)(chan)產(chan)(chan)品越來(lai)越少(shao),更(geng)多是(shi)高(gao)度(du)定制化(hua)、個(ge)性(xing)化(hua)的(de)小批量產(chan)(chan)品生產(chan)(chan),現在產(chan)(chan)品的(de)迭代速度(du)更(geng)快,升(sheng)(sheng)級更(geng)頻繁,對于供應鏈提(ti)出新的(de)挑戰。
物(wu)流機器人在這樣的背景下應運而(er)生。
由于物流涉及的(de)(de)面比較廣,在不同的(de)(de)環(huan)節(jie)、方面也(ye)會有不同的(de)(de)機(ji)器人和(he)(he)解(jie)決方案。(物流機(ji)器人)主要用在一些快(kuai)遞領域的(de)(de)智(zhi)能(neng)分(fen)揀(jian)、電商倉(cang)(cang)庫里的(de)(de)智(zhi)能(neng)揀(jian)選,還(huan)有制造業產線上(shang)的(de)(de)智(zhi)能(neng)搬運機(ji)器人、智(zhi)能(neng)叉車,集成解(jie)決方案智(zhi)能(neng)倉(cang)(cang)和(he)(he)智(zhi)慧工廠……下面,我們通過具(ju)體的(de)(de)機(ji)器人了(le)解(jie)一下。
極智(zhi)嘉的(de)產品(pin)全家福(fu),涵蓋了絕大多數物流機(ji)(ji)(ji)器(qi)人(ren)(ren)(ren)的(de)品(pin)類。包括(kuo)前排的(de)低矮潛伏式的(de)揀選(xuan)機(ji)(ji)(ji)器(qi)人(ren)(ren)(ren)和(he)搬運式機(ji)(ji)(ji)器(qi)人(ren)(ren)(ren),以及中間的(de)分揀機(ji)(ji)(ji)器(qi)人(ren)(ren)(ren)和(he)料箱揀選(xuan)機(ji)(ji)(ji)器(qi)人(ren)(ren)(ren),以及后排高(gao)大的(de)無人(ren)(ren)(ren)叉車、人(ren)(ren)(ren)機(ji)(ji)(ji)協作機(ji)(ji)(ji)器(qi)人(ren)(ren)(ren)、帶有機(ji)(ji)(ji)械(xie)臂的(de)復合機(ji)(ji)(ji)器(qi)人(ren)(ren)(ren)。
在忙(mang)碌工作的機(ji)器人背后,是一套基于云(yun)邊(bian)端的系統架(jia)構。
首先在最(zui)底(di)層(ceng)的(de)端側,是機(ji)器(qi)人的(de)本體,包含視(shi)覺感知(zhi)、定位、PNC等軟件的(de)算法(fa);中間的(de)邊緣服(fu)務(wu)(wu)器(qi)端,運行RMS負責(ze)機(ji)器(qi)人任務(wu)(wu)的(de)調度和(he)路徑(jing)規劃;最(zui)上層(ceng)的(de)云端部署WMS、ERP系統和(he)客戶(hu)的(de)業務(wu)(wu)進(jin)行對接。
正是基于這么一套(tao)云邊端(duan)架構(gou),(我們)保證了物流(liu)機器人(ren)穩定高效運(yun)行。
二、倉儲場景:視覺識別精度要提升,降本需求大
對(dui)(dui)物流機器人系統(tong)有初步了解之后,看一下視(shi)覺(jue)感知的挑(tiao)戰和應對(dui)(dui)。
首先在倉(cang)儲場(chang)景,目前(qian)應用較多的是:1、貨架到(dao)(dao)人(ren)揀(jian)選;2、貨箱到(dao)(dao)人(ren)的揀(jian)選。
“貨(huo)到(dao)人(ren)揀(jian)(jian)選(xuan)模式(shi)”改變了傳(chuan)統揀(jian)(jian)選(xuan)中(zhong)人(ren)找(zhao)(zhao)貨(huo)的工(gong)作方式(shi)——由RMS下發指令,機器人(ren)運行(xing)到(dao)特(te)定的位(wei)(wei)置處(chu),將對應的貨(huo)架或(huo)者特(te)定的料箱搬運到(dao)揀(jian)(jian)選(xuan)工(gong)位(wei)(wei)處(chu),由人(ren)工(gong)完成揀(jian)(jian)選(xuan)。在這個(ge)環節中(zhong),作業員(yuan)已(yi)經(jing)不需要(yao)穿梭貨(huo)架尋(xun)找(zhao)(zhao)貨(huo)物,新的揀(jian)(jian)選(xuan)模式(shi)大幅降低了揀(jian)(jian)選(xuan)員(yuan)的勞動強度,同(tong)時(shi)明顯降低了揀(jian)(jian)選(xuan)的錯誤率,使(shi)整體的效率有2~3倍(bei)的提升。
揀選機器人(ren)是(shi)怎么定位(wei)的?細心的朋友已經看到(dao)了,視頻里面在地面上網(wang)格化(hua)密布了一些二(er)維(wei)碼(ma),在機器人(ren)底部裝有攝像頭,通過攝像頭拍攝二(er)維(wei)碼(ma)進行定位(wei),這和平(ping)時手機掃碼(ma)原(yuan)理很相(xiang)似。
由于二維碼部署在(zai)地(di)(di)面(mian)上,有一(yi)些(xie)特殊之處,容(rong)易受(shou)到(dao)污(wu)損。在(zai)倉庫的場景(jing)下經常會(hui)有一(yi)些(xie)拖(tuo)車(che)料車(che)運行,倉庫里面(mian)定期進行清(qing)潔維護,用功率非常大的清(qing)洗機,都會(hui)對地(di)(di)面(mian)二維碼造成損傷(shang)。
另外(wai)(wai)一(yi)方(fang)面(mian),機器人(ren)運行速度超過(guo)(guo)2~3米/秒,鏡頭(tou)距地面(mian)距離(li)非常(chang)近(jin),單位時間(jian)內物體滑過(guo)(guo)的(de)(de)像素(su)數比較(jiao)多,圖象模糊的(de)(de)情況比較(jiao)嚴(yan)重。另外(wai)(wai),低成(cheng)本(ben),也是受到前端(duan)市場方(fang)面(mian)的(de)(de)激烈競爭,(市場)對揀選類的(de)(de)機器人(ren)的(de)(de)傳感器、計算芯片等提出降成(cheng)本(ben)的(de)(de)訴求(qiu)。
針對前(qian)面的(de)(de)問(wen)題,我們(men)做(zuo)了一些(xie)技術和產品的(de)(de)迭代(dai)。早先的(de)(de)版(ban)本(ben)里面選(xuan)用了非常低成本(ben)的(de)(de)異構(gou)SoC(系(xi)統(tong)級芯(xin)片),將我們(men)傳統(tong)的(de)(de)基于幾何(he)特征(zheng)的(de)(de)算法用FPGA優(you)化加速(su),最終實(shi)現比(bi)較(jiao)優(you)異的(de)(de)性能價格比(bi)和性能功耗比(bi)。
針對二維(wei)碼的(de)污(wu)損問題,同時也為了(le)(le)減少(shao)二維(wei)碼在場(chang)景中(zhong)的(de)部署(shu),(我們)引入(ru)了(le)(le)地紋。仔(zi)細(xi)觀察會發現,地面(mian)其(qi)實有非常細(xi)小(xiao)的(de)紋理,都是獨一無二的(de)ID,可(ke)以用來做定位,和二維(wei)碼上面(mian)的(de)碼值是類似的(de)。
由于地(di)(di)(di)(di)紋(wen)的特殊性,(我們)采用一系列變換來提取地(di)(di)(di)(di)紋(wen)Global Feature,建立(li)地(di)(di)(di)(di)圖定位。當然地(di)(di)(di)(di)紋(wen)有一定的局(ju)限性,對于工廠的環氧地(di)(di)(di)(di)面(mian)、一些高亮瓷磚(zhuan)地(di)(di)(di)(di)面(mian)等都無法使用。
(我們)在(zai)(zai)最新的機器人上通過在(zai)(zai)機器人前端(duan)部署平視(shi)(shi)相機,后端(duan)采用神經(jing)網絡的方法Markernet極大(da)地拓(tuo)展(zhan)了二維(wei)碼(ma)檢測能力(li)。之前我們的攝(she)像機是朝下拍攝(she)的,視(shi)(shi)野范圍非常小,機器人稍(shao)微走偏一點(dian)點(dian),幾厘米、十幾厘米就會發生定(ding)位的丟失。現在(zai)(zai)依托于前視(shi)(shi)攝(she)像頭能夠在(zai)(zai)更大(da)的范圍內檢測二維(wei)碼(ma),進行重(zhong)定(ding)位,使故障率(lv)降(jiang)低了兩(liang)個數量級。
很多朋(peng)友會問,為(wei)什(shen)么(me)(me)對于(yu)二維碼有(you)著(zhu)明(ming)顯幾何特征或(huo)者人工(gong)設計的物體,為(wei)什(shen)么(me)(me)采(cai)用網(wang)絡的方法?
相對傳統的(de)手機掃碼(ma)(ma)也好(hao)或者之前的(de)機器人(ren)下(xia)視(shi)二維(wei)碼(ma)(ma)檢測(ce)的(de)方式,現(xian)在(zai)二維(wei)碼(ma)(ma)需要(yao)在(zai)更大范(fan)圍更小的(de)角度去檢測(ce)模(mo)糊(hu)污損的(de)二維(wei)碼(ma)(ma),基于(yu)數據驅(qu)動(dong)模(mo)型的(de)方法(fa)超過了傳統的(de)人(ren)工設計(ji)特征的(de)方法(fa)。
借助靈活相(xiang)機的(de)(de)部署還有后端(duan)智能(neng)算法,極(ji)大地(di)拓展了二維(wei)碼(ma)在場景中的(de)(de)使用范圍(wei),可以拓展到(dao)側面的(de)(de)貨架或者(zhe)天花板(ban)或者(zhe)場景中的(de)(de)幾乎任何地(di)方。這是在物流港口集裝箱里面做的(de)(de)測(ce)(ce)試,可以在非(fei)常黑暗的(de)(de)環境中進(jin)行二維(wei)碼(ma)的(de)(de)檢測(ce)(ce)識別。
三、工業場景:應對更復雜場景,建立仿真方案
在工業場景下,物流機器人視覺感知面(mian)臨的(de)挑戰和應對(dui),相對(dui)之(zhi)前提到的(de)倉儲環(huan)境,作業環(huan)節更多,涉(she)及的(de)面(mian)更廣。
工業場(chang)景(jing)中,不(bu)同(tong)場(chang)景(jing)下對(dui)應(ying)有(you)不(bu)同(tong)形態的機(ji)器(qi)(qi)人(ren),包括(kuo)左(zuo)邊(bian)的滾(gun)筒搬運機(ji)器(qi)(qi)人(ren)、頂升(sheng)搬運,還有(you)機(ji)械(xie)臂負荷機(ji)器(qi)(qi)人(ren)和智能叉車。工業場(chang)景(jing)下需求多樣、場(chang)景(jing)復雜,而不(bu)同(tong)的機(ji)器(qi)(qi)人(ren)在處理(li)不(bu)同(tong)作業任務的時候會面(mian)臨著不(bu)同(tong)的挑戰,下面(mian)具體來了(le)解一下。
首先,樣本少。以復合型機器人為例,做末(mo)端(duan)的抓取當中面臨著超過十萬種商品的檢測和(he)識別,不(bu)同于像無人車(che)這種應用,在工(gong)業(ye)領域很(hen)少有能在公開數據集上找到相應的樣本供我們(men)訓(xun)練。同時,工(gong)業(ye)客戶對數據的隱(yin)私性有一(yi)定的要求(qiu),也限制了一(yi)些樣本的采集。
我(wo)們采用(yong)(yong)(yong)仿(fang)真(zhen)+學習的(de)(de)(de)方案。以托(tuo)盤(pan)為例,托(tuo)盤(pan)是(shi)在整個物(wu)流場(chang)景(jing)下(xia)廣泛使用(yong)(yong)(yong)的(de)(de)(de)載具(ju),托(tuo)盤(pan)有很多種類,有歐標(biao)、國標(biao)還有非標(biao),有各種不同(tong)的(de)(de)(de)顏(yan)色、形狀(zhuang)、尺寸、材質,甚至某(mou)些(xie)客戶就地取材,用(yong)(yong)(yong)原材料臨時組裝成類似托(tuo)盤(pan)的(de)(de)(de)物(wu)品(pin)。利用(yong)(yong)(yong)仿(fang)真(zhen)引擎快(kuai)速搭建單(dan)目標(biao)的(de)(de)(de)效果圖,可(ke)(ke)以對(dui)它(ta)進行不同(tong)的(de)(de)(de)光照、顏(yan)色、位置的(de)(de)(de)渲染(ran),快(kuai)速擴充我(wo)們的(de)(de)(de)樣本。對(dui)于(yu)某(mou)些(xie)應(ying)用(yong)(yong)(yong),我(wo)們可(ke)(ke)以做到全場(chang)景(jing)的(de)(de)(de)仿(fang)真(zhen)。對(dui)于(yu)工業場(chang)景(jing)下(xia)之(zhi)前已經積累的(de)(de)(de)一(yi)(yi)些(xie)數據還有已經訓練好(hao)的(de)(de)(de)模型利用(yong)(yong)(yong)Few Shots learning,Transfer Learning快(kuai)速開發、適配一(yi)(yi)些(xie)新應(ying)用(yong)(yong)(yong)。
未知目(mu)標檢測,目(mu)標的(de)(de)(de)種類比較多(duo),一(yi)(yi)些異常檢測或(huo)(huo)者(zhe)障礙物(wu)檢測無法(fa)窮盡被測目(mu)標,我們不知道前(qian)面掉的(de)(de)(de)是產線(xian)上的(de)(de)(de)扳(ban)手(shou)或(huo)(huo)者(zhe)一(yi)(yi)個零件,也(ye)可(ke)能是一(yi)(yi)個鼠(shu)標或(huo)(huo)者(zhe)電(dian)池(chi),基于傳(chuan)統的(de)(de)(de)深度模(mo)型的(de)(de)(de)方法(fa)過度依(yi)賴于之前(qian)的(de)(de)(de)樣本,面對從來沒有見過的(de)(de)(de)物(wu)品檢測的(de)(de)(de)時候(hou),性能有比較大的(de)(de)(de)下(xia)降。
我們引入深(shen)(shen)度(du)學習的(de)(de)方(fang)法(fa)有(you)機結合深(shen)(shen)度(du)數(shu)據和RGB數(shu)據進(jin)行(xing)檢測(ce)。深(shen)(shen)度(du)相機的(de)(de)種類(lei)非常多,包括(kuo)Stereo camera、TOF camera、Structure Light camera等,根據不同的(de)(de)檢測(ce)距離、精度(du)要求(qiu)選(xuan)擇(ze)相應的(de)(de)傳(chuan)感器。我們選(xuan)用Stereo camera進(jin)行(xing)障礙物檢測(ce),它輸出的(de)(de)深(shen)(shen)度(du)圖和灰度(du)圖在(zai)像素層(ceng)面上是天然(ran)對齊的(de)(de),為后面的(de)(de)進(jin)一步信息融合奠定非常好的(de)(de)。
以深度為主的(de)(de)(de)(de)檢(jian)測(ce)(ce)方法不(bu)太(tai)依賴之(zhi)前建(jian)立的(de)(de)(de)(de)模型,對于(yu)未曾見(jian)過(guo)的(de)(de)(de)(de)目標有比較好的(de)(de)(de)(de)檢(jian)測(ce)(ce)效果,我(wo)們(men)機器人上使用的(de)(de)(de)(de)是成本非(fei)常(chang)廉價的(de)(de)(de)(de)深度傳感器,不(bu)像激光(guang)雷(lei)達有那么高的(de)(de)(de)(de)距離精度,對于(yu)低矮細小(xiao)的(de)(de)(de)(de)物(wu)體,深度的(de)(de)(de)(de)數(shu)據(ju)可用性大幅(fu)降低,對于(yu)很遠(yuan)的(de)(de)(de)(de)物(wu)體,深度圖(tu)從原理上退化成2D圖(tu),需要結合RGB的(de)(de)(de)(de)數(shu)據(ju)進行檢(jian)測(ce)(ce)。
工業場(chang)景下(xia)出于對(dui)于安全性(xing)、效率的(de)(de)(de)要(yao)求,對(dui)其相關(guan)的(de)(de)(de)設備魯棒(bang)性(xing)要(yao)求非(fei)常高,以叉車為(wei)例,叉車的(de)(de)(de)負載(zai)能(neng)力非(fei)常強,破壞性(xing)非(fei)常大(da),錯(cuo)誤(wu)的(de)(de)(de)檢(jian)(jian)(jian)測(ce)會對(dui)物品(pin)、人員造成非(fei)常大(da)的(de)(de)(de)傷害,我(wo)們采用復合(he)模型的(de)(de)(de)方(fang)法(fa),通過復合(he)模型把深度學(xue)習(xi)方(fang)法(fa)和領域(yu)知(zhi)識結合(he)在一(yi)起。一(yi)方(fang)面(mian)我(wo)們快速地輸(shu)出物體(ti)潛(qian)在的(de)(de)(de)檢(jian)(jian)(jian)測(ce)物體(ti),另(ling)外(wai)一(yi)方(fang)面(mian)托盤檢(jian)(jian)(jian)測(ce)或者某(mou)些(xie)料箱檢(jian)(jian)(jian)測(ce)來說,我(wo)們知(zhi)道檢(jian)(jian)(jian)測(ce)的(de)(de)(de)是什么目標,就(jiu)可以利用先驗模型走一(yi)個網絡(luo)校驗,得(de)到魯棒(bang)性(xing)更高準(zhun)確性(xing)更高的(de)(de)(de)結果。
高動態(tai)場景下的(de)定位(wei)(wei),和基于(yu)地面(mian)上的(de)二(er)維碼(ma)(ma)進(jin)(jin)行(xing)(xing)定位(wei)(wei)的(de)倉(cang)儲機(ji)器(qi)人不同,,工(gong)業(ye)上更(geng)多的(de)使用(yong)SLAM機(ji)器(qi)人。SLAM是利用(yong)傳感器(qi)對環境進(jin)(jin)行(xing)(xing)觀測建立地圖(tu)進(jin)(jin)而(er)進(jin)(jin)行(xing)(xing)定位(wei)(wei)的(de)技(ji)術,這(zhe)(zhe)和人眼觀測整個(ge)場景,根據這(zhe)(zhe)些(xie)視覺地標定位(wei)(wei)的(de)原理是很相(xiang)似的(de)。基于(yu)SLAM定位(wei)(wei)有一些(xie)優(you)點(dian),不需要對場景進(jin)(jin)行(xing)(xing)改造,不需要鋪設那么多二(er)維碼(ma)(ma),實施起(qi)來更(geng)加便(bian)捷,行(xing)(xing)走線(xian)路不是網(wang)格化(hua),而(er)是走任意(yi)軌跡。SLAM機(ji)器(qi)人由于(yu)靈活(huo)性,更(geng)符合柔性制(zhi)造的(de)產(chan)業(ye)客戶需求,在(zai)制(zhi)造業(ye)得到(dao)了廣泛的(de)應用(yong)。
基(ji)于(yu)(yu)SLAM定位(wei)有一個(ge)(ge)非(fei)常大的(de)(de)挑(tiao)戰(zhan),就是高動態(tai)環境下定位(wei)丟失的(de)(de)問題。例(li)如產(chan)線上的(de)(de)料箱(xiang)會隨(sui)著(zhu)作業時間的(de)(de)變(bian)化而發生改變(bian),當機(ji)器人(ren)去取料箱(xiang)的(de)(de)時候(hou),還有10個(ge)(ge)箱(xiang)子,當它放回來的(de)(de)時候(hou)只(zhi)剩下2個(ge)(ge),場景的(de)(de)變(bian)化就會造成機(ji)器人(ren)定位(wei)失敗,相當于(yu)(yu)拿著(zhu)舊地(di)圖去看路(lu)尋路(lu),大概率會失敗。
我們采取地(di)圖(tu)更新和(he)語(yu)義地(di)圖(tu)的(de)(de)(de)方案,基于剛才提到(dao)(dao)的(de)(de)(de)云邊(bian)(bian)端(duan)的(de)(de)(de)架構,賦予每(mei)(mei)個端(duan)側機器(qi)人(ren)(ren)檢測變化的(de)(de)(de)能力(li),當發(fa)現與地(di)圖(tu)無(wu)法良好匹配的(de)(de)(de)時候,把數據(ju)上傳到(dao)(dao)邊(bian)(bian)緣服(fu)務器(qi)。邊(bian)(bian)緣端(duan)能夠綜(zong)合(he)多臺機器(qi)人(ren)(ren)搜集到(dao)(dao)的(de)(de)(de)數據(ju),根據(ju)之前的(de)(de)(de)靜態參考地(di)圖(tu)進行判(pan)斷,進行地(di)圖(tu)的(de)(de)(de)融合(he)更新,將融合(he)好的(de)(de)(de)地(di)圖(tu)下發(fa)到(dao)(dao)每(mei)(mei)個機器(qi)人(ren)(ren)那里,這樣機器(qi)人(ren)(ren)可以(yi)利用最新的(de)(de)(de)地(di)圖(tu)進行定位(wei)。
語(yu)義地(di)(di)(di)圖,在網絡中檢測(ce)一(yi)些物體,識(shi)別(bie)動(dong)靜態特性,比如人(ren)、料車是可(ke)(ke)(ke)移動(dong)的(de)(de),不能(neng)作為地(di)(di)(di)標從(cong)地(di)(di)(di)圖里面(mian)去除掉,對于(yu)某些重型設(she)備是可(ke)(ke)(ke)移動(dong)的(de)(de),移動(dong)頻率非常低,在地(di)(di)(di)圖里面(mian)降低它的(de)(de)置(zhi)(zhi)信度(du),地(di)(di)(di)面(mian)的(de)(de)標線、墻面(mian)、柱子(zi)等等是高(gao)靜態物體,增加(jia)它在地(di)(di)(di)圖里的(de)(de)置(zhi)(zhi)信度(du)。相比傳統的(de)(de)基于(yu)特征(zheng)點的(de)(de)定位,基于(yu)語(yu)義目標的(de)(de)定位,精度(du)可(ke)(ke)(ke)能(neng)略微低一(yi)點,但魯(lu)棒性非常高(gao),甚(shen)至可(ke)(ke)(ke)以(yi)基于(yu)整個場景中的(de)(de)一(yi)個物體就(jiu)能(neng)夠對整個機器人(ren)的(de)(de)位置(zhi)(zhi)進行部分或(huo)者全部約束,從(cong)而保證機器人(ren)的(de)(de)順暢運(yun)行。
低算(suan)力的(de)(de)挑戰(zhan),受限于價(jia)格(ge)、體(ti)積、功(gong)耗等一系列方(fang)面(mian)的(de)(de)因素,我(wo)們(men)在(zai)端側設(she)備上不可(ke)能使用高性(xing)能的(de)(de)計算(suan)芯片,我(wo)們(men)做的(de)(de)是在(zai)算(suan)法和軟(ruan)件層(ceng)(ceng)面(mian)進行優化(hua)(hua)。對(dui)于網(wang)絡(luo)模型(xing),在(zai)數值計算(suan)層(ceng)(ceng)面(mian),在(zai)網(wang)絡(luo)本身的(de)(de)結構上,在(zai)整(zheng)個(ge)檢測流程方(fang)面(mian)進行優化(hua)(hua)。另(ling)一方(fang)面(mian)利用各大硬件廠商所(suo)提供的(de)(de)配套優化(hua)(hua)和推理(li)引擎(qing)來對(dui)我(wo)們(men)的(de)(de)算(suan)法進行優化(hua)(hua)部署。以OpenVINO為(wei)例,在(zai)服務器端進行量化(hua)(hua)調優剪枝(zhi),經過(guo)優化(hua)(hua)的(de)(de)模型(xing)通過(guo)IE引擎(qing)部署到低算(suan)力的(de)(de)計算(suan)平臺(tai)上。英特爾的(de)(de)OpenVINO能夠充分(fen)挖掘(jue)整(zheng)個(ge)處理(li)器中(zhong)不僅僅是CPU,還包含其它的(de)(de)計算(suan)單元(yuan),特別是集成顯卡的(de)(de)算(suan)力,更加(jia)充分(fen)利用了片上資源。
今(jin)天就(jiu)聊到(dao)這里,我(wo)們非常期待與各位同行(xing)和合作伙(huo)伴一(yi)起來探(tan)討視覺(jue)AI技術在物(wu)流行(xing)業的(de)應用,共(gong)同打造智能(neng)機(ji)器人,讓(rang)物(wu)流變(bian)得(de)更(geng)簡(jian)單(dan)。謝謝大家(jia)!
以上是陳超演講內容的完整整理。