機器人前瞻(公眾號:robot_pro)
作者?|??許麗思
編輯?|??漠影

“在生物進化中,越晚出現的器官越容易模擬,越早出現的反而越難。”他山科技聯合創始人兼CEO馬揚在(zai)不久前(qian)接(jie)受機器(qi)人前(qian)瞻的采訪時(shi)提到。

觸(chu)覺,正是這一規律(lv)的典型例證 —— 作(zuo)為生物演化最早形(xing)成的感(gan)官能力之一,其復雜機制(zhi)至今仍是機器人領域的 “卡脖子(zi)” 難(nan)題(ti)。

早在(zai)20億年(nian)前(qian),原(yuan)始單(dan)細胞(bao)生物就能夠通過細胞(bao)膜表(biao)面(mian)的受體感(gan)知周圍(wei)化學物質(zhi)濃度梯度,并做出(chu)趨利避害的運動反(fan)應。

這種原(yuan)始(shi)的觸(chu)覺機制經(jing)過漫長演(yan)化,在人類(lei)指尖(jian)形成了(le)包含皮(pi)膚、肌肉(rou)、神經(jing)末梢的精密系統,讓人類(lei)既能(neng)通過三維力的變化感知到物(wu)體(ti)形狀、紋(wen)理(li),也可(ke)以完成一系列精細化操作(zuo)。

當人工智能技術的飛速迭代推動著機器人的腦端等多方面能力快速提升,相比之下,觸覺感知能力卻依然面臨重重難關:要(yao)突(tu)破(po)從(cong)底(di)層芯片到傳感器(qi)結構(gou)等全鏈條技術(shu)瓶頸,解決多維度信號融合(he)、抗(kang)干擾(rao)設計與(yu)實時閉環控制等復雜(za)挑戰。

清華、北航校友造觸覺,橫掃中國機器人市場半壁江山▲他山科技聯合創始人兼CEO馬揚(yang)

馬揚的創業之旅,正(zheng)是始于對這一(yi)現狀的洞見。

2004年,他從北京航空航天大學畢業后,曾進入了比亞迪工作。按部就班的職業軌跡,在馬揚接觸到一項名為ECT(電容(rong)層析成像)的技術時悄然轉向。

當(dang)時,他加(jia)入了他山科(ke)技董事(shi)長(chang)孫滕諶創辦的(de)一家科(ke)技公(gong)司,這項(xiang)ECT技術(shu)是由曼徹(che)斯特大學(xue)楊五強教授研發(fa)的(de),可(ke)用于石油管道檢測,展(zhan)現(xian)出(chu)通過電容信號解析材質(zhi)的(de)潛力,為后續觸覺研發(fa)埋下伏(fu)筆。

時間來到2017年,國內機器人產業風起云涌。馬揚認為,機器人真正走向工廠、商場家庭等成為人類的得力助手指尖觸覺閉環能力是不可或缺的一塊拼圖而當時,市面上沒有一家企業(ye)能做出可(ke)以放進(jin)去(qu)指尖的觸覺感知(zhi)芯(xin)片(pian)。

于是,馬(ma)揚與孫滕諶、楊五強一拍即合,共同創辦了(le)北京他(ta)山科(ke)技有限公司(si),專注于人工智能觸覺(jue)傳感領域。

創業之初,團(tuan)隊不(bu)(bu)得不(bu)(bu)面對市場對觸覺(jue)感知的認知有限、需求基本不(bu)(bu)多(duo)的窘境。機器人(ren)產業的產品(pin)落(luo)地至少需要3到5年,他們決定先將(jiang)底(di)層(ceng)觸覺(jue)技術嫁接到家電、汽車等成(cheng)熟(shu)行業,尋(xun)找(zhao)生存(cun)與驗證(zheng)的土壤。

轉機(ji)(ji)就在(zai)(zai)跨界合(he)作(zuo)中出現:他(ta)山科技和(he)奔(ben)馳、寶馬等全球知名(ming)車(che)企合(he)作(zuo),為(wei)其(qi)打造汽車(che)上的(de)智能感知系統,業(ye)務在(zai)(zai)海外(wai)市場逐漸(jian)有了起色。直(zhi)到疫情突襲(xi),海外(wai)B端業(ye)務遭重創(chuang),他(ta)山科技調頭在(zai)(zai)國內的(de)汽車(che)智能交互、酒店配送機(ji)(ji)器(qi)人等場景中尋找(zhao)突破口。

2019年,他山科(ke)技的第一(yi)款觸覺(jue)感知芯片作(zuo)為(wei)北京市重(zhong)點(dian)合(he)作(zuo)項目立(li)項研(yan)發。經過多年技術攻關,終于在2022年成(cheng)功一(yi)次流片、一(yi)次點(dian)亮。

這是全球首款人工智能觸覺傳感芯片,搭載(zai)了團隊基于R-SpiNNaker分(fen)布式(shi)類(lei)腦架構下的AI觸覺(jue)傳感技術,可(ke)同步(bu)處理指尖多維(wei)觸覺(jue)信號,其核心性(xing)能超越國外頭部(bu)廠商同類(lei)產品,能夠滿足機(ji)器人在精細操作過(guo)程中(zhong)高(gao)精度、低(di)延遲的觸覺(jue)需(xu)求。

他山科技提出了“感控一體”的概念,將觸(chu)覺(jue)感知和(he)執行控(kong)制進行了深度融合,用觸(chu)覺(jue)來牽引(yin)動作控(kong)制,這是(shi)與(yu)傳統觸(chu)覺(jue)傳感器截然不(bu)同(tong)的技術(shu)路徑(jing)。

不久(jiu)前(qian),他山科技(ji)還在 IEEE 國(guo)際(ji)機(ji)器人與自(zi)動化大會(ICRA 2025)上展示了(le)自(zi)研的人工智能觸(chu)覺(jue)(jue)傳(chuan)感器,通過模擬人類指尖的觸(chu)覺(jue)(jue)功能,讓(rang)機(ji)器人精(jing)準完成“抓取-移動-遞交”任務(wu)。

清華、北航校友造觸覺,橫掃中國機器人市場半壁江山▲ICRA展會現(xian)場,他山科(ke)技觸覺感知方案精準(zhun)完成抓取-移送-遞交(jiao)

隨著具身智能的爆發式發展,團隊多年以來對觸覺技術的探索終于等來了開花結果的時刻。目前,國內70%以上的機器(qi)人(ren)整機及靈巧(qiao)手廠商、共超60余家機器(qi)人(ren)產(chan)業鏈(lian)公司都采用了(le)他(ta)山的觸覺解(jie)決方案。

他山(shan)科技(ji)正(zheng)逐漸(jian)從單一(yi)的觸覺(jue)硬件(jian)產品供應商(shang)轉向整體觸覺(jue)解決方案提供商(shang)——不僅涵(han)蓋物(wu)理端的方案,還(huan)將(jiang)在仿真端開(kai)發(fa)配(pei)套(tao)模型,幫(bang)助(zhu)客戶完成線(xian)(xian)下與(yu)線(xian)(xian)上的訓練(lian)。

成(cheng)(cheng)立至今,他山(shan)科技(ji)已完成(cheng)(cheng)四輪融資,投資方包括軟銀、國新、新鼎等。

一、從電容技術切入,造出全球首款AI觸覺感知芯片

機器人前瞻:他山科技成立之前已經有十幾年的技術積累,具體在哪些方面?

馬揚:他山科技的傳感技術起源于曼徹斯特大學的楊五強教授,他在2000年左右研發了一項ECT 技術(shu),就是用(yong)電容進行層析成像,簡單來說(shuo)可(ke)以用(yong)電容技(ji)(ji)術來實現類似 CT 技(ji)(ji)術能做到的(de)(de)效果。這項技(ji)(ji)術最早應(ying)用(yong)于石油(you)行業,在石油(you)管道(dao)外(wai)壁安裝(zhuang)電容傳感器,可(ke)以實時探(tan)測石油(you)管道(dao)橫截面的(de)(de)油(you)水氣分布。這在當時是非常劃(hua)時代(dai)的(de)(de)技(ji)(ji)術,在海內外(wai)都(dou)得到了廣泛(fan)應(ying)用(yong)。

2007-2008 年(nian),我們(men)關注到有企業機構開始(shi)研究機器(qi)人抓取物體、識別材(cai)質,就與(yu)楊(yang)五強教授合作開發(fa)相關項目。最初,我們(men)用電(dian)容傳感器(qi)來區(qu)分不同(tong)材(cai)質,比如塑料杯(bei)、玻璃(li)杯(bei)、裝水的(de)塑料杯(bei)等,這些材(cai)質是(shi)視覺難以區(qu)分的(de),但觸覺可以。

2014-2015 年,隨著機器人任務執(zhi)行需求提升(sheng),我(wo)們(men)(men)開始將傳感器布置在夾(jia)爪上(shang),進(jin)行大量(liang)抓握實踐。早(zao)期,夾(jia)爪在工業產線上(shang)的(de)應(ying)用(yong)往往只能(neng)抓取剛(gang)性物體(ti),而不具備柔性物體(ti)操作能(neng)力。因此我(wo)們(men)(men)持(chi)續研究(jiu)柔性抓取,并開始構思硬(ying)件產品,最終在 2017 年成立(li)了他(ta)山科技。

機器人前瞻:從2017 年到現在,他山科技經歷了怎樣的不同發展階段?

馬揚:主要從研發端和商務端進行劃分。2022 年是研發端的分水嶺,我們完成了全球首款人工智能觸覺感知芯片。這個“全球首款”并非由我(wo)們(men)自己定義,而是由北京市科委進行充分(fen)調研(yan)、匯總材料比較后確認的成果。基(ji)于這款芯(xin)片,后續我(wo)們(men)將開發更多應用層技術,拓展不(bu)同場(chang)景(jing)的落地(di)可能。

最近兩(liang)年,研發與(yu)商業(ye)化(hua)的(de)聯系越(yue)來(lai)越(yue)緊密了。2024 年初,機器人與(yu)具身智能(neng)的(de)火爆,讓(rang)我們多(duo)年的(de)研發積累迎來(lai)了開花結(jie)果的(de)時刻,也(ye)是(shi)技術逐漸產業(ye)化(hua)落地(di)的(de)關鍵(jian)時期。

機器人前瞻:相較于市面上眾多從事觸覺傳感的企業,他山的技術路線主要是怎樣的

馬揚:我們在觸(chu)覺領域已深耕(geng) 8 年(nian),可以說(shuo)是細分賽(sai)道上最(zui)資深的(de)觸(chu)覺企業之(zhi)一。我們的(de)方向(xiang)是從(cong)底(di)層算法到硬件,再到模型(xing),最(zui)后到傳感器結構,由下而上實現。

許多傳感器廠商是基于力傳感性能好的材料來開發產品,而我們的核心差異在于專注芯片與(yu)底層,幫助不同材料廠商解(jie)決傳感端(duan)需求,也向行業內(nei)電子皮膚廠商提(ti)供底層芯片和算(suan)法。

人(ren)(ren)形機(ji)器人(ren)(ren)發(fa)展剛起步,是未來5-10年最篤定的方向。我堅信,機(ji)器人(ren)(ren)尤其是服(fu)務型機(ji)器人(ren)(ren)將走進家庭(ting),如同(tong)車(che)輛、手機(ji)般普(pu)及。

機器人前瞻:目前他山科技整體團隊規模如何?

馬揚:目前非產(chan)線的員工大約 130 人(ren)左右,其中70%以上是研發人(ren)員。

清華、北航校友造觸覺,橫掃中國機器人市場半壁江山▲他山科技(ji)在ICRA展會展示TS-V視觸融合技(ji)術平臺

二、從汽車領域開始落地,客戶已覆蓋國內八成機器人廠商

機器人前瞻:觸覺傳感器之前已經被列入國內35項目“卡脖子”技術里,具體是難在哪些地方呢?

馬揚:不止國內,觸覺感知技術對(dui)整個機器人行(xing)業來說(shuo),都是比較“卡(ka)脖子”的技術,我們已突破多個技術瓶(ping)頸。

前兩天我在參會的時候,聽一位院士提到,研發機器人時發現:生物進化中越晚出現的器官越易模擬,越早進化的器官越難。

例如(ru)大(da)腦,我們通過腦端芯片已實現與人(ren)腦相似的(de)計算能(neng)力(li),甚至在歸納能(neng)力(li)上可能(neng)超越人(ren)類,并初步(bu)具備演繹能(neng)力(li)。但相反,觸覺作(zuo)為(wei)生(sheng)物進化早期就形成的(de)感(gan)官能(neng)力(li),模擬難度(du)極(ji)大(da)。

觸覺(jue)(jue)是(shi)生物體在演(yan)化初(chu)期就具備的(de)基礎能力,人類觸覺(jue)(jue)系統的(de)復雜(za)性遠超想(xiang)象,觸覺(jue)(jue)前(qian)端具有精(jing)(jing)密(mi)的(de)神經元(yuan)網絡和突(tu)觸自適應機制(zhi),全身皮膚的(de)結構與功(gong)能也(ye)都各(ge)不相同(tong),比(bi)如(ru)指尖的(de)皮膚主要用(yong)于抓取,要實現三維力的(de)精(jing)(jing)準(zhun)識別和精(jing)(jing)準(zhun)控制(zhi)。

業內經常以 “電子皮膚” 來描述機器人的觸覺感知系統,這一概念適用于機器人軀體的觸覺覆蓋,但指尖的功能實現遠不止于皮膚層面。就像人類指尖因頻繁使用而產生的老繭,其實說明了抓握動作的核心并非依賴皮膚,而是指尖下方的肌肉結構,以及底層神經、神經元和突觸共同完成。

所以,我們提(ti)供(gong)的指尖(jian)產品是(shi)一個(ge)完(wan)(wan)整的指尖(jian)單元。它(ta)不僅需(xu)要完(wan)(wan)成感知,而且是(shi)所有感知器官中(zhong)唯一一個(ge)需(xu)要與客觀世(shi)界產生實質交互并控制物(wu)體的。大腦(nao)僅發送(song)指令,實際控制更依賴整個(ge)指尖(jian)前端的結構。

雖然我們(men)的(de)(de)產品距(ju)離(li)人(ren)類(lei)指尖(jian)還有一定的(de)(de)距(ju)離(li),但(dan)是(shi)已經突破了觸覺傳感器的(de)(de)核(he)心(xin)瓶(ping)頸。接下來,我們(men)會建(jian)立更多泛(fan)化數據庫,逐(zhu)步通過模(mo)型(xing)將產品及底(di)層算法進行迭(die)代,最(zui)終希望它能(neng)具備媲美人(ren)類(lei)指尖(jian)的(de)(de)能(neng)力。

機器人前瞻:他山科技花費45年才制作出全球首款人工智能觸覺感知芯片,在研發過程中最具挑戰性的是什么?

馬揚(yang):我們需要完成芯片從0到1的研發,這與(yu)常規國產替代路徑不同,沒有參考范本。

我們(men)先打造了24位的(de)高精(jing)度(du)模(mo)數(shu)轉換模(mo)塊,在(zai)(zai)芯(xin)(xin)片上集成了32個通道,這在(zai)(zai)傳統工業芯(xin)(xin)片中(zhong)從未有過先例,芯(xin)(xin)片性能已經超越(yue)同類(lei)產(chan)品。其(qi)次,我們(men)需要(yao)將模(mo)數(shu)轉換部分(fen)與底層的(de)系統架構相結合,同時還(huan)設(she)計開發(fa)(fa)了類(lei)腦控制(zhi)單元,模(mo)數(shu)的(de)Dual Router,負責數(shu)據(ju)的(de)自主分(fen)發(fa)(fa),從而支持神經網絡模(mo)型在(zai)(zai)多芯(xin)(xin)片上的(de)分(fen)布式部署和協同計算。

視覺數據通過(guo)雙目(mu)采(cai)集(ji)后可直接傳(chuan)輸至腦端(duan)芯(xin)片,而觸(chu)覺端(duan)有上(shang)百個傳(chuan)感單元(yuan),需要更多(duo)芯(xin)片支持,以及這些芯(xin)片作為一(yi)個系統的協(xie)同工作。如完成(cheng)抓握動(dong)作時(shi),就需要協(xie)同整手(shou)觸(chu)覺單元(yuan)。

芯片(pian)要在(zai)分布式模式下協(xie)同工(gong)作(zuo),誰(shui)來(lai)協(xie)調指(zhi)揮?Router就像是項目中的(de)(de)平行成員,這樣每個節點均可輸出指(zhi)令,自(zi)主分發數(shu)據至其(qi)他芯片(pian),實(shi)現(xian)網絡(luo)中數(shu)據的(de)(de)有效交互,組建整體感知和(he)計算(suan)網絡(luo)。

這幾大(da)部分(fen)的(de)整(zheng)合(he),都極具挑戰性。芯片項(xiang)目(mu)作為2019年北京市9個(ge)重點合(he)作項(xiang)目(mu)中唯一由民營企業(ye)承擔(dan)的(de)課題,我(wo)們在(zai)2022年實現了(le)芯片一次流片、一次點亮。

機器人前瞻:公司產品最初落地在什么領域?

馬(ma)揚:他山科(ke)技(ji)(ji)的(de)觸覺感(gan)知(zhi)技(ji)(ji)術產品率先在汽車領域落地,第一(yi)個(ge)項目(mu)是奔馳(chi)。當時(shi),我們在奔馳(chi)汽車的(de)儀表臺面上通過一(yi)顆(ke)芯(xin)片和一(yi)個(ge)傳感(gan)器,實現(xian)了人手(shou)識別(bie)功能:從10厘米之外的(de)揮手(shou)交互,到2厘米距離的(de)懸停識別(bie),再到接觸后的(de)滑動和按壓(ya)動作。

此外,系統還可以精準識別(bie)(bie)出(chu)人(ren)手和手機(ji)(ji),比(bi)如把手放在儀(yi)表(biao)臺面上(shang)能識別(bie)(bie)出(chu)來是人(ren)手,放上(shang)手機(ji)(ji)也能識別(bie)(bie)出(chu)這是手機(ji)(ji),進而將手機(ji)(ji)與(yu)車機(ji)(ji)打通實(shi)現互聯。

當(dang)時這個項(xiang)目做得很(hen)成功,2018年(nian)我們還在德國獲獎了(le)(le)。2019年(nian),我們接了(le)(le)寶馬一個項(xiang)目。緊(jin)接著,我們的(de)業(ye)務拓展到車內車外的(de)傳感(gan)器領(ling)域,逐漸從PVC項(xiang)目邁向量產(chan)階(jie)段。

機器人前瞻:最開始像奔馳這樣的客戶是在怎樣的機緣下接洽上的

馬揚:2018 年,奔馳在(zai)國(guo)內(nei)啟動了一(yi)個面向創新(xin)型企業的新(xin)項目,需要優化(hua)車內(nei)交互方案——原有(you)的視(shi)覺解決方案雖能通過揮(hui)手動作(zuo)(zuo)識(shi)別(bie)實現交互操作(zuo)(zuo),但存(cun)在(zai)兩大問題:一(yi)是車輛行駛(shi)時的震動環境易導致視(shi)覺動作(zuo)(zuo)識(shi)別(bie)誤操作(zuo)(zuo);二是車內(nei)作(zuo)(zuo)為隱私空間,用戶很(hen)可能并(bing)不希望部署高(gao)清視(shi)覺傳感器。

因此,奔馳尋求一種既能實(shi)現非接觸(chu)操作(zuo)、又能覆蓋接觸(chu)操作(zuo)的觸(chu)覺(jue)交互方案。而(er)我們(men)團隊在2015-2016年(nian)已經將相關技術(shu)應(ying)用于(yu)一些(xie)在歐洲(zhou)的項目,后來奔馳就找到我們(men),希望能夠(gou)進(jin)行合作(zuo)。

機器人前瞻他山科技在人形機器人方面已經和國內哪些企業達成合作?

馬揚:我們服務的客戶,目前已經覆蓋國內70%以上的機(ji)器人廠商。而在國(guo)內(nei)(nei)70多家機(ji)器人產業鏈核心公司中,已(yi)經有(you) 60 多家客戶(hu)采用了我們的產品(pin);國(guo)內(nei)(nei)最(zui)頭部的靈(ling)巧手廠商,都(dou)已(yi)經和我們建立了深度合(he)作關系(xi)。

清華、北航校友造觸覺,橫掃中國機器人市場半壁江山

三、人形機器人落地,現階段降本尚在探索中

機器人前瞻:人形機器人想要真正走入千家萬戶和場景,降本是非常關鍵的一環。覺得人形機器人現在到了討論降本的時候嗎?

馬揚:從發展(zhan)階段來看,全面降本的(de)時機(ji)(ji)尚未完全成熟,但從智能(neng)體(ti)技術迭代的(de)角度(du),對降本的(de)探索其實(shi)一直在(zai)進行。當(dang)我們在(zai)討論智能(neng)體(ti)或者機(ji)(ji)器人(ren)時,核(he)心(xin)依舊(jiu)是他們解決人(ren)在(zai)執行端的(de)一些(xie)痛點。去(qu)年,我們參與制(zhi)定了上(shang)海的(de)人(ren)形機(ji)(ji)器人(ren)與具身智能(neng)分級(ji)指南,將具身智能(neng)與自動駕駛進行了類比分析,劃分成L1到(dao)L5級(ji)。

如果要打造出具備充分泛化能力、能像人類一樣完成各類復雜任務的人形機器人,樂觀估計需要 3-5 年才能逐步落地。但聚焦在(zai)有限泛(fan)化(hua)任務,現階段已可行。

以(yi)我們與酒店機器人廠(chang)商(shang)云跡(ji)的(de)合作(zuo)為(wei)例:傳統酒店機器人僅能(neng)完成(cheng)路徑規(gui)劃的(de)移動任(ren)務(wu),而完整(zheng)的(de)服(fu)務(wu)閉環(huan)需要“抓取 – 移動 – 遞交”三(san)個環(huan)節,目前(qian)只有我們的(de)觸覺解決方案能(neng)夠幫助(zhu)機器人廠(chang)商(shang)完成(cheng)這一系列(lie)流程。

我(wo)們的(de)觸覺解決(jue)方案通過自適應力(li)的(de)抓(zhua)取和三維力(li)識別技術(shu),能確保機(ji)器人抓(zhua)取物體后平穩遞(di)交(jiao),比(bi)如自主(zhu)取走(zou)桌上(shang)的(de)外賣,送(song)至房間門口(kou)或直接遞(di)交(jiao)給用戶,有效減少配送(song)環(huan)節的(de)人力(li)消耗。

另一個場景是在酒店的(de)洗衣(yi)房(fang)里。很多時候,洗衣(yi)設備空占率高,需(xu)人(ren)工全程介入衣(yi)物的(de)裝載、轉(zhuan)移(yi)和收取(qu),任何環(huan)節遺漏都會導(dao)致設備閑置。在這個過程中(zhong),如果(guo)機器人(ren)能夠完成(cheng)衣(yi)物的(de)拿取(qu)然后送到客人(ren)房(fang)間,就能夠非常高效(xiao)地幫助酒店節省成(cheng)本。

在這些場景里,機器人只需要實現有限泛化即可,需要抓取的物品無非就是酒店的香皂、牙刷、梳子之類的日用品,不同形態的外賣、衣物等。訓練過程無需充分泛化,可能在 3-6 個月之內完成 95% 的任務學習,剩余的 5% 通過有限的算法模型就足夠支持完成任務。

未來 1-3 年,許多場景將出(chu)現(xian)可商(shang)業化(hua)的(de)具身智(zhi)能(neng)應用。如同(tong)自(zi)動駕駛從(cong) L0 到 L3 逐(zhu)步(bu)推(tui)進,機器(qi)人也將進入漸進式商(shang)業化(hua)過(guo)程。

機器人本質是人工智能,核心目標是通過能力驗證替代人類工作。只要機器人能夠在某些方向超越人類的能力,即便初期成本高,也必然能在應用場景中占據一席之地。隨著技術迭代實現規模化應用后,機器(qi)人(ren)就能憑借效率優勢顯著降低綜合成本(ben),展(zhan)現出相較于人(ren)力的長期經濟性(xing)。

機器人前瞻之前人形機器人馬拉松賽事您對這件事情如何看待?馬拉松上機器人的表現如何?

馬揚:天工機(ji)器人、松延(yan)動力(li)等參賽機(ji)器人的最終表現非(fei)常亮眼(yan),賽事整體完賽率達 30% 左右,極具突破性(xing)。

機器人參(can)與馬(ma)拉(la)松的(de)(de)意義類似于汽車挑戰(zhan)達喀(ka)爾拉(la)力賽(sai) —— 這類設備的(de)(de)初(chu)始設計目標是滿足室內(nei)或室外(wai)短距(ju)離(li)作業(ye)需求。但是在賽(sai)事中,機器人展現出來的(de)(de)持續(xu)運行能力讓人非常吃驚:例如(ru)采(cai)用自主跟蹤(zong)模式的(de)(de)天(tian)工機器人,長時間沒有出現機械(xie)故障,充分驗證了復雜場景下的(de)(de)穩定性(xing)。

一(yi)些國外(wai)(wai)同行反饋,中(zhong)國人形(xing)機(ji)器(qi)人在馬(ma)拉松(song)上的表(biao)現非常(chang)讓人吃驚(jing),因(yin)為海外(wai)(wai)極少有機(ji)器(qi)人能夠在公開場(chang)合中(zhong)完成這樣的長(chang)時間操(cao)作。

部分(fen)人(ren)(ren)形機(ji)器人(ren)(ren)在(zai)起(qi)點表(biao)現差異,可能與(yu)賽事開放度高有關,有很多學生(sheng)團隊、普通開發者參(can)與(yu)其中。如果給國內絕主流(liu)本(ben)體廠(chang)商1-2 個月的(de)優化周期,完賽率是(shi)可以顯著提(ti)升的(de)。這次賽事是(shi)一個非常好的(de)契機(ji),無論企業是(shi)否(fou)獲(huo)獎,這樣的(de)挑戰都會(hui)推動技術進步。

機器人前瞻馬拉松比賽非常考驗人形機器人的運動控制能力,那您認為在運動控制、智能和操作這三大方面中,哪個環節能夠率先推動整個行業實現質變?

馬揚:目前,國內人形機器(qi)人的(de)(de)運(yun)動(dong)控制能力已經達到(dao)領(ling)先的(de)(de)水平,甚至可以完成(cheng)一些人類難以實現的(de)(de)復雜動(dong)作,并且具備一定的(de)(de)工業化應用基礎。但(dan)單純的(de)(de)運(yun)動(dong)控制能力不足以讓機器(qi)人替(ti)代人類—— 除了跑馬拉松之外,人類日常對腿部運(yun)動(dong)的(de)(de)功(gong)能性需(xu)求相對有限。

相較之(zhi)下,操(cao)作端以及腦(nao)端的發展水平(ping)和(he)運動控制能(neng)力(li)還存在一定差距。正如木桶效應,只有各部分都達到一定水平(ping),才能(neng)推動人形機器人在工業(ye)、商(shang)業(ye)、家庭場景中(zhong)的發展。

以自動(dong)駕駛(shi)(shi)分級為(wei)類比:當運動(dong)控制(zhi)達到 L2 水平(ping),類似汽車具備基礎道路(lu)行(xing)駛(shi)(shi)能力,機器人腦端與(yu)操作端的精細執行(xing)仍需從有限泛(fan)化場景起步。

在靈巧手(shou)方(fang)面,許多廠商傾(qing)向于(yu)研(yan)發(fa)五指高(gao)自由度(du)靈巧手(shou),因其更貼近人(ren)類交互習(xi)慣,可模(mo)仿人(ren)類完成復雜任務。隨(sui)著人(ren)形(xing)機(ji)器人(ren)進入充分(fen)泛化階段,高(gao)自由度(du)手(shou)的成本將隨(sui)量(liang)產規模(mo)下降。

而面對一些可快速商業化場景,靈巧手無需追求過高自由度,滿足有限場景需求即可如二(er)指(zhi)夾爪)。畢竟(jing),自(zi)(zi)由(you)度(du)(du)越高,模型計算的(de)算力需求(qiu)越大(da),因(yin)此三(san)指(zhi)、二(er)指(zhi)等低自(zi)(zi)由(you)度(du)(du)夾爪在未來(lai)的(de)一些(xie)商業(ye)化應用場(chang)景中(zhong)反而具備落(luo)地優(you)勢(shi)。

機器人前瞻:如何看待目前整個人形機器人行業的泡沫?

馬揚:從以前的(de)第一波人形(xing)機器人浪潮至今(jin),經歷了極為關(guan)鍵的(de)大模型迭代階段(duan)。當(dang)前,在通用(yong)模型的(de)支撐下(xia),人形(xing)機器、具身智能(neng)領域(yu)的(de)開發成(cheng)本及時(shi)間迭代效率已顯著(zhu)提升。

以抓(zhua)取物體(ti)的(de)訓練工(gong)作(zuo)為例,我們在七八(ba)年前完成(cheng)同類任務(wu)可能需要 6 個月(yue),而目前僅(jin)需一(yi)周左右,時間成(cheng)本大幅(fu)降低。當下的(de)核(he)心工(gong)作(zuo),是(shi)聚焦于機(ji)器人專用(yong)端(duan)模(mo)型的(de)優化(hua)與完善。

其次,家(jia)庭的(de)(de)智(zhi)能終(zhong)端(duan)(duan)除了手機、汽(qi)車外,機器(qi)人也是非常重要的(de)(de)方(fang)向(xiang)。換言(yan)之,機器(qi)人終(zhong)將成為(wei)家(jia)庭中的(de)(de)核心智(zhi)能終(zhong)端(duan)(duan)?—— 具備通曉家(jia)居環境并提供優質(zhi)服務能力的(de)(de)通用保姆型機器(qi)人,將成為(wei)家(jia)庭場景的(de)(de)標配。

當前,機(ji)器人或具身智能(neng)是最穩(wen)定的未來導向賽(sai)道,市(shi)場潛力堪稱巨大。當行業(ye)發展至成熟階(jie)段,其市(shi)場體(ti)量將與汽車產業(ye)比肩,將會面(mian)臨每(mei)年萬億的市(shi)場。

如果我們對未來(lai)充滿信(xin)心,那么這只是時(shi)間(jian)長短的問題。

在這個過程中(zhong),行(xing)業(ye)可能出(chu)現(xian)階段性波動(dong),外界(jie)對 “泡沫(mo)” 的(de)認知或許存在差(cha)異(yi),但核心在于技術根基是(shi)(shi)否扎實,只要行(xing)業(ye)浪潮持續向前,終將形成堅(jian)實的(de)發(fa)展態勢。如果大家對未來(lai)方向足夠堅(jian)定,那么眼前的(de) “泡沫(mo)”,不過是(shi)(shi)發(fa)展進(jin)程中(zhong)的(de)細微波動(dong)而已(yi)。

機器人前瞻:他山在技術產品或者商業化方面有什么規劃?

馬揚:我們最初推出自己的產品時,更多地將其定位為觸覺傳感器。今年,在與行業內的同行以及下游客戶討論時,我們希望能進一步升級為整體的解決方案 —— 不僅涵蓋物理端方案,還在仿真端制開發配套模型,以更好地幫助客戶完成線下與(yu)線上(shang)的訓練。

未來幾年,主要分為兩個方(fang)向:一個方(fang)向是(shi)(shi)面向 L4/L5級充分泛化(hua)場(chang)(chang)景(jing),為客(ke)戶提供(gong)數據采集(ji)支持,不僅是(shi)(shi)在現實(shi)訓練場(chang)(chang)景(jing)中,還包括仿真(zhen)虛擬場(chang)(chang)景(jing)。另外(wai),觸覺(jue)數據區別于視覺(jue)數據的核心特征(zheng)在于其連續(xu)性,例如 “抓(zhua)取 – 握持 – 放(fang)下” 的動作必須是(shi)(shi)連續(xu)。所以(yi),他(ta)山科技會推(tui)動觸覺(jue)數據的標準化(hua)與通用化(hua)進程,期(qi)望以(yi)行業共建的模式實(shi)現資源共享(xiang)。

第(di)二,聚焦未來三年商業化落地場景,我們(men)會(hui)與許(xu)多下游(you)客戶(hu)合作,比如酒店服務、物流分揀、養老護理等場景,提供在不(bu)同場景下的專用解決方案,并搭建(jian)開放平(ping)臺供客戶(hu)自主(zhu)訓練與底層模(mo)型迭代。