智東西(公眾號:zhidxcom)
編譯 | 陳佳慧
編輯 | 徐珊

智東西9月21日消息(xi),據The Verge報道,豐田研究院(TRI)成(cheng)功研發出(chu)一種突破性的生成(cheng)式AI技術即機(ji)器人行(xing)為(wei)模型,在“機(ji)器人幼兒(er)園”中教導機(ji)器人各種靈(ling)巧的技能(neng)。該機(ji)器人行(xing)為(wei)模型基于AI的擴散策略,可以在數十次新技能(neng)的演示后學習新技能(neng)。

運用該機器(qi)(qi)人行為(wei)模(mo)型,能讓機器(qi)(qi)人產(chan)出(chu)一致(zhi)性強、可(ke)重復和(he)(he)高性能的結果(guo)。而且機器(qi)(qi)人學(xue)習和(he)(he)產(chan)出(chu)的速(su)度(du)極(ji)快,不(bu)再需要人工來進行編碼和(he)(he)修復編碼錯誤,提高了機器(qi)(qi)人的實(shi)用性,也(ye)在構建(jian)機器(qi)(qi)人大型行為(wei)模(mo)型(LBM)方向上邁進了一步。

一、機器人也上學,通過機器人行為模型掌握超60項挑戰性技能

據TOYOTA官網公告,以前,教(jiao)機器人(ren)新(xin)行(xing)為(wei)的(de)技術進展緩慢、效率較低,而且(qie)一般(ban)在執(zhi)行(xing)任(ren)務時有很多限制性條(tiao)件,所執(zhi)行(xing)的(de)任(ren)務也是非常具體和細節的(de)。機器人(ren)專家需要(yao)花費大量時間編寫復(fu)雜的(de)代碼(ma),可能還要(yao)不斷修改代碼(ma)錯誤(wu),以此為(wei)機器人(ren)添加新(xin)行(xing)為(wei)。

現(xian)在,有(you)了機器(qi)人(ren)(ren)行為模(mo)型。研究(jiu)員認(ren)為,觸覺(jue)是這個機器(qi)人(ren)(ren)行為模(mo)型的(de)關鍵(jian)要素。他們(men)給機器(qi)人(ren)(ren)提供(gong)了一種大(da)拇指般大(da)小的(de)觸覺(jue)傳感(gan)器(qi),能夠讓(rang)機器(qi)人(ren)(ren)通過觸覺(jue)來(lai)感(gan)知和學習,從而像人(ren)(ren)類一樣更輕松地執(zhi)行各種復雜(za)任務。據The Verge報道,研究(jiu)人(ren)(ren)員就曾在“機器(qi)人(ren)(ren)幼兒園(yuan)”教機器(qi)人(ren)(ren)如何做早(zao)餐。

“機(ji)器(qi)人幼(you)兒園”的運作方式是,首先(xian)由一位(wei)“老師”展示一套技能,然后機(ji)器(qi)人的模型在后臺(tai)學習(xi)幾(ji)個(ge)小(xiao)時,最后機(ji)器(qi)人成功形(xing)成新(xin)的工作行為。豐田研究院的靈巧操縱實(shi)驗室經理Ben Burchfiel說,他們經常是在下午教機(ji)器(qi)人,讓(rang)它學習(xi)一晚上,第二天早上就可(ke)以來看到(dao)它的新(xin)行為了。

到目前(qian)為(wei)止(zhi),研究人員已經使(shi)用(yong)機器人行為(wei)模(mo)型,成功培(pei)訓機器人獲得了(le)超(chao)過60項具有挑戰性的技(ji)能,例如倒(dao)液體(ti)、使(shi)用(yong)工具以及操控可變(bian)形物體(ti)等。并且他們希望在(zai)2024年底前(qian)將這(zhe)個(ge)數字增加到1000項。

豐田研究院亮出機器人AI大招,無須人工編碼,利用觸覺高效學習新技能

▲機器人攪拌液體(圖(tu)源:TOYOTA官網)

二、自主觀察學習新技能,機器人大型行為模型正在創建

豐(feng)田(tian)研(yan)究院(yuan)的(de)研(yan)究人(ren)(ren)員在研(yan)發出現在的(de)機(ji)器人(ren)(ren)行(xing)為(wei)模(mo)型(xing)后(hou),還試(shi)圖為(wei)機(ji)器人(ren)(ren)創建大(da)型(xing)行(xing)為(wei)模(mo)型(xing)。豐(feng)田(tian)研(yan)究院(yuan)機(ji)器人(ren)(ren)研(yan)究副總裁Russ Tedrake說(shuo),大(da)型(xing)行(xing)為(wei)模(mo)型(xing)與(yu)大(da)語(yu)言模(mo)型(xing)類似,是通過(guo)觀(guan)察(cha)來學(xue)習,然(ran)后(hou)能夠執行(xing)從沒有教過(guo)的(de)新技能。

谷歌(ge)在其(qi)AI學習模型機器(qi)(qi)人變壓器(qi)(qi)RT-2的研發中,其(qi)實(shi)也(ye)在研究(jiu)類(lei)似的技術。與豐田(tian)研究(jiu)人員的方法類(lei)似,他們的機器(qi)(qi)人利用自己獲得(de)的經(jing)驗(yan)來(lai)推斷如何執行任(ren)務(wu)。從(cong)理(li)論上講,經(jing)過AI訓練的機器(qi)(qi)人最終可以實(shi)現,只給出一個(ge)大致方向,而(er)不需要任(ren)何具體的行動指令就可以完(wan)成任(ren)務(wu),例如“清(qing)理(li)那(nei)個(ge)溢出的東西”。

不過(guo),根據(ju)紐約時報(bao)(bao)報(bao)(bao)道,谷歌的(de)機(ji)器(qi)人研(yan)發(fa)還有很(hen)長的(de)路要走。同時,泰(tai)晤士報(bao)(bao)也稱,研(yan)究工作通常是“緩慢而費力的(de)”,提(ti)供足夠的(de)訓練(lian)數據(ju)比向AI模型提(ti)供從互聯網下載(zai)的(de)數據(ju)要難(nan)得多。

結語:機器人獲得觸覺提升技能學習速度,未來或能實現機器人自主拓展新技能

豐田(tian)研究院的(de)機器(qi)(qi)人(ren)(ren)行為模(mo)型讓機器(qi)(qi)人(ren)(ren)獲得了(le)觸覺,相比于從前訓(xun)練(lian)機器(qi)(qi)人(ren)(ren)的(de)人(ren)(ren)工編碼(ma)和錯(cuo)誤查找,新(xin)模(mo)型不僅減少了(le)人(ren)(ren)力付(fu)出(chu),也提高了(le)機器(qi)(qi)人(ren)(ren)學(xue)習(xi)新(xin)技能的(de)速度,讓機器(qi)(qi)人(ren)(ren)能夠幫助人(ren)(ren)們更(geng)快(kuai)、更(geng)好地完成更(geng)多任務(wu)。

而(er)豐田研(yan)究(jiu)(jiu)院(yuan)研(yan)究(jiu)(jiu)人(ren)(ren)(ren)員稱(cheng),他們正在構(gou)建機器(qi)(qi)人(ren)(ren)(ren)大型(xing)行(xing)為模(mo)型(xing),谷歌(ge)也(ye)在不斷嘗試開發類似技術。有(you)了現在的(de)機器(qi)(qi)人(ren)(ren)(ren)行(xing)為模(mo)型(xing)的(de)出現,在研(yan)究(jiu)(jiu)院(yuan)與科技公司的(de)探索下,未來機器(qi)(qi)人(ren)(ren)(ren)大型(xing)行(xing)為模(mo)型(xing)或許也(ye)有(you)可能成為現實,機器(qi)(qi)人(ren)(ren)(ren)通過觀察自(zi)主(zhu)拓(tuo)展新技能也(ye)有(you)可能實現。

來源:The Verge