
智東西(公眾號:zhidxcom)
編譯 |?徐珊
編輯 |?云鵬
智東(dong)西7月16日消息,據外媒Tech Xplore報(bao)道,南加州大學的(de)(de)研(yan)究團隊在(zai)2021年學習代表國際會議發表了(le)名為《基于組(zu)監(jian)督和零樣本的(de)(de)學習(Zero-Shot Synthesis with Group-Supervised Learning)》的(de)(de)論(lun)文,他們(men)正在(zai)研(yan)究如何讓AI模仿人類的(de)(de)想(xiang)象過(guo)程(cheng),以合成或了(le)解從未見過(guo)的(de)(de)事物。
當我們(men)去想象一只貓在長城上奔(ben)跑時,我們(men)大腦中的(de)(de)一系列神經(jing)元將(jiang)會被快(kuai)速激活,然(ran)后在大腦中呈現不同(tong)的(de)(de)圖像。這個(ge)想象的(de)(de)過(guo)程(cheng)對人(ren)類來(lai)說(shuo)很簡單,對于深度(du)神經(jing)網絡(luo)系統來(lai)說(shuo)很難。盡管(guan)它在某些領域(yu)中取得了(le)超過(guo)人(ren)類的(de)(de)表現,但該系統仍難以做到人(ren)類的(de)(de)“想象”。
研究人員(yuan)通過解耦(Disentanglement)技(ji)術(shu)讓(rang)AI產生(sheng)與人類相似的“想象力(li)”,以(yi)合成不同屬性(xing)(xing)的、前所未(wei)見的物體。研究人員(yuan)認為,這(zhe)項技(ji)術(shu)不但可以(yi)協助人們合成新藥,而且(qie)還(huan)能提(ti)高自動駕駛汽車的安全性(xing)(xing),并(bing)且(qie)讓(rang)人工智能消(xiao)除數據算法帶來(lai)的潛(qian)在偏(pian)見。
“我們(men)受(shou)到人(ren)類(lei)(lei)視覺(jue)概括能力(human visual generalization capabilities)的(de)啟發,試圖在AI中(zhong)模擬(ni)人(ren)類(lei)(lei)的(de)想象(xiang)”,該(gai)研(yan)究的(de)第一作者(lead author)葛云皓說,“人(ren)類(lei)(lei)可以按屬性(例如形(xing)狀、姿(zi)勢、位置、顏色)將(jiang)他們(men)已知的(de)信息分類(lei)(lei),然后將(jiang)它(ta)們(men)重新組合(he)去想象(xiang)一個新的(de)事物。我們(men)的(de)研(yan)究主要通過神經網(wang)絡系統模擬(ni)這個過程。”
一、AI難以分清事物的屬性特征
事實上,如果你想(xiang)讓(rang)一(yi)(yi)個AI可(ke)以(yi)自(zi)行生成一(yi)(yi)張汽(qi)車(che)(che)圖(tu)像(xiang),理想(xiang)情況下(xia),您可(ke)以(yi)通過(guo)為這(zhe)個AI提供幾張汽(qi)車(che)(che)的(de)圖(tu)像(xiang),它就可(ke)以(yi)從顏色、類(lei)型等角度生成多種類(lei)型的(de)汽(qi)車(che)(che),如紅色的(de)保時捷(jie),綠色的(de)皮(pi)卡等。
完成(cheng)這(zhe)(zhe)(zhe)類的(de)(de)(de)任務是人(ren)們(men)設(she)計AI的(de)(de)(de)長期目(mu)標(biao)之一——AI創(chuang)建可以推(tui)斷的(de)(de)(de)模(mo)型(models that can extrapolate)。這(zhe)(zhe)(zhe)意(yi)味著(zhu)當人(ren)們(men)給AI幾個樣(yang)本(ben)時,AI就應該(gai)能從(cong)這(zhe)(zhe)(zhe)些樣(yang)本(ben)中提(ti)取基本(ben)的(de)(de)(de)共性,并(bing)將它們(men)應用(yong)于大量的(de)(de)(de)新事物中,即便AI此前從(cong)未(wei)見過這(zhe)(zhe)(zhe)樣(yang)的(de)(de)(de)事物。但是目(mu)前AI最常(chang)接受(shou)的(de)(de)(de)樣(yang)本(ben)特征訓(xun)練是像素(su)等(deng),這(zhe)(zhe)(zhe)些并(bing)不需要考慮對(dui)象的(de)(de)(de)屬性。
比如(ru)說(shuo),長方(fang)形(xing)的木板,具有長方(fang)形(xing)、木質、板等屬(shu)(shu)(shu)(shu)性(xing),但AI并不清楚長方(fang)形(xing)的木板有哪些屬(shu)(shu)(shu)(shu)性(xing),它只能從(cong)給定(ding)(ding)的一些木板圖片(pian)中(zhong)提(ti)取(qu)事物(wu)的共性(xing)如(ru)木板長度(du)相同,而這些共性(xing)不一定(ding)(ding)都(dou)是事物(wu)的屬(shu)(shu)(shu)(shu)性(xing)。因此目前大部分(fen)(fen)AI模型都(dou)難以分(fen)(fen)清事物(wu)的屬(shu)(shu)(shu)(shu)性(xing)特(te)征。
二、通過“解耦”讓AI理解事物屬性
在該項(xiang)目中,研究人員試圖(tu)使(shi)用(yong)“解(jie)耦”的(de)概念來克服AI模(mo)型(xing)難以(yi)分清研究對象不同屬性(xing)的(de)難題(ti)。
簡單來(lai)說,解耦是(shi)指就是(shi)當你直接替換(huan)事(shi)物(wu)(wu)的(de)(de)某個特性時,對原來(lai)事(shi)物(wu)(wu)的(de)(de)理解不造(zao)成影響。
比(bi)如(ru)說(shuo),你有一(yi)臺黑色的電(dian)腦,并且從未見過(guo)黑色的水(shui)杯(bei)(bei),但是(shi)你知道(dao)水(shui)杯(bei)(bei)是(shi)什么樣(yang)的。你會(hui)將從黑色的電(dian)腦上知道(dao)什么是(shi)黑色的,?然后將這個(ge)概念應用于水(shui)杯(bei)(bei)上,你就知道(dao)黑色的水(shui)杯(bei)(bei)是(shi)什么樣(yang)的。在這個(ge)過(guo)程中,你就實現了(le)“解耦”。
▲來源:Tech Xplore
與傳統算法(fa)一次(ci)只(zhi)分(fen)析(xi)一個樣本(ben)不同,AI學習拆解事物的屬(shu)(shu)性需要通過解耦技(ji)術分(fen)析(xi)一組樣本(ben)圖像(xiang),并挖掘它(ta)們之間的相(xiang)似性,實(shi)現“可控解開表征學習(controllable disentangled representation learning)”。然后,AI將重新(xin)(xin)組合這些屬(shu)(shu)性信息,以實(shi)現“可控的新(xin)(xin)圖像(xiang)合成(controllable novel image synthesis)”,或者可以叫做“想象力”。
葛云皓以(yi)變形金剛(gang)為例解釋(shi),“AI可以(yi)采(cai)用(yong)威震(zhen)天的(de)形狀,大黃蜂的(de)外觀(guan)和動(dong)作,以(yi)及紐約時代廣場的(de)背景進行(xing)‘想(xiang)象’。最(zui)終,即使(shi)在此前(qian)訓練期間AI從未見過這個(ge)場景,它(ta)也將呈現(xian)這樣的(de)一幅畫(hua)面:在時代廣場,黃色的(de)威震(zhen)天做著大黃蜂標準動(dong)作。”
這(zhe)樣(yang)的(de)想象方(fang)式有點類(lei)似于人(ren)類(lei)的(de)推(tui)斷行為,當人(ren)們(men)看到一個物體(ti)的(de)顏(yan)色(se)(se)時(shi),我們(men)可以(yi)用新顏(yan)色(se)(se)替換原始顏(yan)色(se)(se),并輕松地(di)(di)將輕松地(di)(di)推(tui)斷這(zhe)個顏(yan)色(se)(se)的(de)其(qi)他物體(ti)會是什(shen)么樣(yang)的(de)。
解耦還可以(yi)應用于深度偽造(zao)技術(deepfakes)。例如,將人(ren)臉的運動(dong)和(he)(he)人(ren)的身份分開(kai),AI模型可以(yi)將A的身份替換為B,但保留(liu)A的動(dong)作,合(he)成新的圖(tu)像和(he)(he)視頻。
此外,在進行該(gai)項研究(jiu)時,該(gai)研究(jiu)團隊(dui)生成了一個(ge)156萬(wan)張的圖像(xiang)數據集(dataset),可以幫助相(xiang)關領域的研究(jiu)團隊(dui)開展研究(jiu)。
三、拆開后重組事物屬性后,“解耦”可協助研發新藥
雖然解耦并不是一個有關AI“想象力”的(de)新設(she)(she)想,但(dan)研究人(ren)員表示,他們的(de)設(she)(she)計框架可以(yi)讓(rang)AI適(shi)應于大多數(shu)的(de)數(shu)據和知(zhi)識領域,這(zhe)將擴大AI“想象”的(de)應用(yong)范圍。此外,AI還(huan)可以(yi)從(cong)相(xiang)關信息中完全抹(mo)除種(zhong)族、性別等(deng)容易(yi)造成歧視的(de)屬性,讓(rang)人(ren)們的(de)信息在被數(shu)據分析(xi)時,得到相(xiang)同(tong)的(de)處理方式。
在醫學領域(yu),學會分(fen)辨(bian)屬性的AI可以幫(bang)助醫生和生物(wu)學家發現(xian)更(geng)多有用(yong)的藥(yao)(yao)物(wu)。AI將藥(yao)(yao)物(wu)的功能(neng)與藥(yao)(yao)物(wu)的其他特性分(fen)開,然(ran)后將不同藥(yao)(yao)物(wu)的特性重新(xin)組(zu)合(he)(he),以合(he)(he)成(cheng)新(xin)藥(yao)(yao)。
不僅(jin)如(ru)此,當AI具有“想象力(li)”后,它(ta)還可以幫(bang)助創建更安全的人工智能。比如(ru)說(shuo),它(ta)讓自動駕駛汽車“想象”如(ru)何避開訓練中從未遇(yu)見的危險場景。
“深(shen)度學習在很(hen)多領(ling)域都展示了較大的前景(jing),但這些(xie)往往通過讓AI淺層模(mo)仿(shallow mimicry)人類行為發生的,這些(xie)技術并沒(mei)有更深(shen)入地(di)了解每個研究對象獨一無二(er)的屬性特(te)征”,計算機科學教授Laurent Itti說,“第(di)一次真正地(di)釋放(fang)了人工智能的想象力(li),使它們能更加理(li)解人類是(shi)如(ru)何看待世界的”。
結語:AI解耦或成“雙刃劍”
南加州(zhou)大學的研(yan)究(jiu)團隊通過(guo)解(jie)耦技術(shu),讓(rang)AI能夠分(fen)清事(shi)物(wu)(wu)的不同(tong)屬性。并(bing)且(qie),AI可以將(jiang)不同(tong)事(shi)物(wu)(wu)的屬性重新(xin)組合(he),形成以前(qian)從未(wei)見過(guo)的事(shi)物(wu)(wu)。該技術(shu)還可以讓(rang)自動駕駛汽車避開從未(wei)遇(yu)見過(guo)的危險前(qian)景,以及協助(zhu)合(he)成新(xin)藥(yao)物(wu)(wu)。
當(dang)AI學會了如(ru)(ru)何(he)拆解事物(wu)(wu)的(de)屬(shu)性(xing)之后,可(ke)以(yi)重新幫助人們(men)(men)了解事物(wu)(wu)的(de)多樣性(xing),提高(gao)人們(men)(men)對事物(wu)(wu)認知(zhi)。但是當(dang)AI解耦應用(yong)于造假時,又將(jiang)給人們(men)(men)造成一(yi)定危(wei)害。AI解耦技(ji)(ji)術(shu)或成為一(yi)把“雙(shuang)刃劍”,而(er)人們(men)(men)在利用(yong)AI技(ji)(ji)術(shu)優勢(shi)時,如(ru)(ru)何(he)掌(zhang)控好技(ji)(ji)術(shu)的(de)“韁繩”,人們(men)(men)還(huan)將(jiang)繼(ji)續探(tan)索。
來源(yuan):Tech Xplore