智東西(公眾號:zhidxcom)
編譯?| 銘滟
編輯 | 徐珊

WAIC 2023世界人(ren)工智(zhi)能大會最(zui)近在上海圓滿落幕。在這場國(guo)內最(zui)高規(gui)格(ge)人(ren)工智(zhi)能領(ling)域峰會上,11位重磅嘉賓(bin)從不同角度分(fen)享了對(dui)中國(guo)人(ren)工智(zhi)能領(ling)域的觀(guan)察與判斷(duan)。

在大會的巔峰對話環(huan)節中,商湯科技董事長兼CEO徐立與(yu)圖(tu)靈獎(jiang)得主、上海期智研究(jiu)(jiu)院(yuan)院(yuan)長姚期智、清華(hua)大學交叉信息研究(jiu)(jiu)院(yuan)助理(li)(li)教授(shou)袁洋(yang)、清華(hua)大學交叉信息研究(jiu)(jiu)院(yuan)助理(li)(li)教授(shou)、Moonshot AI創始人楊植(zhi)麟、DragGAN第一(yi)作者、南洋(yang)理(li)(li)工大學計算機科學與(yu)工程學院(yuan)助理(li)(li)教授(shou)潘新鋼,就人工智能的發展與(yu)突破,進(jin)(jin)行(xing)了精彩的探(tan)討,包(bao)括大模(mo)(mo)型核(he)心理(li)(li)論研究(jiu)(jiu)突破、多模(mo)(mo)態對大模(mo)(mo)型的優化、安全可控的算法進(jin)(jin)路(lu)以及對比分析(xi)已有案例等。

一、姚期智:中國科學家助力人工智能強化學習

圖靈獎(jiang)得(de)主(zhu)、上海(hai)期(qi)智研究院(yuan)院(yuan)長姚期(qi)智表示,中國的(de)(de)科(ke)學家在AI的(de)(de)發(fa)展上做(zuo)了(le)很多突破性貢獻(xian)(xian)。清華大(da)學交叉(cha)信息(xi)研究院(yuan)助(zhu)理教授高陽在一(yi)年多前做(zuo)出了(le)非常重要的(de)(de)算(suan)法突破貢獻(xian)(xian),使得(de)強化學習的(de)(de)時間進程加快數百倍。他的(de)(de)研究不僅是一(yi)項(xiang)應用(yong)進步(bu),也為算(suan)法研究作出了(le)理論貢獻(xian)(xian)。因此,他的(de)(de)研究受(shou)到了(le)國際(ji)廣泛關(guan)注。

他認為在(zai)(zai)ChatGPT之后,人(ren)(ren)工智能(neng)研究(jiu)的(de)(de)下一個重要目標就是(shi)擁有視覺、聽覺等多種感知能(neng)力(li)的(de)(de)機(ji)器(qi)(qi)人(ren)(ren),并能(neng)在(zai)(zai)不同的(de)(de)環境中(zhong)自主學習各種新技能(neng)。而高陽的(de)(de)技術突破,則是(shi)將機(ji)器(qi)(qi)人(ren)(ren)的(de)(de)學習速(su)度提高了數(shu)百倍,使(shi)機(ji)器(qi)(qi)人(ren)(ren)在(zai)(zai)幾個小時(shi)內就能(neng)做到(dao)。

這不(bu)單單解(jie)決了機器人(ren)學習的實用問題,也是理論貢獻(xian)。姚期智表示,在過去六七年(nian)內(nei),人(ren)工(gong)智能的高層(ceng)研究者(zhe)曾(ceng)就(jiu)人(ren)工(gong)智能強化學習路線(xian)是否正確的議題展開爭論。而(er)高陽的研究突破,則是將這個(ge)天平(ping)傾向了另(ling)一(yi)邊。我們對人(ren)工(gong)智能的完善,還有很長的路要走(zou)。

二、袁洋:對多模態的理解應基于解決具體行業的具體問題

在(zai)交叉學(xue)科的(de)大(da)模(mo)型應(ying)用(yong)方面,清華大(da)學(xue)交叉信息(xi)研究院(yuan)助理(li)教授(shou)袁洋(yang)表(biao)示,對多模(mo)態的(de)理(li)解應(ying)當基(ji)于解決具體行(xing)業的(de)具體問題(ti)。例如文本到(dao)圖片的(de)生成,生成的(de)圖片不是用(yong)戶(hu)想要的(de)表(biao)現,用(yong)戶(hu)需要用(yong)鼠標(biao)對其進行(xing)修改。而這(zhe)(zhe)個(ge)鼠標(biao)的(de)拖動,就(jiu)是新的(de)模(mo)態。用(yong)戶(hu)在(zai)用(yong)新的(de)輸(shu)入(ru)把自己想要表(biao)達的(de)內容告訴大(da)模(mo)型,并(bing)讓它(ta)能夠理(li)解。這(zhe)(zhe)種多模(mo)態的(de)輸(shu)入(ru)在(zai)應(ying)用(yong)中非常重要。

所(suo)以在具體(ti)行業內,大(da)模(mo)型的(de)(de)訓練應當聚焦于行業內最核(he)心(xin)的(de)(de)問題,找(zhao)到(dao)解決核(he)心(xin)問題所(suo)需的(de)(de)數(shu)據。這就是模(mo)態(tai)的(de)(de)補全。在此基(ji)礎上,做好模(mo)態(tai)對齊與模(mo)態(tai)補齊后,袁洋認(ren)為,大(da)模(mo)型可(ke)以有更強大(da)的(de)(de)能力,來(lai)解決更核(he)心(xin)的(de)(de)交(jiao)叉(cha)領域(yu)的(de)(de)問題。

三、楊植麟:對通用大模型問題的解決應回歸更本質的層面

清華大學(xue)交(jiao)叉(cha)信息研究(jiu)院助理教授(shou)、Moonshot AI創(chuang)始人楊植麟則表示,現有大模(mo)型還有很(hen)多未解決(jue)(jue)的問(wen)題,比如,安全性(xing),可控性(xing),避免產生幻覺(jue)和編造不存在的問(wen)題,以(yi)及大模(mo)型無法(fa)像科(ke)學(xue)家一(yi)樣創(chuang)造。他認為,當針對通用模(mo)型思(si)考這(zhe)些(xie)問(wen)題時,不應當頭痛醫頭,而(er)應當舉一(yi)反三,思(si)考這(zhe)些(xie)問(wen)題底層的共通問(wen)題是什么,回歸更本質的層面來解決(jue)(jue)。

四、潘新鋼:Moonshot和GAN未來或可優勢互補

DragGAN第一作(zuo)者、南洋(yang)理(li)工大學(xue)計(ji)算機科學(xue)與(yu)工程(cheng)學(xue)院助理(li)教授潘新(xin)鋼則基(ji)于生(sheng)成(cheng)模(mo)型的框(kuang)架以及優化(hua)目標的不(bu)同,比(bi)較了兩個AI繪圖(tu)(tu)軟件——Moonshot和(he)GAN的差異。第一是性能(neng)與(yu)效率,在(zai)生(sheng)成(cheng)過程(cheng)中,擴散模(mo)型迭(die)代式(shi)計(ji)算需(xu)要的更(geng)多的訓練時(shi)間和(he)更(geng)大的計(ji)算開銷。所以,圖(tu)(tu)像生(sheng)成(cheng)性能(neng)更(geng)高(gao)。潘新(xin)鋼認為擴散模(mo)型的上(shang)限高(gao)于GAN,質量優勢更(geng)明顯,應用前景更(geng)廣。但對于性能(neng)和(he)計(ji)算開銷有限制的特定情形下,GAN仍是妥協的選(xuan)擇。

第二是GAN和擴(kuo)散(san)(san)模型(xing)的(de)映(ying)射,擴(kuo)散(san)(san)模型(xing)對于圖像內容的(de)影響表現為較為隨機,不具有結構化(hua),GAN可(ke)以有效(xiao)編輯圖像中的(de)屬性,例(li)如(ru)動物姿(zi)態(tai)等。在這一方(fang)面(mian),后續如(ru)何(he)拓展擴(kuo)散(san)(san)模型(xing)的(de)問(wen)題也值得探索(suo)。

第三是生成空間的(de)(de)連續(xu)性,設計(ji)時擴散模型(xing)的(de)(de)圖(tu)像空間較(jiao)為(wei)不連續(xu),GAN的(de)(de)圖(tu)像控件則比較(jiao)流暢(chang)自然。未來將(jiang)這兩個模型(xing)進(jin)行(xing)優勢互補是非常(chang)有趣(qu)的(de)(de)研(yan)究話題。

五、未來大語言模型的領域方向

關于(yu)(yu)大(da)(da)模(mo)型(xing)在垂直領域的發展,姚期智(zhi)認(ren)為(wei),基(ji)于(yu)(yu)大(da)(da)模(mo)型(xing)的語言(yan)能力,未來(lai)可(ke)(ke)以將更(geng)多的文書工作交(jiao)給機(ji)器來(lai)完(wan)成。袁洋則(ze)基(ji)于(yu)(yu)其專業(ye)背景和(he)(he)大(da)(da)模(mo)型(xing)基(ji)于(yu)(yu)預訓(xun)練范式的判斷,認(ren)為(wei)大(da)(da)模(mo)型(xing)在醫(yi)療(liao)關系中(zhong)可(ke)(ke)能會比(bi)(bi)人類和(he)(he)機(ji)器做得更(geng)好(hao),表示更(geng)看(kan)好(hao)智(zhi)能醫(yi)療(liao)方向(xiang)。楊植麟則(ze)傾向(xiang)于(yu)(yu)個人使用方向(xiang)。比(bi)(bi)如人可(ke)(ke)以給AI提供上下文,人看(kan)到的所有(you)東西AI通過錄(lu)屏也可(ke)(ke)以看(kan)到等。潘新鋼(gang)認(ren)為(wei)今后視頻和(he)(he)三維內(nei)(nei)容生成前景很大(da)(da),可(ke)(ke)以幫助創意工作者等創造更(geng)高質量的內(nei)(nei)容。

以(yi)上是巔峰對話(hua)內容的(de)完整整理(li),除此之外,本屆WAIC 2023世(shi)界人(ren)(ren)工(gong)智能大(da)會期間,特(te)斯拉創始人(ren)(ren)、CEO埃(ai)隆·馬(ma)斯克(Elon Musk)、香港中文(wen)大(da)學(xue)教授湯曉(xiao)鷗(ou),華為輪值董事(shi)長胡(hu)厚崑(kun),微(wei)軟全球(qiu)資深副總裁、微(wei)軟大(da)中華區董事(shi)長兼首席執行(xing)官侯陽博士,圖靈獎2018年得(de)主、Meta AI基(ji)礎人(ren)(ren)工(gong)智能研究(FAIR)團隊首席AI科學(xue)家楊(yang)立昆(Yann LeCun),地平線(xian)創始人(ren)(ren)兼CEO余凱(kai)分(fen)別分(fen)享了對人(ren)(ren)工(gong)智能領域的(de)觀察與思考。

結語:人工智能領域的未來將向“人腦”方向發展

此次WAIC帶(dai)來的不僅(jin)是各家大模(mo)型的集會(hui),也是人(ren)工(gong)(gong)智(zhi)能研究領域新老血液的交匯。人(ren)工(gong)(gong)智(zhi)能領域的研究涵(han)蓋了多個學科(ke),包括計算機科(ke)學、數(shu)據分(fen)析與統計、硬件和軟件工(gong)(gong)程、語言(yan)學、神經科(ke)學,甚至哲(zhe)學和心理學。因此目前對于人(ren)工(gong)(gong)智(zhi)能未來發展方向的探(tan)討并未形成統一觀點。

但無論是通用人(ren)(ren)工(gong)(gong)智能,還是機器人(ren)(ren)人(ren)(ren)工(gong)(gong)智能,各(ge)個人(ren)(ren)工(gong)(gong)智能概念(nian)或將向“人(ren)(ren)腦”甚至“人(ren)(ren)類”的(de)方(fang)向發展。這意味著人(ren)(ren)工(gong)(gong)智能的(de)目標不僅是模仿(fang)人(ren)(ren)類的(de)行為(wei),更(geng)要真正理解(jie)人(ren)(ren)類思維、情感(gan)和行為(wei)等復雜抽(chou)象概念(nian)。對(dui)于(yu)這些復雜抽(chou)象概念(nian)的(de)分析(xi),除(chu)了計算機科(ke)學(xue)(xue)(xue)(xue)和數據分析(xi)之外,或許(xu)還會涉及(ji)到腦科(ke)學(xue)(xue)(xue)(xue)領域,以及(ji)更(geng)深層的(de)哲學(xue)(xue)(xue)(xue)與心理學(xue)(xue)(xue)(xue)等問(wen)題。