智東西(公眾號:zhidxcom)
作者 |? 程茜
編輯 | ?漠影

馬斯克連線上海8分鐘,“AI創業教父”湯曉鷗(ou)來了(le),深度(du)學習大(da)佬楊立昆(Yann LeCun)、圖靈獎得主(zhu)姚(yao)期(qi)智也來了(le)。

智東西7月6日報道,今天上午,2023世界人工智能大會(WAIC)在上海開幕!作為國內最高規格的人工智能領域行業大會之一,今年WAIC的開幕主論壇上請到了特斯拉創始人、CEO埃隆·馬斯克(Elon Musk)香港中文大學教授湯(tang)曉鷗華為輪(lun)值董事長胡厚崑等重磅大咖演講。

更有圖靈獎2018年得(de)主、Meta AI基礎人(ren)工智(zhi)能研(yan)究(jiu)(FAIR)團隊首席(xi)AI科(ke)學家(jia)楊(yang)立(li)昆(Yann LeCun),圖靈獎得(de)主、上海期智(zhi)研(yan)究(jiu)院院長(chang)姚期智(zhi)展開巔峰對話,多位(wei)大佬(lao)在(zai)上午(wu)的演講中拋出了眾多精(jing)彩觀點(dian)和干貨內容。

開幕式上,馬斯克通(tong)過連線(xian)進行了8分(fen)鐘演(yan)講,重提他對全(quan)(quan)面人(ren)工智能的安全(quan)(quan)擔憂,并預言未(wei)來(lai)機器(qi)人(ren)數量將(jiang)超過人(ren)類,今年(nian)年(nian)底還將(jiang)發(fa)布完全(quan)(quan)自(zi)動駕駛。

湯曉鷗暢談了(le)大(da)模型浪潮中(zhong),中(zhong)國學者的原(yuan)創力量正在崛起(qi)。

在國內,AI發展的算力基礎一直令眾多企業頭疼,胡(hu)厚崑談道,華(hua)為(wei)的(de)(de)算(suan)力基礎設(she)施構建正在加速(su),讓算(suan)力不再成為(wei)AI發展的(de)(de)瓶頸,國內有一(yi)半(ban)大模型由AI昇(sheng)騰提(ti)供算(suan)力支(zhi)持。

微軟和OpenAI的強勁組合引領了這一波浪潮,微軟(ruan)全球資深副總裁(cai)、微軟(ruan)大中華區(qu)董(dong)事(shi)長兼(jian)首(shou)席執行官侯(hou)陽博士也預(yu)言未來每一家公司的(de)每一個(ge)(ge)應用(yong)程序都將由AI驅動,微(wei)軟將發掘(jue)數字化產(chan)業在(zai)各個(ge)(ge)領域(yu)的(de)發展潛力。

楊立昆(Yann LeCun)地(di)平線創始人(ren)兼(jian)CEO余(yu)凱(kai)進(jin)行了線上交流(liu),楊(yang)立昆重申(shen)ChatGPT不是AGI終局(ju),視(shi)頻和圖像生成革命(ming)亟(ji)需推動(dong)。

更有商(shang)湯科(ke)技(ji)董事長(chang)兼CEO徐(xu)立(li)姚期智清華大學交(jiao)叉信息研究院(yuan)助理教授袁(yuan)洋(yang)清華大(da)學交叉信息研(yan)究院(yuan)助理教(jiao)授、Moonshot AI創始(shi)人楊植麟DragGAN第一(yi)作(zuo)者、南洋理(li)工大學(xue)(xue)計(ji)算機(ji)科學(xue)(xue)與工程學(xue)(xue)院(yuan)助理(li)教授(shou)潘新(xin)鋼,進行了關(guan)于大模型發(fa)展下一階段的發(fa)展方向(xiang),以及應用爆發(fa)在(zai)哪些垂直行業的探討(tao)。

本次展會展區面積達5萬平方米創歷屆之最,參展企業超過400家,涵蓋核心技術、智能終端(duan)、應用賦能、前沿技術四大板塊(kuai)。

沒有一個BAT老板的世界人工智能大會,看馬斯克湯曉鷗姚期智們講了啥

生成式AI和大模型為代表的新一輪AI加速演進,正在引領這一輪席卷全球的科技革命和產業革命,大模型也成為本屆世界人工智能大會的熱點,既有商湯日日新、百度文心一言、科大訊飛星火認知大模型、華為云盤古大模型等10余家(jia)基礎應用大(da)模型亮相,還有達觀數據曹植大模型、蜜度科技蜜巢大模型、網易伏羲“AI繪畫平臺”丹青約大(da)模型新品(pin)首(shou)發亮相

一、特斯拉馬斯克:年內發布無人駕駛,預警AGI爆發

這是上海舉辦的國(guo)內最高(gao)規格(ge)的人(ren)工智能行(xing)業峰會之一,作(zuo)為特斯拉的創(chuang)始(shi)人(ren),馬(ma)斯克(ke)這是第三次參加并(bing)帶來演講,分享了不(bu)少(shao)干貨信息和(he)觀點。

人工(gong)智能(neng)將會(hui)在未來人類(lei)的(de)演(yan)(yan)進中扮(ban)演(yan)(yan)重要的(de)角色,我們看到了數字計算(suan)(suan)能(neng)力(li)的(de)爆炸式增(zeng)長,其中有一個最關鍵的(de)指(zhi)標是數字計算(suan)(suan)能(neng)力(li)、機器計算(suan)(suan)能(neng)力(li)、生物計算(suan)(suan)能(neng)力(li)的(de)比例。

這一比(bi)例正(zheng)在(zai)(zai)(zai)逐(zhu)年變高,這也意味著機器(qi)和生物的(de)(de)算(suan)力差(cha)距在(zai)(zai)(zai)擴(kuo)大,也就(jiu)是說(shuo)一段(duan)時間后(hou),相比(bi)于(yu)機器(qi)智(zhi)能(neng)(neng),人工(gong)的(de)(de)智(zhi)能(neng)(neng)化在(zai)(zai)(zai)全部的(de)(de)智(zhi)能(neng)(neng)中所占的(de)(de)比(bi)例越(yue)來越(yue)低。

這將會帶來根本(ben)性的變化,現在也是人類(lei)歷史上(shang)最(zui)深刻的時期。

特斯拉的人形機器人開發還處于早期,但特斯拉公司創始人馬斯克認為,未來社會中會有非常多機器人,地球上機器人(ren)的數(shu)量(liang)會超過人(ren)類數(shu)量(liang)。機器人的計(ji)算能力更(geng)強,因此這似乎已經成為(wei)發展的一大趨(qu)勢。

沒有一個BAT老板的世界人工智能大會,看馬斯克湯曉鷗姚期智們講了啥

▲特斯(si)拉(la)創始人(ren)埃隆·馬斯(si)克

當然(ran),這會帶來積極和消極的(de)影響(xiang),積極方面在于(yu)未來世(shi)界中,機器(qi)人(ren)為主導的(de)生(sheng)產(chan)(chan)效率(lv)會比(bi)以(yi)人(ren)為主導的(de)生(sheng)產(chan)(chan)效率(lv)高,但我們需要確(que)保其發展(zhan)有助于(yu)人(ren)類(lei)。

例如特(te)斯(si)拉(la)的人(ren)(ren)形(xing)機器人(ren)(ren)Optimus,其(qi)目(mu)標(biao)就(jiu)是(shi)幫助(zhu)人(ren)(ren)類完成無(wu)聊、重復、危險等(deng)人(ren)(ren)類不(bu)愿意做的工(gong)作。馬斯(si)克也談道,他(ta)現在不(bu)想過度樂觀于,特(te)斯(si)拉(la)人(ren)(ren)形(xing)機器人(ren)(ren)做的工(gong)作未來在社會中扮(ban)演的角色(se)一定很重要。

在(zai)自動(dong)駕駛方(fang)面(mian),特斯(si)拉也有(you)興趣將自己的(de)自動(dong)駕駛技術(shu)許(xu)可給其它汽(qi)車廠(chang)商。馬斯(si)克談道,全自動(dong)駕駛的(de)汽(qi)車會使(shi)得人(ren)們的(de)使(shi)用率大大增(zeng)加。目前,人(ren)們一周使(shi)用家用車的(de)時(shi)間在(zai)10-20個小時(shi),而全自動(dong)駕駛的(de)汽(qi)車使(shi)用時(shi)間可能是(shi)一周50-60小時(shi)。

當前,特(te)斯拉的自動(dong)(dong)駕駛(shi)技術已(yi)經(jing)非常接近(jin)沒有人(ren)類(lei)干預的全自動(dong)(dong)駕駛(shi)狀態,馬斯克(ke)稱,特(te)斯拉已(yi)經(jing)在美國的道(dao)路(lu)上測試了(le),其自動(dong)(dong)駕駛(shi)已(yi)經(jing)很少需(xu)要(yao)人(ren)工干預了(le)。

此前,馬斯克也做過關于全自動駕駛的預測,但他認為此刻的預測比以往時候都更接近于現實。今(jin)年晚(wan)些時候(hou),特斯拉就可以實(shi)現全(quan)自(zi)動駕駛

此外,他還提(ti)及到對深度的全(quan)面人工智能的擔心,尤其是全(quan)自(zi)動駕駛汽車,不過他認為,特(te)斯拉將很快(kuai)加(jia)以解決。

全面人工智能在任何一個領域都比人類更聰明,因此人們需要一些監管措施對它進行監督。馬斯克認為,全面(mian)人(ren)工智(zhi)(zhi)能是幾十萬(wan)甚至幾百萬(wan)臺高性能計算機一起在(zai)數據中(zhong)(zhong)心中(zhong)(zhong)協作,組合產生超級智(zhi)(zhi)能,比人(ren)類(lei)更強大(da)

這可(ke)能(neng)(neng)出現(xian)一些(xie)負面(mian)(mian)的影響,但研(yan)究人員需要盡可(ke)能(neng)(neng)確保(bao)避免負面(mian)(mian)的未(wei)來影響發生。

最后,馬斯克談道,他一直以來非常敬佩中國人民的智慧和干勁,他認為中國(企業、研發人員)一旦下定決心要做一件事,就一定會把這個產業做得很好,包括AI產業,所以他相信中(zhong)國會有很強的AI能力

并且馬斯克還感(gan)謝了上(shang)海的朋(peng)友們(men),感(gan)謝陳書(shu)記,并希望下次有機(ji)會(hui)能(neng)線下參會(hui)。

二、香港中文大學湯曉鷗:我的三個學生,正在影響AI世界

聽完馬斯克(ke)的演(yan)講后,香港中文大學教授湯(tang)曉鷗(ou)就決定完成自己兒(er)子的心(xin)愿,給他買一輛(liang)特斯拉。

湯曉鷗的(de)演講主題“你好上海”靈感來自電(dian)影《你好李煥英(ying)》,這(zhe)一中國家庭劇創造(zao)了54億票房(fang),原因在于人們開(kai)始買票看電(dian)影,原創力量正在崛起,這(zhe)放到科(ke)技行業(ye)也是如(ru)(ru)此(ci),如(ru)(ru)今,科(ke)技工作者也看到了曙(shu)光。

沒有一個BAT老板的世界人工智能大會,看馬斯克湯曉鷗姚期智們講了啥

▲香港中文大學教授湯(tang)曉鷗

他談道,Transformer是一種新(xin)型網絡架(jia)構,通過(guo)注意(yi)力(li)機(ji)制(zhi)的(de)計算(suan)方式,目前幾乎被(bei)AI內(nei)所有的(de)大模型所采用。在(zai)大模型浪潮(chao)中(zhong),中(zhong)國學者也(ye)正(zheng)在(zai)貢獻很(hen)多原創力(li)量。

湯曉鷗三位學生王曉剛、何愷明、林達華為深(shen)度(du)學(xue)習(xi)培育出了(le)一棵大樹(shu)。他形象地說道,王(wang)曉(xiao)剛(gang)在深(shen)度(du)學(xue)習(xi)最初幾(ji)年灑下了(le)原創種子(zi),何(he)愷明打牢了(le)深(shen)度(du)學(xue)習(xi)的根基(ji),林(lin)達華通過開源和(he)大模(mo)型(xing)讓(rang)其枝繁(fan)葉茂。

2011-2013年深度學習剛剛開始的時候,王曉剛的(de)第一項工作是,CVPR和ICCV這(zhe)兩(liang)個計(ji)算(suan)機(ji)視(shi)(shi)覺領域(yu)最重(zhong)要的(de)會議上,全(quan)球共有29篇文章關于(yu)(yu)深(shen)度(du)學習,其中14篇出自湯曉鷗(ou)教授(shou)的(de)實驗室,并第一次(ci)將深(shen)度(du)學習應用于(yu)(yu)計(ji)算(suan)機(ji)視(shi)(shi)覺領域(yu)的(de)18個研究方向,包(bao)括人臉檢測、人臉重(zhong)建、物(wu)體檢測、人體姿態等計(ji)算(suan)機(ji)視(shi)(shi)覺的(de)最核心問題。

第二項工作是,王曉剛在Facebook之前讓機器做的人(ren)(ren)臉識別超過了人(ren)(ren)的眼睛。

第(di)三項工作(zuo)是(shi),王曉(xiao)剛(gang)帶領香港中文(wen)大學在ImageNet競(jing)賽(sai)中多次奪冠,并取得第(di)一個ImageNet世界冠軍,他當年的對手是(shi)谷歌。

第二(er)個學生是何愷(kai)明,他本科(ke)就讀于清華大學,在湯曉(xiao)鷗(ou)教授的實驗(yan)室(shi)發表第一篇文(wen)章取得(de)CVPR最佳(jia)論文(wen),這(zhe)也是CVPR 25年歷史(shi)上(shang)從(cong)亞洲出的第一篇最佳(jia)論文(wen)。

何愷明前往(wang)微軟和Facebook工作后(hou),第一項工作是ResNet,解決(jue)了深度(du)網絡的梯度(du)傳遞問題獲得2016年最佳論文,使得深度(du)學(xue)習能有(you)效(xiao)訓練(lian)超過(guo)百層的深度(du)神經(jing)網絡。

可以說,何愷明(ming)將網絡做深了(le),谷歌(ge)把網絡入(ru)口(kou)拉大了(le),才使(shi)得今天的大模型誕生。

第二項工作(zuo)是他做Facebook做的Mask R-CNN,首次(ci)提出了真(zhen)正(zheng)高性能物體監測(ce)算(suan)法框架,獲得ICCV 2017最佳論文。

第三項工作是他在Facebook做的Masker AutoEncoder,首(shou)次(ci)把基于掩碼的自編碼思(si)想用(yong)于視覺領(ling)域的非(fei)監(jian)督學(xue)習。

第三(san)個(ge)學生林達華的(de)OpenMMLab,通過口(kou)口(kou)相傳的(de)形式成為國際上(shang)最具影響力的(de)視覺算法開(kai)源體系,在GitHub上(shang)累計了8萬多顆星標。

第二項工作是發布國內(nei)首個多語(yu)種大語(yu)言(yan)模型書生·浦語(yu)。

第三(san)(san)項是(shi)發(fa)布LandMark天際,這(zhe)是(shi)全球首個城市級三(san)(san)維實(shi)景大模(mo)型,該模(mo)型有2000億(yi)參數,能覆蓋100平方公里。

現在,他們種下的這顆大樹也已經開始開花結果,兩周前,自動駕駛大模型獲得了CVPR 2023最佳論文獎,據谷歌學術統計,這是改革開放40多年來,第一篇全部由中國學者完成的國際計算機視覺三大頂會的最佳論文,這篇文章的牽頭作者是王曉剛帶出來的博士。新一代的學生已經開始在(zai)上海(hai)成功起步

湯曉鷗教(jiao)授十分感性的在最(zui)后(hou)說道(dao):“我(wo)不是在最(zui)好的時光遇(yu)見了(le)你們(men),而是遇(yu)見了(le)你們(men),才有了(le)這段最(zui)好的時光。”

當每晚聽于謙老(lao)師的(de)相(xiang)聲入睡時(shi),他總會想:“機(ji)器怎(zen)么可能超過這樣有趣(qu)的(de)靈魂(hun),我(wo)不信(xin)。”

三、華為胡厚崑:一手算力一手大模型,讓AI落地千行百業

今年的大會與(yu)往屆(jie)相比最(zui)大的不同是我們處于新的背景,ChatGPT的出(chu)現將人(ren)工智(zhi)能推(tui)到(dao)了新的風口,通用(yong)人(ren)工智(zhi)能已(yi)經成(cheng)為人(ren)類(lei)最(zui)熱門的話(hua)題。

當下,人(ren)工智能發(fa)展的方向已經很清(qing)楚,AGI會改寫人(ren)們身邊的一切(qie),華為輪值董事長(chang)胡厚(hou)崑認為,方向清(qing)晰了以后很關鍵的就(jiu)是路徑的設(she)計(ji)。

沒有一個BAT老板的世界人工智能大會,看馬斯克湯曉鷗姚期智們講了啥

▲華為輪值董(dong)事(shi)長胡厚崑(kun)

其中,華為最核心的考慮就是下一個階段要全力推進人工智能走深向實。一方面深耕算(suan)力,打造強有力的算力底座,另一方面,結(jie)合大模型從通用大(da)模型到行業(ye)(ye)大(da)模型的(de)行業(ye)(ye)創新,真正(zheng)讓(rang)人(ren)工(gong)智能服務好千行百業(ye)(ye)。

首先,AI的發展中算力是基礎,但當前中國算力的可獲得性和成本方面面臨不小的挑戰。華為聚焦于鯤鵬和昇騰的根技術上,并取得了突破,當下,華為正在通過架構創新、生態發展、靈活共建手段讓算力(li)不再成為人工智(zhi)能發展的瓶(ping)頸

通過(guo)架構創新提(ti)升計算(suan)(suan)效(xiao)率,如在計算(suan)(suan)節點層面,華為(wei)推(tui)出革命(ming)性對等評(ping)估架構,突破傳統以(yi)CPU為(wei)中心的異構計算(suan)(suan)可能(neng)(neng)帶來的性能(neng)(neng)瓶頸,從而提(ti)升計算(suan)(suan)帶寬、降低(di)時延(yan),使得節點性能(neng)(neng)得到30%提(ti)升。

在數據(ju)中(zhong)(zhong)心層面,華為2019年推出(chu)昇騰AI計(ji)算(suan)集(ji)群,把AI的數據(ju)中(zhong)(zhong)心當做一(yi)臺(tai)超(chao)級計(ji)算(suan)機(ji)來設計(ji)和管理。當前,華為最大(da)的AI計(ji)算(suan)集(ji)群在深圳“鵬城云(yun)腦”二期(qi),算(suan)力是(shi)1000P規模(mo),2024年三期(qi)會達到16000P規模(mo)水平。

華為在烏蘭察布計(ji)算(suan)中心實測發現(xian),這種集群方式同等算(suan)力情況下可(ke)以(yi)得到10%以(yi)上的(de)效(xiao)率(lv)提升(sheng)。

此外,4年前(qian),華為圍繞整個計算(suan)產(chan)業(ye)的(de)算(suan)力發(fa)展(zhan)(zhan)提出(chu)了硬(ying)件(jian)(jian)(jian)開放、軟(ruan)件(jian)(jian)(jian)開源(yuan)、使能伙伴(ban)、發(fa)展(zhan)(zhan)人才(cai)戰略,現在,硬(ying)件(jian)(jian)(jian)方面,華為已經推(tui)出(chu)更多(duo)(duo)樣化的(de)模(mo)組和(he)板卡(ka),擁有30多(duo)(duo)個硬(ying)件(jian)(jian)(jian)伙伴(ban),基于生成式(shi)AI推(tui)出(chu)上(shang)百(bai)款AI硬(ying)件(jian)(jian)(jian),可以滿(man)足不同行(xing)業(ye)的(de)場景(jing)需要(yao)。

軟件層面,華為提供全流程智能平臺支撐企業,其生(sheng)態(tai)已(yi)經孵(fu)化了20多(duo)個基礎大模型,當前國內有一半大模型由AI昇騰提(ti)供算(suan)力支持(chi)

并且結(jie)合(he)國(guo)內實際(ji)情況,華(hua)為(wei)還采(cai)用多種(zhong)(zhong)(zhong)模式建(jian)設算(suan)力。第(di)一(yi)種(zhong)(zhong)(zhong)是華(hua)為(wei)打(da)造了25個城市級(ji)的(de)(de)人(ren)工(gong)智能計算(suan)中心,第(di)二種(zhong)(zhong)(zhong)是為(wei)了滿足頭(tou)部企(qi)業自建(jian)人(ren)工(gong)智能算(suan)力中心的(de)(de)訴求,幫助企(qi)業建(jian)立自己的(de)(de)AI算(suan)力中心,如中國(guo)移(yi)動、科大訊飛、南方(fang)電(dian)網,第(di)三種(zhong)(zhong)(zhong)是對(dui)于算(suan)力需求旺盛的(de)(de)中小(xiao)企(qi)業,通過云服(fu)務的(de)(de)方(fang)式提(ti)供算(suan)力服(fu)務。

胡厚崑還提到,華為一方面要持續提升通用(yong)大模型能力,另一方面還要建好行業模(mo)型,行業大(da)模型能在(zai)通用大(da)模型的基礎(chu)上給(gei)出更精準的答案。

華為推(tui)出了三層大模(mo)型結構,最底層稱之(zhi)為“讀萬卷書”,對標(biao)的是通用大模(mo)型,再上一(yi)層是做(zuo)好海量(liang)基礎知識學(xue)習,最上一(yi)層是打造(zao)行(xing)(xing)業(ye)模(mo)型和場景模(mo)型,被(bei)稱為“行(xing)(xing)萬里路”。

胡厚崑談道,從讀萬卷書到行(xing)(xing)萬里路(lu)還有很(hen)多(duo)挑(tiao)戰需(xu)要克服,最(zui)關鍵的一點是要把(ba)各(ge)行(xing)(xing)各(ge)業的知識與大模(mo)型進(jin)行(xing)(xing)匹(pi)配、融合。

當(dang)前,華為(wei)盤古大模型圍繞(rao)金融、電力等10多個(ge)行業(ye),支(zhi)撐(cheng)400多個(ge)場景AI應(ying)用業(ye)務落地。

在AI服務(wu)于(yu)科(ke)學研究方面,盤(pan)古科(ke)學計算大(da)模型包括藥物分子、海(hai)浪(lang)、氣象大(da)模型,如(ru)氣象研究領域,盤(pan)古大(da)模型可以在幾秒內完成全(quan)球一個小(xiao)時到七(qi)天的(de)七(qi)項情(qing)況(kuang)預報。AI將為科(ke)學工(gong)作者帶來更多新思路、新方法,為人類社會發展(zhan)帶來新動能(neng)。

四、Meta首席AI科學家楊立昆:我不喜歡AGI這個提法

2018年圖靈獎得主、Meta AI基(ji)礎人工智(zhi)能研究(FAIR)團隊首席AI科(ke)學家楊立昆(Yann LeCun)和地平線(xian)創(chuang)始人兼CEO余凱進行了線(xian)上交流(liu)。

沒有一個BAT老板的世界人工智能大會,看馬斯克湯曉鷗姚期智們講了啥

▲右為Meta AI基(ji)礎人工智能研究(FAIR)團隊首席(xi)AI科學家楊立昆(kun)(Yann LeCun)、左為地平(ping)線創始人兼CEO余凱

在過去(qu)十(shi)年里(li),AI最(zui)讓(rang)人激動的(de)(de)進展(zhan)是,自(zi)(zi)主監督運行(xing)創(chuang)造了(le)一場(chang)革命(ming)。楊立昆認為,自(zi)(zi)然語言(yan)(yan)處理(li)如語言(yan)(yan)模(mo)型、語音(yin)模(mo)型等符號或者本質(zhi)上和符號序列(lie)有(you)關的(de)(de)技(ji)術(shu)正在創(chuang)造一場(chang)革命(ming)。現在要做的(de)(de)就是在圖像和視頻領域上推動同樣的(de)(de)革命(ming)。

楊立昆曾發表過ChatGPT不是AGI終局的觀(guan)點(dian),這次他(ta)也談到了自(zi)己的實(shi)際判(pan)斷基準。

他并不喜歡AGI這個詞,他認為每一個智能(neng)都是(shi)專項(xiang)的(de),人類(lei)的(de)智能(neng)也都是(shi)非常專業、專項(xiang)的(de)。

ChatGPT使(shi)用(yong)文本(ben)訓(xun)練,無法(fa)用(yong)圖(tu)像、視頻訓(xun)練,它可以試圖(tu)預(yu)測(ce)文本(ben)中缺失的(de)(de)單(dan)(dan)詞、長文中最后一個單(dan)(dan)詞,但這(zhe)樣的(de)(de)問題是它不可能準確預(yu)測(ce)文本(ben)中缺少的(de)(de)單(dan)(dan)詞,而是必須預(yu)測(ce)所(suo)有單(dan)(dan)詞的(de)(de)分(fen)布。

在視(shi)頻(pin)中(zhong),下(xia)一幀(zhen)和上一幀(zhen)有可(ke)能類似,但模型無法耦合視(shi)頻(pin)幀(zhen)中(zhong)出(chu)現的(de)所(suo)有細節,使用不同的(de)非生成式(shi)架構(gou),聯合構(gou)建預(yu)測架構(gou),而不是在像素空間中(zhong)做預(yu)測,問題就是你應該怎么(me)訓練他(ta)。

大模型并不滿足于一個(ge)目(mu)標(biao),它們通過設計提示,使得你訓(xun)練(lian)的統計數據(ju)足夠優(you)質來達到目(mu)標(biao),但基本上這一目(mu)標(biao)都無法被控制(zhi)。

大(da)模(mo)型一個接一個生成(cheng)tokens,但(dan)它(ta)們不理(li)解(jie)物理(li)世界,沒辦法規劃、推理(li)就(jiu)沒辦法實現(xian)目標(biao),這也意味(wei)著智能系統(tong)缺少非常重(zhong)要的組件,在律師考(kao)試中(zhong)(zhong),大(da)模(mo)型可以發揮強大(da)的檢索(suo)能力獲得很好的成(cheng)績,但(dan)它(ta)沒有足夠智能的系統(tong),去把碗(wan)碟(die)放(fang)到洗碗(wan)機中(zhong)(zhong)。

世界模型就是要讓模型像人類了解世界的方式一樣了解世界,通(tong)過(guo)觀察和少量交互的(de)方(fang)式(shi)來訓練。

談及人類對AI安全的干預時,楊立昆談道,達到人(ren)類水平的AI最好辦法就是做更(geng)大的自(zi)回歸LLM,而(er)讓(rang)它變智(zhi)能也是讓(rang)它更(geng)可控的途徑

人(ren)們(men)通(tong)過(guo)目(mu)(mu)(mu)標(biao)(biao)(biao)驅(qu)動人(ren)工智能的(de)(de)理念(nian),就(jiu)可以設置其(qi)它目(mu)(mu)(mu)標(biao)(biao)(biao)作為其(qi)安全護(hu)欄,如讓這些(xie)系統(tong)不會出現欺騙(pian)、支配人(ren)類的(de)(de)行為、迫(po)使AI誠實的(de)(de)目(mu)(mu)(mu)標(biao)(biao)(biao)、屈從于人(ren)類的(de)(de)目(mu)(mu)(mu)標(biao)(biao)(biao),而需要小(xiao)心(xin)那(nei)些(xie)讓模型好(hao)奇的(de)(de)目(mu)(mu)(mu)標(biao)(biao)(biao)等。

楊立昆不同意有些人害怕AI就希望AI受到嚴格監管,他認為從長遠來看,要讓AI平臺安全、良善、實用的唯一辦法就是讓它開源

想象一下(xia),未來每個人(ren)都可以通過AI助手和數字世界進行互(hu)動,如果技術只被少數公(gong)(gong)司控制的(de)(de)話并不是好事,未來的(de)(de)AI系統應該(gai)保護人(ren)類所有知識,其訓練的(de)(de)方式也應該(gai)基于公(gong)(gong)開源頭(tou)。

五、微軟侯陽:大模型的“涌現”爆發絕非偶然

AI作為(wei)科(ke)研(yan)項目,最早出現在1956年,至(zhi)今已發(fa)(fa)展(zhan)將近70年。去年年底ChatGPT一夜(ye)爆(bao)紅,使得生成式AI瞬間爆(bao)發(fa)(fa),很多(duo)科(ke)技(ji)從業者對其突(tu)然涌現感到驚詫不已。

微軟全球資深副總裁、微軟大中華區董事長兼首席執行官侯陽博士談道,在微軟看來,所謂的涌現絕非偶然,這是無(wu)數優秀科研人員數十年如一日(ri)的研究積累、海量計算資(zi)源的投(tou)入,才造就了這樣的創新成(cheng)果。

沒有一個BAT老板的世界人工智能大會,看馬斯克湯曉鷗姚期智們講了啥

▲微軟全球(qiu)資深副(fu)總裁(cai)、微軟大中華區董事長兼首席執行官(guan)侯陽博士(shi)

OpenAI的技術突破依托于微(wei)(wei)軟(ruan)智能(neng)云提(ti)供的基礎(chu)架(jia)構和(he)(he)算(suan)力支持。2019年開始,微(wei)(wei)軟(ruan)和(he)(he)OpenAI展開深入合作(zuo),以海(hai)量云計(ji)算(suan)資源支持OpenAI大型(xing)語言模(mo)型(xing)的研究。微(wei)(wei)軟(ruan)CEO納德拉曾提(ti)到(dao),AI的黃金時代(dai)已(yi)經到(dao)來,微(wei)(wei)軟(ruan)智能(neng)云由此開啟了加(jia)速(su)上新的模(mo)式。

微軟(ruan)將AI技術與企業云服(fu)務全面融合,微軟(ruan)365辦公、GitHub開源(yuan)社區、數字信(xin)息安全保護、Windows操作系統等(deng),并推出一系列AI驅動的Copilot(智能副(fu)駕(jia))服(fu)務,可以幫助用戶根據演(yan)(yan)講提(ti)綱(gang)要點設計PPT、演(yan)(yan)示稿等(deng)。

今年5月,微軟連續發布了超50項與生成式AI相關的新技術、新服務,其中最重要的一項是向全球開發者開放(fang)了Copilot與插件擴展(zhan)體系(xi)

插(cha)件拓(tuo)展(zhan)體系可以在第(di)三方應(ying)用、客戶業(ye)務場景(jing)之間構建可靠連接,通(tong)過插(cha)件接入實時更新的信(xin)息流以及多樣的應(ying)用和服務,在其正(zheng)式發布時,微軟預計將提供超1000種開(kai)發者插(cha)件。

生成式AI展(zhan)現出的巨大(da)潛力(li),使(shi)得未來每一家(jia)公司的每一個應用(yong)程序(xu)都將由(you)AI驅動(dong),用(yong)它來提升(sheng)企業自身的創造力(li)。

在將研究成果轉化為生產力方面(mian),微軟(ruan)總(zong)結了六個重(zhong)點(dian)行(xing)(xing)業(ye),包括優化制(zhi)造與能源行(xing)(xing)業(ye)的(de)供應(ying)鏈韌性;零售電商(shang)行(xing)(xing)業(ye)的(de)智能客(ke)服;游戲中NPC角色(se)、劇情(qing)和對白(bai)設計;金融行(xing)(xing)業(ye)實時行(xing)(xing)情(qing)分(fen)析(xi)報告(gao);生命科學領域(yu)臨床實驗數據(ju)分(fen)析(xi)能力;交互(hu)性、定制(zhi)化、探索式的(de)學習方式等。

同時(shi),微軟在潛在安全風險方面,堅持(chi)公(gong)平(ping)、公(gong)正、責任(ren)等六大原則,并從自身的(de)(de)資源和技術出發(fa)(fa),與各行各業(ye)(ye)(ye)的(de)(de)企業(ye)(ye)(ye)進行技術交流和業(ye)(ye)(ye)務合(he)作(zuo),發(fa)(fa)掘數字化(hua)產業(ye)(ye)(ye)在各個領域的(de)(de)發(fa)(fa)展潛力。

六、巔峰對話:大模型下一步往哪走?文書、醫療、視頻行業應用被看好

商湯科技董(dong)事長(chang)兼CEO徐立與圖(tu)靈(ling)獎(jiang)得主、上海期(qi)智研究(jiu)院(yuan)院(yuan)長(chang)姚期(qi)智、清華大(da)(da)學交(jiao)(jiao)叉信息研究(jiu)院(yuan)助理教授袁(yuan)洋、清華大(da)(da)學交(jiao)(jiao)叉信息研究(jiu)院(yuan)助理教授、Moonshot AI創(chuang)始(shi)人楊(yang)植麟、DragGAN第一(yi)作者、南洋理工(gong)大(da)(da)學計算(suan)機科學與工(gong)程(cheng)學院(yuan)助理教授潘新鋼,進(jin)行了關于(yu)大(da)(da)模型發(fa)展(zhan)(zhan)下一(yi)階段的發(fa)展(zhan)(zhan)方向,以(yi)及應(ying)用爆(bao)發(fa)在哪些(xie)垂(chui)直(zhi)行業的探討。

沒有一個BAT老板的世界人工智能大會,看馬斯克湯曉鷗姚期智們講了啥

▲從左至右:商湯科(ke)技董事長(chang)兼(jian)CEO徐立(li),圖靈獎得主(zhu)、上海期(qi)智研究(jiu)院(yuan)院(yuan)長(chang)姚期(qi)智,清華大(da)學(xue)(xue)交(jiao)叉信息研究(jiu)院(yuan)助理(li)教授(shou)(shou)袁(yuan)洋,清華大(da)學(xue)(xue)交(jiao)叉信息研究(jiu)院(yuan)助理(li)教授(shou)(shou)、Moonshot AI創始人楊(yang)植麟,DragGAN第一作者、南洋理(li)工大(da)學(xue)(xue)計算機(ji)科(ke)學(xue)(xue)與工程學(xue)(xue)院(yuan)助理(li)教授(shou)(shou)潘新鋼(gang)

姚期智認為,中國的科學家在AI的發展上做了很多突破性貢獻,清華大學交叉信息研究院助理教授高陽在一年多前非常重要的(de)算法(fa)突破貢獻,使得強化學習加(jia)快數百倍。

他認為ChatGPT之后,下一(yi)個重要(yao)目標就是(shi)擁有視覺(jue)、聽(ting)覺(jue)多種(zhong)感知能力的機器人在不同的環境里(li)自(zi)主學習各種(zhong)新(xin)技能,但(dan)現有的強化學習方法太慢了(le),對于新的技術(shu)要(yao)幾個(ge)月時間(jian)才能(neng)學好,高(gao)陽的技術(shu)突(tu)破使得其在幾個(ge)小時就能(neng)做(zuo)到(dao)。

交(jiao)叉(cha)學(xue)科對(dui)大模(mo)型(xing)發展(zhan)的幫助方面,袁洋認為,大模(mo)型(xing)用(yong)到(dao)交(jiao)叉(cha),大家想(xiang)到(dao)的多模(mo)態是(shi)有(you)觸覺、能看到(dao)、能聽到(dao),但在多模(mo)態中(zhong),例(li)如文本到(dao)圖(tu)片(pian)(pian)的生成,生成的圖(tu)片(pian)(pian)不(bu)是(shi)用(yong)戶想(xiang)要(yao)的姿勢,他可以用(yong)鼠標拖動,這(zhe)就(jiu)是(shi)用(yong)戶用(yong)一種(zhong)方式告訴(su)大模(mo)型(xing)它想(xiang)要(yao)的狗的姿勢是(shi)什么。

因此,大模型訓練中不應該只是把文本、圖像喂給模型,而是要找到行業的問題是什么、找到什么信息能解決這一問題,這就是模(mo)態補全。在(zai)這基礎上,再去(qu)收集足夠數據,做好模態的對(dui)齊。

對于(yu)大語言模(mo)型實際(ji)使用中的(de)實際(ji)困難和(he)挑(tiao)戰,楊植麟認(ren)為(wei),現在最重要(yao)的(de)挑(tiao)戰可能就是大模(mo)型的(de)安全可控、避免它產生幻覺、無(wu)法(fa)像科學家(jia)一樣創造新(xin)的(de)知識等。

但這些問題不能單點思考,人們應該系統抽象出來這些問題底層本質的問題是什么,在這些方面能舉一反三,如做規模化的(de)高效壓縮(suo),更適合(he)分(fen)布式訓(xun)練的(de)框(kuang)架,支持更長(chang)的(de)上下(xia)文,更好的(de)分(fen)配算力,這些才可(ke)以從根本上(shang)解決AI存在的(de)局(ju)限性。

潘新鋼則(ze)重(zhong)點闡述了(le)GAN和(he)擴散模型的區別,他認為(wei)這兩個模型有三個差異,首先是(shi)性能和(he)效(xiao)率(lv),擴散模型迭(die)代式計(ji)算(suan)所需要的訓(xun)練時間都(dou)更(geng)高,更(geng)大的計(ji)算(suan)開銷也帶來(lai)了(le)更(geng)高的圖像生成(cheng)性能,這說明了(le)擴散模型的上限高于GAN,應用前景更(geng)廣。但對(dui)于性能和(he)計(ji)算(suan)開銷有限制的特(te)定場合,GAN是(shi)妥協的選擇。

第二是GAN和(he)擴散模(mo)(mo)型(xing)的(de)(de)映射,擴散模(mo)(mo)型(xing)對(dui)于(yu)圖像內容的(de)(de)影響表現為較為隨(sui)機(ji),不具有結構化,GAN可(ke)以(yi)有效編(bian)輯(ji)圖像中人的(de)(de)表情、動物姿態等,之后拓(tuo)展到擴展模(mo)(mo)型(xing)是非(fei)常值得探索的(de)(de)。

第三是生(sheng)成空間的(de)連(lian)續性,設(she)計時(shi)擴散(san)模(mo)(mo)型的(de)圖(tu)像空間較為不連(lian)續,跳變的(de)情況,GAN表現出來(lai)比較流暢,看起來(lai)像動畫,把這兩個模(mo)(mo)型各自的(de)優勢互補是非常有趣的(de)研究話題。

大語言模型被看好的垂直領域在他們眼中各有不同,姚期智認為是文(wen)書工作,袁洋認為是醫療,因為大模型基于預訓練的范式,能理解到醫療行業中存在的大量關系,楊植麟則看好個人應用,如AI與人有共同的記憶,通過錄屏把人看到的東西讓AI看到,潘新剛提到了視頻和(he)三維視頻生成,大(da)模型能幫(bang)助藝(yi)術家、設計師創(chuang)造更高(gao)質(zhi)量(liang)的內容。

七、IEEE主席:中國會員數全球第三,看好中國年輕科學家

開幕式上(shang),微軟原執行(xing)副總裁、美(mei)國(guo)國(guo)家工程院外籍院士沈(shen)向(xiang)洋還與IEEE主席兼首席執行(xing)官賽義夫(fu)·拉曼(Saifur Rahman)進(jin)行(xing)了交流。

沒有一個BAT老板的世界人工智能大會,看馬斯克湯曉鷗姚期智們講了啥

IEEE在全球有43萬會員,中國的會員數量為第三大。IEEE正在開發相關的標(biao)準、出版論文、組(zu)織會(hui)議。拉曼提到,IEEE每年都會(hui)舉(ju)辦2000多場(chang)會(hui)議,200場(chang)在中國舉(ju)行。

并且,他強調說,IEEE是開(kai)源的(de),也希望AI整體的(de)發(fa)展都(dou)是開(kai)放的(de),IEEE就提供了一個平臺和基礎(chu)讓工(gong)程(cheng)師、開(kai)發(fa)者能共同討論人力(li)(li)、算力(li)(li)方面(mian)的(de)工(gong)作。

科學(xue)家(jia)要(yao)做開放的(de)研究,同時(shi)需要(yao)一(yi)定的(de)監管(guan)和(he)保障,而IEEE的(de)組(zu)織(zhi)有很大的(de)力(li)量,可(ke)以影響相關的(de)公司和(he)國家(jia)。同時(shi),IEEE的(de)會(hui)議和(he)期刊中(zhong)發表的(de)文章,能(neng)提(ti)高研究人員成果(guo)的(de)可(ke)見度,讓他們(men)的(de)想法變(bian)得更加(jia)實際。

IEEE還將推動專業人士的職業發展,擴充中國IEEE的會員數量。IEEE每年出版(ban)的論文作者中有超30萬個作者來自中國,此前,他們還建立了一個社(she)區,鼓勵更多中國工程師成為IEEE的會(hui)員(yuan)。

并且,其(qi)會議形(xing)式現在多采(cai)用(yong)混(hun)合形(xing)態(tai),可(ke)以通過網上(shang)會議、全息影像確保研(yan)究人員有沉浸感。

最后,拉曼談道,中國年輕人(ren)非常具有(you)好奇心,他們會(hui)問很多問題(ti),并希望自己(ji)成為知名科學家,與此同時,他們努力(li)實現這些(xie)目標的(de)過(guo)程更(geng)為重(zhong)要。

結語:生成式AI熱潮繼續狂飆

ChatGPT掀起的生成式AI熱(re)潮至今已(yi)半年有余,熱(re)度仍然不(bu)減,各類(lei)大(da)模型、聊天機器人(ren)應用(yong)層出不(bu)窮(qiong),成為本屆(jie)世(shi)界人(ren)工智能大(da)會(hui)的一大(da)亮點。

世界人工(gong)智能(neng)大(da)會(hui)作為科技(ji)(ji)圈(quan)最高規格的行業大(da)會(hui),已(yi)經成為全球科技(ji)(ji)行業的參與者展(zhan)示前沿技(ji)(ji)術與最新(xin)科研(yan)成果(guo)的展(zhan)示舞臺。

未來(lai),AGI的(de)(de)到來(lai)是科技(ji)(ji)行業(ye)共同期待的(de)(de)目標(biao),ChatGPT的(de)(de)爆紅只是一個開始,在世(shi)界(jie)人工智能大會上,眾多前沿科技(ji)(ji)成果的(de)(de)露出已經(jing)讓我(wo)們看到AI行業(ye)突飛(fei)猛進的(de)(de)變局(ju)。