
智東西(公眾號:zhidxcom)
作者?| 許麗思
編輯?| 漠影
智東(dong)西7月5日報(bao)道,昨天下(xia)午,2024 WAIC科學(xue)(xue)前(qian)沿全(quan)體會議在上海召開!2024科學(xue)(xue)前(qian)沿全(quan)體會議以“可信AI,善治共享”為主題(ti),請(qing)到了上海人(ren)工智能(neng)實驗(yan)(yan)室(shi)主任、首(shou)席科學(xue)(xue)家(jia)周伯文,中國科學(xue)(xue)技術研究所(suo)黨委書記、中國軟科學(xue)(xue)研究會副理事長趙(zhao)志耘,阿(a)卜杜拉國王科技大學(xue)(xue)人(ren)工智能(neng)計劃負責人(ren)瑞士人(ren)工智能(neng)實驗(yan)(yan)室(shi)(IDSIA)研發(fa)主任Jürgen Schmidhuber,加州大學(xue)(xue)伯克利分(fen)校(xiao)教(jiao)授及綠洲實驗(yan)(yan)室(shi)(Oasis Labs)創始(shi)人(ren)Dawn Song等多位專家(jia)學(xue)(xue)者(zhe)進行演講(jiang)。
會議現場,上(shang)(shang)海人工智(zhi)能(neng)(neng)實(shi)驗(yan)室青年(nian)科學(xue)家陳(chen)凱、上(shang)(shang)海人工智(zhi)能(neng)(neng)實(shi)驗(yan)室領(ling)軍科學(xue)家代季峰(feng)、上(shang)(shang)海人工智(zhi)能(neng)(neng)實(shi)驗(yan)室青年(nian)科學(xue)家白磊發布了多項涉及(ji)書(shu)生(sheng)大模型(xing)的(de)成果(guo),具(ju)體是書(shu)生(sheng)·浦(pu)語InternM2.5、書(shu)生(sheng)萬象多模態大模型(xing)以及(ji)風烏。
上海人工智能實驗室主任、首席科學家周伯文談道,大模型是有幻覺的,但有時候(hou)這種(zhong)幻覺(jue)可以演變(bian)為一種(zhong)創(chuang)造(zao)力,能夠(gou)為推動科學發現帶(dai)來新的可能性,極大發揮大模(mo)型作為新質生產力的潛能。
加州大學伯克利分校教授及綠洲實驗室(Oasis Labs)創始人Dawn Song認為要以負(fu)責任和(he)可信的(de)方式(shi)去部署(shu)AI系統,這其中,就包括了(le)確保AI的可信度、減輕AI的濫(lan)用以及負(fu)責任(ren)的數據使用和價值歸屬。
中(zhong)國(guo)科學技術研(yan)究所(suo)黨(dang)委書記、中(zhong)國(guo)軟科學研(yan)究會副(fu)理事長趙(zhao)志耘發布了(le)《2023全球人工智(zhi)能創新指數(shu)》,針對多(duo)個重(zhong)要(yao)國(guo)家的人工智(zhi)能創新、發展和治理情況進(jin)行量化評估。
其中,中國在所有一級指標上均排名全球第二,聚(ju)集了(le)全球(qiu)人(ren)工智(zhi)能創新(xin)資源(yuan)和(he)成果的絕(jue)大多數,在(zai)人(ren)才(cai)培(pei)養(yang)、科(ke)研產出(chu)和(he)產業發展(zhan)方面取得了(le)明顯進(jin)(jin)(jin)展(zhan),但在(zai)關鍵核心競(jing)爭(zheng)領域尚未形成絕(jue)對優勢。未來,如何在(zai)基(ji)礎支撐、數據資源(yuan)、人(ren)才(cai)培(pei)養(yang)、原始創新(xin)等方面加以改進(jin)(jin)(jin),仍(reng)值(zhi)得進(jin)(jin)(jin)一步深入思索。
一、AGI,生產力背后的生產力
當前,世界正處(chu)于智能(neng)革命的(de)時代。與以往的(de)工業革命不同,這次革命加速了知識的(de)發現(xian)和人(ren)與人(ren)之間的(de)交流,帶來了生產(chan)范式(shi)的(de)徹底變(bian)革。AGI在賦(fu)能(neng)生產(chan)力(li)方面具有廣(guang)泛(fan)的(de)應用,它不僅(jin)是一個重要的(de)工具,更(geng)是生產(chan)力(li)背后的(de)生產(chan)力(li)。
對上海人工智能實驗室主任、首席科學家周伯文而言,他第一次深入思考AGI是在2015-2016年間。當時,他在美國IBM總部做報告,提出了兩個新名詞:狹義人(ren)工智(zhi)能(ANI)和廣義人(ren)工智(zhi)能(ABI)。基于當(dang)時的技術水(shui)平(ping),他認為(wei)通過ANI向AGI過渡需要經歷ABI這一階段。ABI具有(you)自監督學習、端到端完成(cheng)(cheng)任務以及從判別式到生(sheng)成(cheng)(cheng)式的特點。
如今,隨著(zhu)2022年ChatGPT的(de)出現,我們(men)已經進入了ABI時代,這標(biao)志著(zhu)AI技術發展的(de)一個(ge)重要里程碑(bei)。
在2016年的(de)(de)(de)(de)預(yu)測中,他未能預(yu)見到大模型的(de)(de)(de)(de)涌現(xian)能力。盡管如此,他認為從現(xian)在走向AGI的(de)(de)(de)(de)路徑是二維的(de)(de)(de)(de),既要(yao)具備強泛化能力,又要(yao)具備足夠(gou)的(de)(de)(de)(de)專業性(xing)。只有在這兩方(fang)面都(dou)達到較高水平,才能實現(xian)AGI的(de)(de)(de)(de)高價值落(luo)地。
在實現AGI的過程中,需要系統化的思考和規劃,包括基礎模(mo)型層(ceng)、融合協同層(ceng)以及自主進化(hua)與(yu)交付(fu)層(ceng)。在(zai)基(ji)礎模型層(ceng)上(shang)(shang),需(xu)要(yao)不斷地提升更高效(xiao)地獲取模型泛化(hua)的(de)(de)能(neng)(neng)力(li)(li)(li),同(tong)時需(xu)要(yao)更多(duo)(duo)的(de)(de)復(fu)雜任務規劃能(neng)(neng)力(li)(li)(li)、高密度監督性(xing)(xing)的(de)(de)生成能(neng)(neng)力(li)(li)(li)等來輔助;在(zai)融合(he)(he)協同(tong)層(ceng)上(shang)(shang),要(yao)將泛化(hua)性(xing)(xing)和專業(ye)性(xing)(xing)有效(xiao)地結合(he)(he)起(qi)來,可以(yi)采用多(duo)(duo)路線協同(tong)的(de)(de)算(suan)法架構(gou)來獲取比(bi)肩人類水平的(de)(de)專業(ye)能(neng)(neng)力(li)(li)(li);在(zai)自(zi)(zi)主進化(hua)與(yu)交互層(ceng),強(qiang)調 AI 的(de)(de)自(zi)(zi)主探(tan)索與(yu)反饋(kui)閉環(huan)(huan),AI 系統需(xu)要(yao)能(neng)(neng)夠在(zai)真實(shi)或者仿真的(de)(de)世界中(zhong)自(zi)(zi)主的(de)(de)收集數據,學習并適應(ying)環(huan)(huan)境,通(tong)過與(yu)環(huan)(huan)境的(de)(de)交互獲得(de)反饋(kui),從(cong)而實(shi)現自(zi)(zi)我進化(hua)。
周伯文還提到,AGI不僅在生產力方面具有重要意義,還能在科學發現中發揮巨大作用。大模(mo)型的(de)創造(zao)力可以打破(po)信息繭房,提高科研(yan)效(xiao)率,為(wei)未(wei)來的(de)科學研(yan)究提供(gong)新的(de)動力。
2023年初(chu),上(shang)海人(ren)(ren)工智能實驗室訓練了一個生物醫(yi)藥(yao)模(mo)型,讓這(zhe)(zhe)個模(mo)型學習了此前所有(you)的相關(guan)論文。不同(tong)于(yu)Chatgpt回(hui)答人(ren)(ren)提出(chu)的問(wen)題,這(zhe)(zhe)次需要大(da)模(mo)型給人(ren)(ren)提出(chu)問(wen)題。之(zhi)后,大(da)模(mo)型提出(chu)科(ke)學假設,提到(dao)二甲雙胍這(zhe)(zhe)一藥(yao)物對(dui)胃癌患者而言,在性(xing)別(bie)上(shang)有(you)顯著的效果差異。
而這(zhe)一假設此(ci)(ci)前都(dou)從未(wei)被在(zai)論文(wen)中提及。直到(dao) 2023 年3月30 號,在(zai)一篇人類(lei)科學(xue)家的(de)(de)論文(wen)里(li),其中實(shi)(shi)驗的(de)(de)結果證實(shi)(shi)了大模型此(ci)(ci)前的(de)(de)假設,證實(shi)(shi)了二甲(jia)雙胍的(de)(de)療效存在(zai)著顯(xian)著的(de)(de)男女性差異。
通(tong)過(guo)AGI,可以加速(su)從數據中(zhong)發現新的知(zhi)識(shi),推動(dong)各領域(yu)的創新和(he)進步。通(tong)用人(ren)工智能作為未來科技的重要方(fang)向(xiang),不僅在(zai)技術層面具有(you)巨大的挑(tiao)戰和(he)機遇,更將(jiang)在(zai)經濟、社會等(deng)各個(ge)方(fang)面帶來深遠影響。
▲上海人工智能(neng)實驗室(shi)主任、首席(xi)科學家(jia)周伯文
二、AI浪潮之下,國家實驗室與科研平臺的協同之道
中(zhong)國(guo)工(gong)程院院士、國(guo)家流程制造(zao)智能(neng)(neng)調控(kong)技術創(chuang)新中(zhong)心(xin)首席科學(xue)(xue)(xue)家錢鋒(feng),中(zhong)國(guo)工(gong)程院院士、機器人視(shi)覺感(gan)知與(yu)控(kong)制技術國(guo)家工(gong)程研(yan)究(jiu)中(zhong)心(xin)主任(ren)王耀(yao)南,虛擬現實(shi)(shi)技術與(yu)系統(tong)全(quan)國(guo)重點(dian)實(shi)(shi)驗(yan)室(shi)主任(ren)、北京(jing)(jing)航空航天大(da)學(xue)(xue)(xue)副校長呂衛鋒(feng),認知智能(neng)(neng)全(quan)國(guo)重點(dian)實(shi)(shi)驗(yan)室(shi)主任(ren)、中(zhong)國(guo)科學(xue)(xue)(xue)技術大(da)學(xue)(xue)(xue)兼(jian)職(zhi)教授(shou)(shou)胡(hu)國(guo)平,多媒體信(xin)息(xi)處理全(quan)國(guo)重點(dian)實(shi)(shi)驗(yan)室(shi)主任(ren)、北京(jing)(jing)大(da)學(xue)(xue)(xue)教授(shou)(shou)黃鐵軍,腦機智能(neng)(neng)全(quan)國(guo)重點(dian)實(shi)(shi)驗(yan)室(shi)主任(ren)、浙江大(da)學(xue)(xue)(xue)教授(shou)(shou)潘綱,自主智能(neng)(neng)無人系統(tong)全(quan)國(guo)重點(dian)實(shi)(shi)驗(yan)室(shi)常務副主任(ren)、北京(jing)(jing)理工(gong)大(da)學(xue)(xue)(xue)教授(shou)(shou)孫(sun)健,深入探(tan)討了(le)通(tong)用人工(gong)智能(neng)(neng)的(de)眾多研(yan)究(jiu)方向。
人工智能是當今發展新質生產力的重要引擎,但錢鋒提到,這也面臨很多挑戰,尤其是泛化能力以及不(bu)可解釋性。盡管人工智能(neng)(neng)(neng)在推動新技術和(he)生產力(li)方面有巨(ju)大潛力(li),但如何提(ti)升模(mo)型(xing)在未知數據上的表現以及解(jie)釋其決策過(guo)程仍是需要解(jie)決的重要問(wen)題。他(ta)還(huan)特(te)別(bie)強調了專用模(mo)型(xing)在特(te)定領域(yu)的優(you)勢,專用模(mo)型(xing)不僅可以提(ti)供更高的性能(neng)(neng)(neng)和(he)精(jing)確度,還(huan)能(neng)(neng)(neng)夠滿足不同行業和(he)應(ying)用場景的特(te)定需求。
“頂天立地”,是王耀南認為在(zai)AI大(da)模(mo)型的研究與應用過程中至關重要(yao)的兩(liang)個方(fang)面。“頂天(tian)”指(zhi)掌握(wo)大(da)模(mo)型的前沿技(ji)術,深入了解其(qi)體(ti)系架構、推理過程的解釋性(xing)、安全性(xing)和(he)可(ke)信度,避免(mian)將其(qi)視為黑箱。還(huan)要(yao)改(gai)進訓(xun)練算法,提升泛(fan)化能(neng)力(li)(li)和(he)優化效果,同(tong)時關注算力(li)(li)和(he)電力(li)(li)消耗。而“立地”,則指(zhi)AI技(ji)術為各(ge)行各(ge)業(ye)賦能(neng),如(ru)在(zai)智能(neng)制(zhi)造和(he)機器人領域(yu)。他結合自(zi)身專業(ye),指(zhi)出大(da)模(mo)型能(neng)推動(dong)具(ju)身智能(neng)的發展,解決(jue)傳統機器人在(zai)多機器人協同(tong)控制(zhi)中的局限。
呂衛鋒指出,隨著人工智能的發展,虛擬現實技術需求發生重大變化,現在更關注智能化的虛實融合環境及虛擬與現實的無縫銜接。如今,虛擬現實已經從從“3I”(沉浸式、可交互、可構想)發展到“6I”(加上了(le)智(zhi)能(neng)化(hua)、可演進、虛(xu)實貫通),這標志著人(ren)工智(zhi)能(neng)對虛(xu)擬現實的巨大影響。他提到,隨著多模態大模型(xing)的發展,虛(xu)擬現實技術(shu)基礎(chu)軟件平(ping)(ping)臺(tai)也將發生革命性變化(hua),傳(chuan)統的渲染引(yin)擎和模型(xing)構(gou)建平(ping)(ping)臺(tai)將被(bei)新(xin)的智(zhi)能(neng)平(ping)(ping)臺(tai)取(qu)代,而這些智(zhi)能(neng)平(ping)(ping)臺(tai)或許也將帶來更加逼真的交互。
自然語言理解涉及復雜的知識和邏輯,而AI在進行語言理解上仍存在較大挑戰。胡國平介紹,這種挑戰尤其是在理(li)解語境和(he)邏輯推理(li)方面。為提升AI對語言的認(ren)知理解(jie)能(neng)力,認(ren)知智能(neng)全國重點實驗室與科大(da)訊飛、中國科學技(ji)術大(da)學合作,開發出如訊飛星火的大(da)模型,并利用大(da)量(liang)算(suan)力和(he)語料(liao),采用類似人類學習的方式,通過(guo)學習和(he)反饋(kui)不斷(duan)提升機器的性能(neng),使機器能(neng)夠掌(zhang)握細致的語言理解(jie)能(neng)力。
在智能系統中,黃鐵軍認為了“時間”是極其(qi)重要(yao)的,提出(chu)未來的研(yan)究(jiu)方(fang)向是實(shi)時感(gan)知和處(chu)理。具體而(er)言,不僅要(yao)收集靜態數據(ju),還要(yao)實(shi)時獲取和處(chu)理多種感(gan)知信息。他(ta)談到(dao),類(lei)腦智能(neng)(neng)的關(guan)鍵在于處(chu)理不同(tong)感(gan)知通道的信息,并在性能(neng)(neng)上超越(yue)人(ren)類(lei)。智能(neng)(neng)系統應該(gai)比人(ren)類(lei)更快、更強(qiang)大,以確保其(qi)在現實(shi)世界中的實(shi)際應用(yong)和存在意義。人(ren)工智能(neng)(neng)的目標不是替代人(ren)類(lei),而(er)是在性能(neng)(neng)上顯(xian)著優(you)于人(ren)類(lei),以此為方(fang)向推動技術(shu)的發展和應用(yong)。
孫健介紹了(le)自主智(zhi)能(neng)(neng)(neng)(neng)無(wu)人系(xi)統(tong)全國(guo)重點(dian)實(shi)驗室(shi)的研究方向,主要包括協(xie)(xie)同控制、環境感(gan)知(zhi)與理解、無(wu)人系(xi)統(tong)智(zhi)能(neng)(neng)(neng)(neng)發展、仿生(sheng)驅動等。他(ta)提到(dao),實(shi)驗室(shi)在大模型人工智(zhi)能(neng)(neng)(neng)(neng)的影響下(xia),尤其關注(zhu)具(ju)(ju)身智(zhi)能(neng)(neng)(neng)(neng)系(xi)統(tong)的研究。具(ju)(ju)體(ti)來說,實(shi)驗室(shi)致力于發展多(duo)體(ti)智(zhi)能(neng)(neng)(neng)(neng)體(ti)之間的矩陣智(zhi)能(neng)(neng)(neng)(neng),強調(diao)協(xie)(xie)同與協(xie)(xie)作,目(mu)前研究重點(dian)包括環境理解與感(gan)知(zhi)、具(ju)(ju)身智(zhi)能(neng)(neng)(neng)(neng)與環境交互大模型、多(duo)個智(zhi)能(neng)(neng)(neng)(neng)體(ti)之間協(xie)(xie)作與博弈,以及(ji)分布式控制在智(zhi)能(neng)(neng)(neng)(neng)體(ti)間的應用。
三、從過去到未來,AI與神經網絡的演變迭代
20年(nian)前,阿卜(bu)杜拉國王科技大學人(ren)工智能計劃負(fu)責人(ren)、瑞(rui)士人(ren)工智能實驗室(IDSIA)研發主任Jürgen Schmidhuber曾繪制了一幅(fu)關于一個擁有世(shi)界模型的(de)機(ji)器人(ren)圖畫,這個機(ji)器人(ren)能夠通過遞歸的(de)深度鏈來(lai)思考未來(lai),并優化其行(xing)動(dong)序列(lie)。這正(zheng)是今日所(suo)談論的(de)生成(cheng)式AI的(de)基礎。Jürgen Schmidhuber在會(hui)議現(xian)場,對人(ren)工神(shen)經(jing)網絡的(de)發展(zhan)歷程進行(xing)了細致回顧。
人(ren)(ren)工(gong)神(shen)經(jing)(jing)(jing)網絡(luo)靈感來自人(ren)(ren)腦。人(ren)(ren)腦擁有大約(yue)(yue)1000億(yi)個(ge)神(shen)經(jing)(jing)(jing)元(yuan),每個(ge)神(shen)經(jing)(jing)(jing)元(yuan)與其他(ta)1萬個(ge)神(shen)經(jing)(jing)(jing)元(yuan)相(xiang)連,總(zong)共約(yue)(yue)有一百萬億(yi)個(ge)連接。通過學(xue)習,這(zhe)(zhe)些連接的強度會發生(sheng)變化,使系(xi)統(tong)能夠(gou)執行諸如駕駛(shi)汽(qi)車或語音識別等任務(wu)。而神(shen)經(jing)(jing)(jing)網絡(luo)通過模仿這(zhe)(zhe)種(zhong)生(sheng)物神(shen)經(jing)(jing)(jing)連接方式,實現對信息的處理和學(xue)習。
盡管許多人認(ren)為Transformer起(qi)源于(yu)2017年的Google,但實際上(shang)早在1991年,他(ta)就提(ti)出了類似(si)的概念,稱之為“fast way controller”,即(ji)現在的線性(xing)Transformer。這種線性(xing)Transformer的計(ji)算(suan)量隨輸入線性(xing)增長,相較(jiao)于(yu)現代的二(er)次Transformer,其(qi)效率更(geng)高(gao)。線性(xing)Transformer通過減少計(ji)算(suan)復雜度,能(neng)夠顯(xian)著提(ti)高(gao)了處(chu)理(li)速度和效率。
早在1990年,他提出了一個(ge)叫做“人工好奇心(xin)”的概念,即(ji)現在的生成(cheng)(cheng)對抗網(wang)絡。這種網(wang)絡通過兩個(ge)對抗的子(zi)網(wang)絡,一個(ge)生成(cheng)(cheng)輸出,另(ling)一個(ge)預測輸出的后果(guo),從而實(shi)現自我學習。GAN通過這種對抗機(ji)制,使得生成(cheng)(cheng)的內容更加(jia)真(zhen)(zhen)實(shi)和逼真(zhen)(zhen),廣(guang)泛應用于圖(tu)像生成(cheng)(cheng)、視頻生成(cheng)(cheng)等領域。
LSTM是深(shen)度學(xue)習(xi)的(de)(de)重要突破(po),首次(ci)實現了真(zhen)正的(de)(de)深(shen)度網(wang)絡。它通過殘差連接,使得(de)網(wang)絡能夠學(xue)習(xi)長(chang)期依賴(lai)性,并(bing)在自動翻譯、語音識別等方面廣泛應用。LSTM通過其獨特的(de)(de)門控機(ji)制,解(jie)決了傳統神經網(wang)絡在處(chu)理長(chang)序列數(shu)據時的(de)(de)梯(ti)度消(xiao)失問題,從而在自然語言處(chu)理、時間序列預測(ce)等方面取(qu)得(de)了突破(po)性進展。
在(zai)2009年(nian),隨著(zhu)計(ji)算能(neng)力(li)的提升(sheng),深度(du)學(xue)習(xi)開始在(zai)各種(zhong)比賽中取得嶄(zhan)露頭(tou)角(jiao)。2010年(nian),他們利(li)用(yong)Nvidia的GPU,大(da)幅(fu)提升(sheng)了(le)卷積神經(jing)網絡的速度(du),并在(zai)圖像識(shi)別等任務中表(biao)現出(chu)色。盡管這些技術在(zai)20世紀已被(bei)提出(chu),但直到(dao)21世紀才得以廣(guang)泛應(ying)用(yong)。深度(du)學(xue)習(xi)通過大(da)規(gui)模數據(ju)集和強大(da)的計(ji)算能(neng)力(li),極大(da)地(di)提高了(le)模型的性能(neng)和泛化(hua)能(neng)力(li)。
最早的大規模語(yu)言模型基于LSTM,直到2017年Transformer的出現。Transformer極(ji)大地改進了(le)語(yu)言處理的能力,并在生(sheng)成文本、翻譯等方面取(qu)得了(le)顯(xian)著成效。Transformer通過自注意(yi)機制,能夠有效捕捉(zhuo)序列數(shu)據(ju)中的長(chang)距離依賴關系(xi),從而顯(xian)著提升了(le)自然語(yu)言處理任務的性能。
雖然AI在(zai)虛擬世界中(zhong)(zhong)表現(xian)出色,但在(zai)物(wu)理(li)世界中(zhong)(zhong)的(de)應(ying)用(yong)仍然面臨挑戰。為了實(shi)現(xian)這(zhe)一目標,他(ta)專門創建了AI公司,專注于物(wu)理(li)世界中(zhong)(zhong)的(de)自(zi)動化檢(jian)查(cha)等應(ying)用(yong)。通(tong)過(guo)結合(he)硬(ying)件和AI技(ji)術,開發出了領先的(de)自(zi)動化檢(jian)查(cha)系(xi)統。這(zhe)些系(xi)統通(tong)過(guo)高精(jing)度傳(chuan)感器和強大的(de)數(shu)據(ju)處理(li)能(neng)力,實(shi)現(xian)了對復(fu)雜物(wu)理(li)環境的(de)實(shi)時監測和分析,廣泛應(ying)用(yong)于制造、醫療等領域。
Jürgen Schmidhube總結道(dao),未來的AI,需要(yao)在物理世界中實現(xian)更復雜(za)的任務。這需要(yao)AI系統能夠創建(jian)和優化世界模型(xing),并通過層級規劃來實現(xian)高(gao)效(xiao)的行動序列(lie)。通過持(chi)續(xu)改進,期待AI在智能制造、智慧城市、精準醫療(liao)等(deng)領(ling)域發(fa)揮(hui)(hui)更加重要(yao)的作(zuo)用(yong)。在各個領(ling)域,包括醫療(liao)、可持(chi)續(xu)發(fa)展等(deng)方面發(fa)揮(hui)(hui)更大的作(zuo)用(yong)。
▲阿卜杜(du)拉國(guo)王科(ke)技(ji)大(da)學人(ren)(ren)工(gong)智能計(ji)劃負責人(ren)(ren)、瑞士(shi)人(ren)(ren)工(gong)智能實驗(yan)室(IDSIA)研發主任(ren)Jürgen Schmidhuber
四、部署AI系統,要以負責任和可信的方式
AI技術快速發展并廣(guang)泛應用,但(dan)其背后的(de)潛在風險不容(rong)忽視。加州大學伯克利分校教授及綠(lv)洲實(shi)驗室(shi)(Oasis Labs)創始人(ren)Dawn Song,便分享了如何以負(fu)責任和(he)可(ke)信的(de)方式部署AI系統。
隨著AI在各個(ge)領(ling)域的(de)(de)廣(guang)泛應用(yong),攻(gong)擊(ji)者利用(yong)AI系統進(jin)行攻(gong)擊(ji)的(de)(de)可(ke)能性和動機也在增加。這種情況(kuang)使(shi)得確(que)保AI的(de)(de)可(ke)信度、減輕(qing)AI的(de)(de)濫用(yong)以及確(que)保數據(ju)的(de)(de)負責任使(shi)用(yong)和價值歸屬成為當務(wu)之(zhi)急。Dawn Song的(de)(de)演講重點討(tao)論(lun)了三(san)個(ge)主要(yao)挑戰:
一是確保(bao)AI的可信度(du)。可(ke)信(xin)的(de)AI涵蓋了(le)隱(yin)私保護、公平性(xing)和(he)抗毒性(xing)等多個方(fang)面。張松教(jiao)授(shou)特別提到(dao)了(le)隱(yin)私問題,指出神經(jing)網(wang)絡可(ke)能記住訓練數據中(zhong)的(de)敏感(gan)信(xin)息,攻擊者可(ke)以(yi)通(tong)過查詢模型來提取這些信(xin)息。為了(le)應對這一挑戰,她(ta)的(de)團隊開(kai)發了(le)一種名為“曝光削減”的(de)方(fang)法來衡量模型的(de)記憶程度(du),并提出了(le)差分隱(yin)私模型作為潛在解決方(fang)案(an)。
二是減輕AI的濫用。AI技(ji)術的(de)濫用可以(yi)(yi)對(dui)機器系統和(he)人(ren)類造(zao)成巨大影(ying)響(xiang),特別是在語(yu)音克隆(long)、社會工程(cheng)、虛假(jia)信息和(he)釣魚攻擊等領域。Dawn Song提到,通過(guo)建立“設計即安全”的(de)系統,并利(li)用AI技(ji)術進行(xing)程(cheng)序驗證(zheng)和(he)生成,可以(yi)(yi)減少這些濫用帶來的(de)風險。
三是負責任的數據使用和價值歸屬。當前(qian),許多有價(jia)值(zhi)的數(shu)(shu)據被鎖在(zai)數(shu)(shu)據孤(gu)島中,數(shu)(shu)據貢獻者也未能得到公(gong)平(ping)的回報。Dawn Song的團隊開(kai)發了(le)一(yi)種基于Shapley值(zhi)的框架,用于公(gong)平(ping)分配數(shu)(shu)據貢獻的價(jia)值(zhi),推(tui)動(dong)建立負責任的數(shu)(shu)據經濟。
▲加(jia)州(zhou)大學(xue)伯克(ke)利分校教授及綠洲實驗室(shi)(Oasis Labs)創始人Dawn Song
五、直面AI發展挑戰,尋求下一步的革新
人工智能大(da)模型技(ji)術架構是否已經(jing)收斂?大(da)模型與具身智能如(ru)何結合(he)?未來又會有(you)怎樣新的(de)技(ji)術可能性和(he)挑戰?
上(shang)海人工智(zhi)能實驗(yan)室(shi)領軍科(ke)學(xue)家、教授(shou)(shou)林達(da)華與多為青(qing)年科(ke)學(xue)家——上(shang)海人工智(zhi)能實驗(yan)室(shi)青(qing)年科(ke)學(xue)家陸超超、Research Scientist, Google DeepMind Han Zhang、快(kuai)手視覺(jue)生成與互動中心負責人萬鵬飛(fei)、清華大(da)(da)學(xue)交(jiao)叉信息研究院助理(li)(li)教授(shou)(shou)許華哲、加州大(da)(da)學(xue)洛(luo)杉磯分校計算機系助理(li)(li)教授(shou)(shou)周(zhou)博磊、滑鐵盧大(da)(da)學(xue)計算機學(xue)院助理(li)(li)教授(shou)(shou)張(zhang)弘(hong)揚,深入討論下一(yi)代人工智(zhi)能的(de)革新與挑戰。
陸超超在發言中探討了大模型在實際應用中的具體挑戰和可能性。他指出,當前的大模型在許多領域已經展現出了強大的能力,但同時也面臨著一些顯著的問題,如數據量和算力需求的不斷增加,需要在技術和資源(yuan)之間找(zhao)到平衡,避免(mian)過度依賴單(dan)一(yi)的(de)技術路(lu)線。此外,盡(jin)管大模型在許多應(ying)(ying)用場景中(zhong)表現出色,但在某些特定任務中(zhong)仍存在一(yi)定的(de)局限性(xing)。建議研究人(ren)員應(ying)(ying)繼續探索(suo)新的(de)模型架構和優化方(fang)法,以(yi)提(ti)升(sheng)大模型的(de)整體性(xing)能和應(ying)(ying)用范圍。
從早期的GAN到今天的diffusion模型,Han Zhang總結了生成模型的發展歷程和未來方向。他提到,生成技術在圖像分辨率和多模態生成方面取得了顯著進展。不過,雖然diffusion模型在當前階段表現優異,但其并不是最終的解決方案,未來仍需要更多創新。此外,Han Zhang還提出了對資源分配的看法,呼吁在研究中注重探索新的模型家族,而不(bu)僅僅是擴展現有模型的規模,研究(jiu)人員應(ying)利用有限的資源進(jin)行更(geng)廣(guang)泛的創新,而不(bu)是僅僅依賴當前流行的技術(shu)。
萬鵬飛介紹了視(shi)覺內(nei)容生(sheng)成(cheng)的現狀(zhuang)和(he)未來(lai)發(fa)展(zhan),還提及自己團隊在(zai)快(kuai)手開(kai)發(fa)的可(ke)(ke)(ke)靈模(mo)(mo)型(xing)(xing)(xing),并分享了該(gai)模(mo)(mo)型(xing)(xing)(xing)在(zai)文本生(sheng)成(cheng)視(shi)頻方面的應用(yong)(yong)。盡管模(mo)(mo)型(xing)(xing)(xing)在(zai)基礎能(neng)(neng)力(li)上已經取得了顯著進(jin)(jin)展(zhan),但(dan)要實(shi)現大規模(mo)(mo)的實(shi)際應用(yong)(yong)仍面臨許多挑戰,包括(kuo)內(nei)容的可(ke)(ke)(ke)控性和(he)生(sheng)成(cheng)視(shi)頻的持續性。在(zai)實(shi)際應用(yong)(yong)中,需(xu)要不斷提升(sheng)模(mo)(mo)型(xing)(xing)(xing)的性能(neng)(neng),以滿足用(yong)(yong)戶的多樣化需(xu)求(qiu)。他還提到,用(yong)(yong)戶反饋在(zai)改進(jin)(jin)模(mo)(mo)型(xing)(xing)(xing)方面起到了重要作用(yong)(yong),通過開(kai)放模(mo)(mo)型(xing)(xing)(xing)使用(yong)(yong)和(he)收集反饋,可(ke)(ke)(ke)以不斷優化模(mo)(mo)型(xing)(xing)(xing)的功(gong)能(neng)(neng)和(he)效果。
針對大(da)模(mo)(mo)型(xing)在決策和(he)推理(li)(li)中的(de)(de)應(ying)用問(wen)(wen)題(ti),許華哲指出(chu),大(da)模(mo)(mo)型(xing)在處(chu)理(li)(li)某些經典(dian)問(wen)(wen)題(ti)時,如過擬合(he)問(wen)(wen)題(ti)和(he)推理(li)(li)能力不足(zu),可(ke)能會產生錯誤的(de)(de)結(jie)果。大(da)模(mo)(mo)型(xing)在解決NP難題(ti)和(he)優化(hua)問(wen)(wen)題(ti)中還存(cun)在著局限性(xing),當前模(mo)(mo)型(xing)在這些復雜任務中尚未展現出(chu)突(tu)破性(xing)的(de)(de)能力。他建議在與大(da)模(mo)(mo)型(xing)交互的(de)(de)過程中,需要不斷(duan)調(diao)整和(he)優化(hua)模(mo)(mo)型(xing),持(chi)續探索和(he)改(gai)進(jin)大(da)模(mo)(mo)型(xing)的(de)(de)推理(li)(li)和(he)決策能力,以應(ying)對各種復雜和(he)變化(hua)的(de)(de)應(ying)用場景。
大模型與(yu)具身(shen)(shen)智(zhi)能(neng)的(de)(de)(de)(de)結合,既帶(dai)來了無(wu)限可(ke)能(neng)性,但也蘊含著(zhu)巨(ju)大挑戰。周(zhou)博磊指出,大模型在(zai)生成新(xin)的(de)(de)(de)(de)訓練環境(jing)和模擬復雜場景方(fang)(fang)面具有(you)巨(ju)大潛力(li),可(ke)以(yi)用(yong)(yong)于提升具身(shen)(shen)智(zhi)能(neng)的(de)(de)(de)(de)訓練效(xiao)(xiao)果。他(ta)提到,通過大模型引導智(zhi)能(neng)體在(zai)虛擬環境(jing)中(zhong)學習,可(ke)以(yi)更(geng)有(you)效(xiao)(xiao)地解決自動駕駛等領(ling)(ling)域中(zhong)的(de)(de)(de)(de)長尾問(wen)題。另外,大模型與(yu)具身(shen)(shen)智(zhi)能(neng)的(de)(de)(de)(de)結合是未(wei)來研究的(de)(de)(de)(de)重要方(fang)(fang)向,能(neng)夠帶(dai)來更(geng)多的(de)(de)(de)(de)創新(xin)和突破,應(ying)在(zai)這一領(ling)(ling)域投入更(geng)多資源和精力(li),探索新(xin)的(de)(de)(de)(de)應(ying)用(yong)(yong)場景和技(ji)術(shu)路徑,以(yi)推動智(zhi)能(neng)技(ji)術(shu)的(de)(de)(de)(de)發展和應(ying)用(yong)(yong)。
當前,大模型在提升能力方面受限于數據和算力的瓶頸,互聯網數據資源已經接近飽和,而算力的增加成本高昂。張弘揚提到,OpenAI等公司為訓練大模型投入了大量資源,但這種方式并非可持續。他建議,通過生成式數據和模擬數據來訓練模型,提升模型的自我進化能力是一條可行的路徑。從短期來看,需要在數據和算力之間找到平衡,而從長期(qi)來看,需要探索(suo)新的方法和(he)(he)技術,以突(tu)破(po)當前的瓶頸(jing),提升大模型(xing)的整體性(xing)能和(he)(he)應用(yong)范圍。
六、3項成果1項指數,從創新成果到量化評估
2024 WAIC科(ke)學前(qian)沿全體會議上,上海人工(gong)智(zhi)能實驗室發布(bu)(bu)了(le)多項涉(she)及(ji)書生(sheng)(sheng)大(da)(da)模(mo)型的最新(xin)成果(guo),包含書生(sheng)(sheng)·浦語InternM2.5、書生(sheng)(sheng)萬象多模(mo)態(tai)大(da)(da)模(mo)型以及(ji)風(feng)烏。中國科(ke)學技術研究所黨(dang)委(wei)書記(ji)、中國軟(ruan)科(ke)學研究會副(fu)理(li)事長(chang)趙(zhao)志(zhi)耘發布(bu)(bu)了(le)《2023全球人工(gong)智(zhi)能創新(xin)指(zhi)數(shu)》,針對(dui)46個重要國家(jia)的人工(gong)智(zhi)能創新(xin)、發展和(he)治理(li)情況進(jin)行量(liang)化評(ping)估(gu)。
書生·浦語InternM2.5
書(shu)生·浦語2.5具備強大推(tui)理(li)(li)能力,能夠解鎖(suo)復雜任務(wu)。相比(bi)上(shang)一代(dai)模(mo)型(xing)(xing),其推(tui)理(li)(li)性能提(ti)升了20%,領先國內外(wai)的(de)(de)同(tong)量級開(kai)源模(mo)型(xing)(xing),并在多個權威推(tui)理(li)(li)評測集(ji)上(shang)實現了大幅的(de)(de)性能提(ti)升,尤(you)其在數學評測集(ji) math 上(shang)更是提(ti)升了100%。和(he)(he)最新(xin)的(de)(de)開(kai)源模(mo)型(xing)(xing)相比(bi),書(shu)生葡語 2.5 在絕大部分的(de)(de)數據集(ji)上(shang)也領先于同(tong)量級模(mo)型(xing)(xing),包括拉瑪(ma) 3 和(he)(he)上(shang)周谷歌(ge)剛發布的(de)(de) JMA 2 和(he)(he) LLAMA 3 的(de)(de) 70B 模(mo)型(xing)(xing)。
書(shu)生·浦語2.5支持 100 萬(wan)(wan) token 的上(shang)下(xia)文(wen)長文(wen)本,在(zai)(zai)長文(wen)檔處理方面位于開(kai)原模(mo)型(xing)的前列。在(zai)(zai)一項測試中(zhong),科研人員(yuan)上(shang)傳了新(xin)唐(tang)書(shu)的文(wen)檔,并讓(rang)模(mo)型(xing)總結(jie)唐(tang)朝文(wen)學風(feng)格(ge)的三次變化。最終,模(mo)型(xing)能夠從幾十萬(wan)(wan)字的文(wen)言文(wen)中(zhong)準確地引(yin)用相關的信息,并且進(jin)行回復(fu)。
在(zai)解(jie)決復(fu)雜(za)問(wen)題(ti)(ti)上,書生·浦語(yu) 2.5 也有著獨特的(de)(de)創新。模型(xing)能夠模擬人的(de)(de)思(si)維過(guo)程(cheng),根據用戶需(xu)求進行問(wen)題(ti)(ti)分析(xi),然后規劃(hua)思(si)維路(lu)徑,再拆分成需(xu)要解(jie)決的(de)(de)子問(wen)題(ti)(ti),每個子問(wen)題(ti)(ti)都會通過(guo)大規模的(de)(de)網絡(luo)搜索(suo)、篩選(xuan)和(he)信息(xi)整合,最終得到回復(fu)。基于這樣的(de)(de)多智能體協同框架,能夠解(jie)決復(fu)雜(za)的(de)(de)信息(xi)調研和(he)分析(xi)場景。與人類(lei)專家(jia)相比,效率提升了 60 倍。
書(shu)(shu)(shu)生(sheng)·浦(pu)語2.5也實現(xian)了(le)全鏈條(tiao)開(kai)源(yuan),兼(jian)容常用大(da)模型開(kai)源(yuan)工(gong)具,與社(she)區生(sheng)態(tai)無縫(feng)連接。在書(shu)(shu)(shu)生(sheng)·浦(pu)語開(kai)源(yuan)社(she)區、書(shu)(shu)(shu)生(sheng)大(da)模型實戰營和(he)和(he)浦(pu)源(yuan)大(da)模型挑(tiao)戰賽上涌(yong)現(xian)出了(le)大(da)量優秀的(de)生(sheng)態(tai)項目。從垂類模型到(dao)智(zhi)能(neng)體應(ying)用,從軟件(jian)到(dao)硬件(jian),這些創意被應(ying)用于(yu)各個領域。如(ru)今,已經(jing)有接近 1, 000 個基于(yu)書(shu)(shu)(shu)生(sheng)浦(pu)語大(da)模型的(de)開(kai)源(yuan)項目。
書生萬象多模態大模型
書生萬象(xiang)作為一個開源多(duo)(duo)模(mo)(mo)態大(da)模(mo)(mo)型,關鍵評測(ce)指(zhi)標比肩國際(ji)頂尖的商用(yong)閉源模(mo)(mo)型,支(zhi)持圖像、視頻、文(wen)本、語音、三維醫療等多(duo)(duo)種(zhong)(zhong)模(mo)(mo)態,擁有豐富(fu)的輸出格(ge)式,支(zhi)持百(bai)種(zhong)(zhong)下游任(ren)務,性能媲(pi)美任(ren)務專用(yong)模(mo)(mo)型。
書生萬象模型(xing)的(de)核心技術在(zai)于(yu)漸(jian)進式(shi)預訓(xun)練(lian)(lian)、漸(jian)進式(shi)對(dui)齊(qi)訓(xun)練(lian)(lian)。在(zai)訓(xun)練(lian)(lian)過(guo)程的(de)早(zao)期(qi),采用(yong)小語(yu)言(yan)模型(xing)加(jia)(jia)大(da)數(shu)據的(de)方(fang)案,加(jia)(jia)快視覺模型(xing)的(de)預訓(xun)練(lian)(lian)的(de)進度(du),訓(xun)練(lian)(lian)后期(qi)替換為(wei)大(da)語(yu)言(yan)模型(xing)加(jia)(jia)少量高質量的(de)數(shu)據高效對(dui)齊(qi)。通過(guo)模型(xing)從(cong)(cong)小到大(da)、數(shu)據從(cong)(cong)粗到精(jing)的(de)漸(jian)進式(shi)訓(xun)練(lian)(lian)策略(lve),以較低的(de)成(cheng)(cheng)本完成(cheng)(cheng)了大(da)模型(xing)的(de)訓(xun)練(lian)(lian),在(zai)有限(xian)資源(yuan)下展現(xian)出了卓越(yue)的(de)性(xing)能(neng)表現(xian)。
在(zai)多(duo)(duo)個(ge)基(ji)準測試中,書(shu)生萬(wan)象(xiang)模(mo)型的(de)性能表(biao)現(xian)亮眼。在(zai)多(duo)(duo)個(ge)多(duo)(duo)模(mo)態(tai)(tai)評測領域的(de)核(he)心關鍵指標,包括多(duo)(duo)模(mo)態(tai)(tai)理(li)解(jie)(jie)、數(shu)學問題解(jie)(jie)答(da)、圖(tu)表(biao)理(li)解(jie)(jie)、文(wen)檔(dang)問答(da)及光學字(zi)符識別等等,跟(gen)其他的(de)開源(yuan)多(duo)(duo)模(mo)態(tai)(tai)模(mo)型相比,書(shu)生萬(wan)象(xiang)在(zai)各個(ge)評測維(wei)度上領先(xian)。而與世界頂(ding)尖的(de)閉源(yuan)商用模(mo)型相比,書(shu)生萬(wan)象(xiang)多(duo)(duo)模(mo)態(tai)(tai)模(mo)型也取得了和國(guo)際(ji)頂(ding)尖的(de) GPT 4o、?GPT 4v 、Claude 3 、Gemini Pro 1.5 模(mo)型相當(dang)的(de)性能,并且(qie)優于國(guo)內(nei)閉源(yuan)商用多(duo)(duo)模(mo)態(tai)(tai)模(mo)型的(de)最優性能。
具(ju)體(ti)而言(yan),在圖(tu)像理(li)解(jie)方面,書(shu)生(sheng)萬(wan)象(xiang)模(mo)(mo)(mo)型不僅能夠理(li)解(jie)單圖(tu),還具(ju)有強大的(de)(de)多圖(tu)理(li)解(jie)能力,能夠綜合(he)(he)跨圖(tu)信息進(jin)行(xing)內容理(li)解(jie)。綜合(he)(he)跨圖(tu)信息對于視頻內容的(de)(de)理(li)解(jie)和復雜(za)圖(tu)文內容的(de)(de)解(jie)析來說(shuo)非常重要,而書(shu)生(sheng)萬(wan)象(xiang)便能為這(zhe)類(lei)關(guan)鍵應(ying)用提供強大的(de)(de)智力支(zhi)持(chi)。另外,為了適(shi)應(ying)廣泛的(de)(de)多模(mo)(mo)(mo)態(tai)任務(wu),書(shu)生(sheng)萬(wan)象(xiang)模(mo)(mo)(mo)型也采用通專融合(he)(he)技術,具(ju)有豐富的(de)(de)輸出格式,支(zhi)持(chi)超過百種任務(wu)。
風烏
風(feng)(feng)烏(wu)氣象(xiang)(xiang)海洋全方(fang)位預(yu)報(bao)體系,覆(fu)蓋了(le)海洋、陸地、高空三維空間的(de)(de)多種(zhong)核心要素(su)。從風(feng)(feng)烏(wu)第一(yi)個(ge)版本的(de)(de)全球(qiu)中期氣象(xiang)(xiang)預(yu)報(bao)大(da)模(mo)型開始(shi),通過不斷的(de)(de)人(ren)工智(zhi)能技術創(chuang)新,開發了(le)風(feng)(feng)烏(wu)Extreme、風(feng)(feng)烏(wu)短(duan)臨、風(feng)(feng)烏(wu)GHR、風(feng)(feng)烏(wu)Adas和風(feng)(feng)烏(wu)ORCA一(yi)系列的(de)(de)氣候海洋預(yu)報(bao)大(da)模(mo)型,逐漸形成了(le)涵蓋 0- 3 小時(shi)的(de)(de)短(duan)鄰(lin)、 0- 14 天(tian)的(de)(de)中短(duan)期和多年(nian)到年(nian)季尺度(du)的(de)(de)全周期預(yu)報(bao)體系。
針對(dui)可能(neng)突(tu)然(ran)到(dao)來的(de)極端小范圍(wei)的(de)天氣事(shi)件,上海(hai)人工智能(neng)實(shi)驗室和上海(hai)市(shi)氣象(xiang)局合(he)作共同研發了強(qiang)對(dui)流天氣預報(bao)大模(mo)(mo)型,實(shi)現(xian)對(dui)區(qu)域 1 千米高分辨率的(de)強(qiang)降水預報(bao)。通過(guo)采用生成式模(mo)(mo)型和確(que)定(ding)式級聯建(jian)模(mo)(mo)的(de)方式,風烏(wu)短(duan)鄰預報(bao)模(mo)(mo)型可以同時建(jian)模(mo)(mo)中尺(chi)度的(de)大氣系統和小尺(chi)度的(de)對(dui)流過(guo)程(cheng),從(cong)而準確(que)的(de)預報(bao)整體(ti)的(de)強(qiang)對(dui)流強(qiang)度和趨勢。
全(quan)球氣(qi)象(xiang)預(yu)報的(de)分(fen)辨率提升是一件極具挑戰性的(de)事情(qing),但風烏(wu)GHR僅用了(le)不到一年時間就將(jiang)分(fen)辨率從 25 千(qian)(qian)米提高(gao)到了(le) 9 千(qian)(qian)米,首次實現基于人工智能的(de)全(quan)球 10 公里中(zhong)期天氣(qi)建模與預(yu)報,其(qi)分(fen)辨率較(jiao)已有(you)模型提高(gao)了(le) 7 倍以上,達(da)到了(le)全(quan)球領先水(shui)平。而且在(zai)這個版(ban)本上,進一步支持了(le)對降水(shui)、太陽輻射、百米風速等的(de)精準預(yu)測,以更好地滿足社(she)會各界對高(gao)精度氣(qi)象(xiang)預(yu)報的(de)需求。
風(feng)烏Adas是全(quan)球首個(ge)端(duan)到端(duan)的(de)全(quan)球氣(qi)(qi)象(xiang)預報大模(mo)型,通過(guo)人工智能方法同(tong)時來進行(xing)數據同(tong)化和氣(qi)(qi)象(xiang)預測。相比(bi)已有的(de)方法,風(feng)烏Adas可(ke)以(yi)直接基于原(yuan)始的(de)觀(guan)測數據獨立運行(xing),擺脫了(le)現在的(de) AI 大模(mo)型都對(dui)物(wu)理(li)分析場的(de)依(yi)賴。同(tong)時,得(de)益于 AI 算法的(de)高效(xiao)性,風(feng)烏ADA相比(bi)傳(chuan)統的(de)同(tong)化方法運行(xing)效(xiao)率提升(sheng)了(le) 1 000 倍以(yi)上。
《2023全球人工智能創新指數》
中(zhong)國科學(xue)技術(shu)研究所(suo)黨委書(shu)記、中(zhong)國軟科學(xue)研究會(hui)副(fu)理事長趙(zhao)志耘發布(bu)《2023全球人工(gong)智(zhi)能創新指數》,該報(bao)告由中(zhong)國科學(xue)技術(shu)信息研究所(suo)和(he)北京大學(xue)共同研制(zhi),是第四次在上海世(shi)界人工(gong)智(zhi)能大會(hui)上發布(bu)。
報告(gao)從(cong)基礎支撐、資源(yuan)與環境、國(guo)際合作交(jiao)流(liu)等(deng)五大維度,通過構建三(san)層的三(san)級(ji)指標體(ti)系,對46個(ge)重要(yao)國(guo)家(jia)的人(ren)工(gong)智能創(chuang)新(xin)、發展和治理情(qing)況進行量化評估。目標是全面、客觀地反映全球人(ren)工(gong)智能創(chuang)新(xin)、發展和治理的態勢,并明確(que)中(zhong)國(guo)在其中(zhong)的位置。
2023年的(de)報告在保持五個基(ji)本一級指(zhi)標(biao)(biao)體(ti)系框架(jia)不變(bian)的(de)基(ji)礎上,根據最(zui)新的(de)全球(qiu)進展,對(dui)二級和(he)三(san)級指(zhi)標(biao)(biao)進行了(le)優化和(he)微(wei)調。例如,增加(jia)了(le)數據基(ji)礎開(kai)源項目,并調整了(le)反映國(guo)際智力參與程度的(de)學術交流和(he)國(guo)際智力參與指(zhi)標(biao)(biao)。
評價結果顯示,中國和美國在全球人工智能創新中繼續引領,46個國家形成四個梯隊。中美兩國在第一梯隊中的優勢進一步擴大。美國在五個一級指標、14個二級指標中的9個和37個三級指標中的17個排名世界第一。中國在所有一級指標上均排名全球第二(er),聚集了全球人(ren)工智能創新資源和成果的絕大多數。
第二梯隊的國(guo)(guo)家(jia)競爭激烈,但與第一梯隊的差距(ju)在(zai)進一步拉大。例如,英國(guo)(guo)在(zai)教育資源和高質(zhi)量學術研(yan)究方(fang)面(mian)突出,日本在(zai)專利方(fang)面(mian)具有優勢,德國(guo)(guo)在(zai)產業和應(ying)用方(fang)面(mian),特別(bie)是(shi)人工(gong)智能風險投資和國(guo)(guo)內市(shi)場規(gui)模(mo)方(fang)面(mian)表(biao)現優異。
第三(san)(san)梯(ti)隊中,印(yin)度連(lian)續三(san)(san)年(nian)排名上(shang)升,沙特阿拉伯今(jin)年(nian)首次進入(ru)第三(san)(san)梯(ti)隊。第四梯(ti)隊國家(jia)在(zai)科技研(yan)發和產業應用方(fang)面進展較弱,但也有個別國家(jia)如巴(ba)西(xi)和印(yin)度尼西(xi)亞在(zai)人(ren)工智(zhi)能開源項目(mu)數(shu)和風險(xian)投(tou)資方(fang)面表現突出(chu)(chu),顯示出(chu)(chu)開源項目(mu)和人(ren)工智(zhi)能應用的重要性。
全球人工智能創新發展趨勢有四個特點:一是大模型突破加快了技術創新,自然語言處理和多模態模型在創新發展中起重要作用。二是產業界(jie)在模(mo)型開發上(shang)的優勢擴大,2023年產研發的機器學習模型數量達176個,比學界高3.5倍。三是生成式人工智能開(kai)源項目(mu)激增,開源成為重要的創新研發模式。四是人工智能(neng)企(qi)業新(xin)增數量(liang)增長,創業(ye)創投(tou)低(di)迷(mi)趨勢(shi)有所扭轉(zhuan),2023年新增企(qi)業(ye)數量(liang)同(tong)比(bi)上漲21.5%。
中國在(zai)(zai)全球人工(gong)智能發展(zhan)中的綜合水平(ping)保持第(di)二,在(zai)(zai)人才(cai)培養、科研(yan)產出和產業發展(zhan)方(fang)面取得(de)了明顯進展(zhan),但在(zai)(zai)關鍵核心競爭(zheng)領(ling)域沒有形成絕對優勢。
未來,趙志(zhi)耘希望在基礎(chu)支(zhi)撐上進一步加(jia)強數(shu)據資(zi)源建設(she),健(jian)全公(gong)共(gong)數(shu)據開放共(gong)享機制,建設(she)安(an)全、合規(gui)、大規(gui)模、高質(zhi)量(liang)的語料庫。同時,加(jia)大高層次人(ren)才引進力度,創造寬容(rong)失敗的科(ke)研環境。在科(ke)研科(ke)技(ji)研發創新上,強化(hua)前瞻(zhan)部署和原始創新,搶抓具(ju)身智能和類腦(nao)智能的機遇。加(jia)快(kuai)高水平、規(gui)模化(hua)應用(yong),聚焦關鍵(jian)領域(yu),打(da)造具(ju)有技(ji)術先(xian)進性(xing)和規(gui)模化(hua)潛力的應用(yong)場(chang)景,推動(dong)大小模型的協同落地。
▲中國(guo)科學(xue)技術研(yan)究所黨(dang)委書記、中國(guo)軟科學(xue)研(yan)究會副理事長趙志耘
結語:大模型突破加快技術創新?AGI能為社會創造更多福祉
齊聚一眾頂尖的人(ren)工(gong)智能專家(jia)的WAIC科學前沿會議,不僅熱議當(dang)下的技(ji)術(shu)熱點、展現突(tu)飛猛進的技(ji)術(shu)格局,也以一種思索技(ji)術(shu)所存在的挑戰(zhan)與風(feng)險(xian)的姿態,去瞭望更加遠大(da)的技(ji)術(shu)未來。
在突飛猛進的(de)技(ji)術浪(lang)潮之中,大(da)模(mo)型的(de)突破極大(da)地加快了技(ji)術創新,生(sheng)成(cheng)式人工智能(neng)開(kai)源項目激增,開(kai)源成(cheng)為重(zhong)要的(de)創新研發模(mo)式。
未來,隨著AGI這一(yi)生(sheng)產(chan)力(li)背(bei)后的(de)生(sheng)產(chan)力(li)的(de)進一(yi)步發展進化,我們也期待通(tong)過不斷的(de)努力(li)和(he)探索,推動AGI的(de)技(ji)術突破和(he)價值(zhi)實現,為人類社(she)會創造(zao)更多的(de)福祉。