智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影

智東西(xi)10月31日報道,在今日舉行的2023云(yun)棲大會上,阿里云(yun)正(zheng)式發布(bu)千(qian)(qian)億級參數(shu)大模(mo)型通(tong)義(yi)千(qian)(qian)問(wen)(wen)2.0。在10個(ge)權威測評中,通(tong)義(yi)千(qian)(qian)問(wen)(wen)2.0綜合(he)性能超過GPT-3.5和Llama 2,正(zheng)在加速追趕GPT-4。當天,通(tong)義(yi)千(qian)(qian)問(wen)(wen)APP在各(ge)大手機應用市場正(zheng)式上線,所(suo)有人都(dou)可通(tong)過APP直接(jie)體驗最新(xin)模(mo)型能力(li)。

阿(a)(a)里(li)云(yun)(yun)CTO周靖人談道,面向智能時代,阿(a)(a)里(li)云(yun)(yun)將通過從(cong)底層算力到人工智能(AI)平臺再到模型服(fu)務的(de)全棧技術(shu)創新,升(sheng)(sheng)級云(yun)(yun)計(ji)算體系,打(da)造一朵AI時代最(zui)開放(fang)的(de)云(yun)(yun)。除(chu)了(le)發(fa)布通義(yi)千(qian)問(wen)2.0外,周靖人還公布了(le)云(yun)(yun)計(ji)算基礎能力的(de)最(zui)新進展,升(sheng)(sheng)級了(le)AI平臺,并發(fa)布一站式(shi)模型應(ying)用開發(fa)平臺阿(a)(a)里(li)云(yun)(yun)百煉。

阿里云通義千問2.0發布!綜合性能超過GPT-3.5,APP正式上線

“目前,中國有一半大模型企業跑(pao)在(zai)阿(a)里(li)(li)云上,280萬(wan)AI開發者活躍在(zai)阿(a)里(li)(li)云魔搭社(she)區上,未(wei)來,阿(a)里(li)(li)云將攜手千行百業推動AI創新,共享技術紅利。”周靖(jing)人透露說,阿(a)里(li)(li)云計劃近期(qi)開源(yuan)通義千問72B版(ban)(ban)本(ben),這將將成為中國參(can)數最大的開源(yuan)模型,此前阿(a)里(li)(li)云已先后開源(yuan)7B和14B版(ban)(ban)本(ben)模型,模型累計下載量超過100萬(wan)。

阿里云通義千問2.0發布!綜合性能超過GPT-3.5,APP正式上線

一、通義千問2.0得分超過GPT-3.5,8個行業大模型組團上線

過(guo)去6個(ge)月,通(tong)義千問(wen)2.0在性(xing)能上(shang)取(qu)得(de)巨(ju)大飛躍(yue),相(xiang)比4月發布的(de)1.0版本(ben),通(tong)義千問(wen)2.0在復雜指令(ling)理(li)解、文(wen)學(xue)創作、通(tong)用數學(xue)、知識記憶、幻覺抵御等(deng)能力上(shang)均有(you)顯著提升。目(mu)前,通(tong)義千問(wen)的(de)綜合性(xing)能已經超過(guo)GPT-3.5,加速追趕GPT-4。

在MMLU、C-Eval、GSM8K、HumanEval、MATH等10個主流(liu)Benchmark測評集上,通(tong)義千問2.0的得分整體(ti)超越Meta的Llama-2-70B,相(xiang)(xiang)比OpenAI的Chat-3.5是九勝一(yi)負,相(xiang)(xiang)比GPT-4則是四勝六負,與GPT-4的差距(ju)進一(yi)步(bu)縮小。

阿里云通義千問2.0發布!綜合性能超過GPT-3.5,APP正式上線

中(zhong)英文(wen)理解能(neng)力是大(da)語言模型的(de)基(ji)本(ben)功。英語任務方(fang)面(mian),通(tong)義千問(wen)2.0在MMLU基(ji)準的(de)得分是82.5,僅次于GPT-4,通(tong)過大(da)幅增加參數量,通(tong)義千問(wen)2.0能(neng)更(geng)(geng)好地理解和處理復(fu)雜的(de)語言結構和概念;中(zhong)文(wen)任務方(fang)面(mian),通(tong)義千問(wen)2.0以明顯(xian)優勢在C-Eval基(ji)準獲得最高得分,這(zhe)是由于模型在訓練中(zhong)學習(xi)了更(geng)(geng)多中(zhong)文(wen)語料,進(jin)一步強(qiang)化了中(zhong)文(wen)理解和表(biao)達能(neng)力。

在數(shu)學推理(li)(li)、代碼理(li)(li)解等領(ling)域,通義(yi)千問2.0進步(bu)明顯。在推理(li)(li)基準測試GSM8K中(zhong),通義(yi)千問排名第二(er),展示了強大(da)的計(ji)算和邏(luo)輯推理(li)(li)能力;在HumanEval測試中(zhong),通義(yi)千問得分緊跟GPT-4和GPT-3.5,該測試主(zhu)要衡量大(da)模(mo)型(xing)理(li)(li)解和執行(xing)代碼片段的能力,這一(yi)能力是大(da)模(mo)型(xing)應用于編程輔(fu)助、自(zi)動(dong)代碼修復等場景的基礎。

通(tong)義千問2.0還(huan)變得更(geng)加好用,在指(zhi)令遵循、工具使用、精細化(hua)創作等方面(mian)作了技術優化(hua),能夠更(geng)好地被下游應用場(chang)景集成。通(tong)義大(da)模型官網上線了多模態和插件功能,支持圖片輸(shu)入(ru)、文(wen)檔解析等細分任務。

同時,基于通(tong)義(yi)大(da)模(mo)型訓練的8大(da)行業大(da)模(mo)型組團上線,分別(bie)是通(tong)義(yi)靈碼-智能編碼助手(shou)、通(tong)義(yi)智文-AI閱讀助手(shou)、通(tong)義(yi)聽悟-工作學(xue)習AI助手(shou)、通(tong)義(yi)星塵-個性化(hua)角色(se)創(chuang)作平臺、通(tong)義(yi)點金-智能投研助手(shou)、通(tong)義(yi)曉(xiao)蜜-智能客服、通(tong)義(yi)仁心-個人專(zhuan)屬健康助手(shou)、通(tong)義(yi)法睿-AI法律(lv)顧(gu)問。

阿里云通義千問2.0發布!綜合性能超過GPT-3.5,APP正式上線

其中(zhong),智能編碼助手通義(yi)靈碼已在阿(a)里(li)云內部(bu)大規模采用(yong)(yong),廣(guang)受好評(ping);工作學習AI助手通義(yi)聽悟每天(tian)處理5萬余個音視頻,累積用(yong)(yong)戶超(chao)100萬。

8大(da)行業模(mo)型(xing)面(mian)向當下(xia)最受歡迎的多(duo)個垂直(zhi)場景,使用(yong)領(ling)域數據進行專門訓(xun)練。用(yong)戶(hu)可以在官(guan)網直(zhi)接體(ti)驗模(mo)型(xing)功能,開發者可以通過網頁嵌入、API/SDK調用(yong)等(deng)方式,將模(mo)型(xing)能力(li)集成到自己的大(da)模(mo)型(xing)應用(yong)和服務中。

截至10月,阿里云已與60多個(ge)行(xing)業頭部伙伴(ban)進行(xing)深度(du)合(he)作(zuo),推(tui)動通義千(qian)問在(zai)辦公(gong)、文旅、電力、政務、醫保、交(jiao)通、制造、金融(rong)、軟件開發等領域的(de)落(luo)地。

二、“中國一半大模型公司跑在阿里云上”

阿里云(yun)通(tong)義(yi)大模型(xing)系(xi)列基于(yu)人工智能(neng)平(ping)臺PAI訓練而(er)成(cheng)。

據介紹(shao),除了通義(yi)大(da)模型(xing),中國一(yi)半大(da)模型(xing)公司跑在阿里(li)云上,百(bai)川(chuan)智能、智譜AI、零一(yi)萬(wan)物、昆(kun)侖萬(wan)維、vivo、復旦大(da)學等大(da)批頭部企業及機構均在阿里(li)云上訓練大(da)模型(xing)。

通(tong)(tong)義系列(lie)、Baichuan系列(lie)、智譜AI ChatGLM系列(lie)、姜子牙(ya)通(tong)(tong)用大模(mo)型等國(guo)內眾多頭部(bu)主流(liu)大模(mo)型,都(dou)已(yi)通(tong)(tong)過阿里云(yun)對外提供API服務(wu)。

“百川成立僅半年便(bian)發布(bu)了(le)7款大模型,快(kuai)速迭(die)代背(bei)后離不開(kai)云計算的支(zhi)持(chi)。”百川智能創始人兼CEO王小川說。

百(bai)川智能和阿里云(yun)進行了深入合作,在雙方的共同(tong)努力下,百(bai)川很好地完成了千卡大模(mo)(mo)型訓(xun)練任務,有(you)效降(jiang)低了模(mo)(mo)型推理(li)成本,提(ti)升(sheng)了模(mo)(mo)型部署(shu)效率。

基(ji)礎模(mo)(mo)型(xing)(xing)的(de)質量很大(da)程度(du)決定了(le)AI產(chan)業化(hua)的(de)前景。訓練大(da)模(mo)(mo)型(xing)(xing)是囊括(kuo)了(le)算(suan)力(li)底座、網絡、存儲、大(da)數據、AI框架、AI模(mo)(mo)型(xing)(xing)等復雜技術的(de)系統性(xing)工(gong)程,只有強大(da)的(de)云計算(suan)體系才(cai)能訓練出高質量的(de)大(da)模(mo)(mo)型(xing)(xing)。

周靖人談道(dao),2009年阿(a)里云就提出“數據中心(xin)是一臺(tai)(tai)計算(suan)機(ji)”的理念(nian),今天AI時代更加(jia)需(xu)要這樣(yang)的技術體(ti)系。作為一臺(tai)(tai)超級計算(suan)機(ji)的云計算(suan),可高效連接異構計算(suan)資源,突破單一性(xing)能芯片瓶頸,協同(tong)完成大(da)規模智能計算(suan)任務。

為了(le)保(bao)證大模型訓練(lian)的穩(wen)定互聯和高效(xiao)并行計算,阿里(li)云全新升(sheng)級了(le)人工智能平臺PAI。

阿里云通義千問2.0發布!綜合性能超過GPT-3.5,APP正式上線

PAI底層采用HPN 7.0新一代AI集(ji)群網絡架構,支持(chi)高(gao)達10萬(wan)卡量級的集(ji)群可(ke)擴展規模,超大規模分布式(shi)訓練加速(su)比高(gao)達96%,遠超業界水平;在大模型(xing)訓練任務中,可(ke)節省超過50%算力資源,性能全球領先(xian)。

應對大規模智能(neng)算力需(xu)求,阿里云(yun)已在全(quan)球30個(ge)(ge)地域(yu)建設了89個(ge)(ge)云(yun)計(ji)算數據中心,提供3000余個(ge)(ge)邊緣計(ji)算節點,發揮(hui)云(yun)計(ji)算的(de)低延時(shi)、高彈性優點。今(jin)年(nian),阿里云(yun)成(cheng)功(gong)支撐火爆全(quan)網(wang)的(de)妙鴨相機(ji)短時(shi)間高強度(du)的(de)流量爆發。

三、超30款云產品接入大模型能力,發布一站式大模型應用開發平臺

周(zhou)靖人談(tan)道:“隨著大模型技術與云計(ji)算(suan)本身(shen)的融合,我們希(xi)望(wang)未(wei)來的云可(ke)以像車一樣也(ye)能夠自(zi)動(dong)駕駛(shi),大幅(fu)提升開發者使用(yong)云的體驗。”

阿里云通義千問2.0發布!綜合性能超過GPT-3.5,APP正式上線

據(ju)悉,阿(a)里云上有超過30款云產(chan)品接入了大模型能力,例如阿(a)里云大數(shu)(shu)據(ju)治理平臺DataWorks新(xin)增了全新(xin)的交互形態(tai)Copilot,用戶只需用自然(ran)語(yu)言輸入即可生成SQL,并自動執(zhi)行相應的數(shu)(shu)據(ju)ETL操(cao)作(zuo),整(zheng)體開發與分析可提效30%以上,堪(kan)比“自動駕駛”。

阿(a)里云容器(qi)、數(shu)據庫等產(chan)品上也(ye)提供了類似(si)的開(kai)發體驗,可實現NL2SQL、SQL注釋生成/糾錯(cuo)/優化等功(gong)能(neng),未來這些(xie)能(neng)力還(huan)將集成到阿(a)里云其他產(chan)品上。

阿里云通義千問2.0發布!綜合性能超過GPT-3.5,APP正式上線

現場,周靖(jing)人還發布了一站式大(da)模型(xing)應(ying)用開發平臺——阿(a)里(li)云(yun)百(bai)煉。

該平臺集成了國內外(wai)主(zhu)流優質大(da)模型(xing),提供模型(xing)選型(xing)、微調(diao)訓練(lian)、安(an)全(quan)套件(jian)、模型(xing)部署等服務和全(quan)鏈路的應(ying)用(yong)開(kai)發(fa)工具(ju),為(wei)用(yong)戶簡(jian)化了底層算(suan)力部署、模型(xing)預訓練(lian)、工具(ju)開(kai)發(fa)等復(fu)雜工作。

開(kai)發(fa)(fa)者可在5分鐘內開(kai)發(fa)(fa)一款大(da)模型應用(yong),幾小時即可“煉”出一個企業(ye)專屬模型,可將更多(duo)精(jing)力專注于(yu)應用(yong)創新。

大模(mo)型正(zheng)引發(fa)千行百業的新(xin)一(yi)輪創新(xin),央視網、朗(lang)新(xin)科技、亞(ya)信科技等企業已率先在(zai)阿里云(yun)百煉上開發(fa)專(zhuan)屬模(mo)型和應用,朗(lang)新(xin)科技在(zai)云(yun)上訓練出電力(li)專(zhuan)屬大模(mo)型,開發(fa)“電力(li)賬單(dan)解(jie)讀智能(neng)助手”“電力(li)行業政策解(jie)析(xi)/數據分(fen)析(xi)助手”,為客戶接待提效50%、降低投訴70%。

“促進中(zhong)國AI生(sheng)態繁榮(rong),是阿(a)里(li)云的首要目標。阿(a)里(li)云將堅定打造AI時代(dai)最(zui)開(kai)(kai)放的大模型(xing)平臺,我們歡迎所有大模型(xing)接(jie)入阿(a)里(li)云百煉,共同向開(kai)(kai)發者提供AI服(fu)務。”周靖(jing)人說。

結語:向開發者提供免費GPU算力,已構建中國最大AI社區

除了與開(kai)發(fa)者(zhe)共享自研(yan)新(xin)技(ji)術,阿里(li)云還(huan)大(da)力支持三方(fang)大(da)模型發(fa)展。在阿里(li)云魔搭社區上(shang),百川智(zhi)能、智(zhi)譜(pu)AI、上(shang)海人工(gong)智(zhi)能實(shi)驗(yan)室、IDEA研(yan)究院等業界(jie)頂級(ji)玩家,都開(kai)源首發(fa)他們(men)的核心大(da)模型,阿里(li)云則為開(kai)發(fa)者(zhe)們(men)“嘗鮮”大(da)模型提供免費(fei)GPU算(suan)力,截(jie)至目(mu)前已(yi)超3000萬(wan)小時。

阿里云通義千問2.0發布!綜合性能超過GPT-3.5,APP正式上線

據周靖人透露,魔搭社(she)區(qu)現已聚(ju)集2300多款AI模(mo)型,吸(xi)引280萬名AI開(kai)發者(zhe),AI模(mo)型下載量(liang)突(tu)破1億,成為中國規模(mo)最大、開(kai)發者(zhe)最活(huo)躍(yue)的AI社(she)區(qu)。

在2023云棲大會上,阿里云公布了一(yi)項重(zhong)磅(bang)計(ji)劃:“云工(gong)開物計(ji)劃”,給中國所有大學生每人送一(yi)臺(tai)云服務器(qi)。

此(ci)外(wai),阿(a)里云還(huan)將為簽約高校提(ti)供(gong)更大(da)(da)規模的算力(li)資(zi)源支持(chi),助力(li)中(zhong)國青年學(xue)(xue)(xue)者(zhe)和學(xue)(xue)(xue)子攀登(deng)科研(yan)高峰。目前,清(qing)華大(da)(da)學(xue)(xue)(xue)、北京大(da)(da)學(xue)(xue)(xue)、浙江大(da)(da)學(xue)(xue)(xue)、上海(hai)交通大(da)(da)學(xue)(xue)(xue)、中(zhong)國科學(xue)(xue)(xue)技術大(da)(da)學(xue)(xue)(xue)、華南理工大(da)(da)學(xue)(xue)(xue)等高校已首批(pi)達(da)成合(he)作。