
智東西(公眾號:zhidxcom)
作者 | 香草
編輯 | 李水青
智東西5月9日報道,今日,阿里云(yun)正式發(fa)布通義(yi)千問2.5大模型,其性能全面趕超GPT-4,對標GPT-4 Turbo。相比上一(yi)代2.1版本,通義(yi)千問2.5在理解(jie)能力、邏輯推(tui)理、指(zhi)令遵(zun)循、代碼能力上分別提升9%、16%、19%、10%。
▲通(tong)義千問(wen)2.5發布
通(tong)義(yi)(yi)千(qian)問APP全(quan)面升級(ji),品牌更名為(wei)“通(tong)義(yi)(yi)APP”,免費(fei)開(kai)放通(tong)義(yi)(yi)全(quan)棧能力,覆蓋文(wen)生圖、智能編(bian)碼、文(wen)檔解(jie)析、音視頻(pin)理解(jie)、視覺生成等,主(zhu)打“All in one”。
其中在(zai)代(dai)碼(ma)方面,CodeQwen1.5憑借優秀的代(dai)碼(ma)生成能(neng)力、長序列建(jian)模(mo)能(neng)力、代(dai)碼(ma)修改能(neng)力和SQL能(neng)力登(deng)頂Big Code模(mo)型排行榜(bang),基于該底(di)層(ceng)模(mo)型,通(tong)義靈碼(ma)正式推出企業版。
▲CodeQwen1.5成(cheng)為全(quan)球(qiu)領先的代碼大模型
同時,阿里云百煉大模(mo)型平臺(tai)全面升級2.0,首家托(tuo)管(guan)百川等(deng)系列三方模(mo)型,率(lv)先(xian)兼容(rong)LlamaIndex等(deng)開源框架,用戶通過5到10行代碼即可(ke)搭建(jian)RAG應用,讓大模(mo)型擁有(you)“最(zui)強外掛”。
一、通義千問2.5追平GPT-4 Turbo,1100億參數開源模型超越Llama 3
阿里(li)云首席技術官周靖人提(ti)到,經(jing)過(guo)近2年的持(chi)續進(jin)化,通義(yi)模(mo)型(xing)系列已成為(wei)最受中國(guo)企業歡迎的大模(mo)型(xing)。
目前,通(tong)義大模型通(tong)過阿里云服務(wu)(wu)的企業(ye)客(ke)戶數已超過9萬,通(tong)過釘釘服務(wu)(wu)企業(ye)超220萬,其中月活(huo)超170萬。此(ci)外在Hugging Face、魔搭(da)等開源(yuan)社區,通(tong)義開源(yuan)模型下(xia)載(zai)量累計超700萬。
▲通(tong)義千問在企(qi)業中的(de)應用
今(jin)天發布的通義千(qian)問(wen)2.5,在理解能力、邏輯推理、指(zhi)令遵循、代碼能力上相較(jiao)于2.1版(ban)本(ben),分(fen)別(bie)提升9%、16%、19%、10%。
在上(shang)海(hai)AI實(shi)驗室推出的權威基準OpenCompass上(shang),通義(yi)千問2.5得分超(chao)越Claude 3 Opus,追平GPT-4 Turbo,成為國產大模(mo)型首位。
▲OpenCompass測評基(ji)準(zhun)排行
此外,阿里云還發布了(le)最新開源模型(xing)Qwen1.5-110B,該模型(xing)在MMLU、TheoremQA、GPQA等基準(zhun)測評中(zhong)超越了(le)Llama 3 70B,在Hugging Face開源大模型(xing)排行榜Open LLM Leaderboard上登上榜首。
▲Qwen1.5-110B登上Hugging Face開(kai)源(yuan)大模型榜首
二、基礎模型支持1000萬字上下文,推出企業版通義靈碼
據(ju)周(zhou)靖(jing)人介紹,在基礎能(neng)力之外,通義千問2.5還拓展了文檔處理、音視(shi)頻理解、智能(neng)編碼等多種能(neng)力。
在文檔處理上,通義(yi)千問(wen)2.5支(zhi)持(chi)單次最長1000萬字(zi)、100個文檔,覆蓋PDF、Word、Excel等多種文件格式(shi),可(ke)解析標題、段落、圖表等多種數據(ju)格式(shi)。
▲通義千(qian)問2.5的(de)文檔(dang)處(chu)理能力
在音(yin)視(shi)頻理解(jie)方面(mian),通義(yi)千問(wen)2.5融合語(yu)音(yin)、LLM、多模態、翻譯能力,具備(bei)實時語(yu)音(yin)識(shi)別、說(shuo)話(hua)人分離功(gong)能,能夠提取(qu)全文摘要(yao)、總(zong)結發言、提取(qu)關(guan)鍵詞等,可同時上(shang)傳處理50個音(yin)視(shi)頻文件。
周靖人(ren)透露,該(gai)能力(li)已(yi)在多個(ge)行業廣泛集(ji)成,包(bao)括(kuo)釘(ding)釘(ding)的會議智能紀(ji)要功(gong)能、新東方的AI課堂筆記功(gong)能、螞(ma)蟻(yi)面試(shi)等。
▲通(tong)義千問2.5的音視頻(pin)理解能(neng)力
在智能編碼(ma)(ma)方(fang)面,通義(yi)靈碼(ma)(ma)掌握Java、Python、Go、JavaScript、TypeScript、C/C++、C#等200多種編程語言,可以輔助寫代碼(ma)(ma)、讀代碼(ma)(ma)、查Bug、優(you)化代碼(ma)(ma)等。其底層模型是通義(yi)千問團隊開發的CodeQwen1.5,具備優(you)秀的代碼(ma)(ma)生(sheng)成能力、長序列建模能力、代碼(ma)(ma)修(xiu)改能力和SQL能力,4月(yue)剛剛登頂Big Code模型排行(xing)榜。
自2023年10月發(fa)布至今(jin),通義(yi)靈碼的插(cha)件下載量已超350萬,每日推薦代(dai)碼超3000萬次,被開發(fa)者(zhe)采納的代(dai)碼超億行,據稱是國內最(zui)受歡迎的智能編程助手。
▲CodeQwen1.5登頂Big Code模(mo)型(xing)排行榜(bang)
同時,周靖人宣布通(tong)義靈(ling)碼企(qi)業(ye)(ye)版正(zheng)式(shi)發(fa)布,包含標準版、專(zhuan)屬版兩(liang)個(ge)版本,滿足企(qi)業(ye)(ye)用戶在(zai)私域知識檢索、企(qi)業(ye)(ye)數據(ju)合規、統一管理等(deng)方(fang)面(mian)的定制(zhi)化(hua)需求。
標(biao)準(zhun)版(ban)“開箱(xiang)即用(yong)”,可以接(jie)入企(qi)(qi)業私域知識,實現私域知識問答,讓AI推薦的代碼更(geng)貼合企(qi)(qi)業規范;專(zhuan)屬版(ban)在標(biao)準(zhun)服務之外,提供公共云上專(zhuan)屬實例部署、企(qi)(qi)業私有模型(xing)訓練、獨立企(qi)(qi)業賬號系統等服務,滿(man)足大中型(xing)企(qi)(qi)業客戶(hu)定(ding)制模型(xing)、節約算(suan)力的需求(qiu)。
▲通(tong)義千問(wen)2.5的智能編碼能力
周靖人稱(cheng),阿(a)里(li)云(yun)是國(guo)內首家推行全員AI編碼(ma)的云(yun)廠商,內部已全面切換通(tong)義靈(ling)碼(ma)企業專屬版,目前(qian)26%的新增業務代(dai)碼(ma)由通(tong)義靈(ling)碼(ma)編寫,研發效率(lv)提(ti)升10%。
此外,中華財險成(cheng)為首批通(tong)(tong)義靈(ling)(ling)碼(ma)(ma)企業版客戶,其(qi)60%技術人員(yuan)已開始使用通(tong)(tong)義靈(ling)(ling)碼(ma)(ma),1/4的編碼(ma)(ma)任務由通(tong)(tong)義靈(ling)(ling)碼(ma)(ma)完成(cheng),基于通(tong)(tong)義靈(ling)(ling)碼(ma)(ma)的研發問答準確率(lv)達90%。此外,通(tong)(tong)義靈(ling)(ling)碼(ma)(ma)編碼(ma)(ma)助手還(huan)“入職”了多家(jia)金融、汽車(che)、新零售、互(hu)聯網等企業。
三、通義千問APP免費開放全棧能力,更名“通義APP”
基于(yu)以上能力,通義(yi)千(qian)問APP全(quan)面升級(ji),在移動端、Web端、小程序端集成通義(yi)大模型全(quan)棧能力,免費(fei)為(wei)所有用戶提供服(fu)務,同(tong)時更名為(wei)“通義(yi)APP”。
▲通義APP全面升級
通(tong)義APP以性能(neng)媲美GPT-4 Turbo的(de)(de)基模為底座(zuo),將通(tong)義實驗室文(wen)生圖、智(zhi)能(neng)編碼、文(wen)檔(dang)解(jie)析、音(yin)視頻(pin)理(li)解(jie)、視覺(jue)生成等能(neng)力“All in one”,目標是成為每(mei)個人的(de)(de)全能(neng)AI助手。
▲通義開(kai)放體驗全(quan)棧(zhan)能力(li)
今(jin)年以來(lai),通義(yi)APP先后推出了“全(quan)(quan)民(min)舞(wu)王(wang)”、“全(quan)(quan)民(min)唱(chang)演(yan)(yan)”、“通義(yi)照相館”、AI智能(neng)體等應用。在“全(quan)(quan)民(min)舞(wu)王(wang)”頻(pin)道,用戶上傳(chuan)一張照片就能(neng)讓(rang)圖中人物跳“科目三”等舞(wu)蹈;在“全(quan)(quan)民(min)唱(chang)演(yan)(yan)”頻(pin)道,用戶用一段音頻(pin)就能(neng)驅(qu)動(dong)肖(xiao)像照中的(de)人物唱(chang)歌說(shuo)話(hua)。
這些熱(re)門應用背(bei)后都是通(tong)義實驗(yan)室自研的前沿AI模(mo)型。周靖人(ren)稱,未來通(tong)義APP還將推出(chu)更多(duo)以新技術驅動(dong)的新玩法,讓所有人(ren)都能獲得最領(ling)先(xian)的大模(mo)型技術體驗(yan)。
四、百煉大模型平臺升級2.0,5到10行代碼即可搭建企業級RAG應用
在(zai)大模(mo)(mo)(mo)(mo)型(xing)落地(di)層(ceng)面,周靖人談道,只靠(kao)基(ji)礎模(mo)(mo)(mo)(mo)型(xing)不(bu)能解決所有問題,“當下企業(ye)應用大模(mo)(mo)(mo)(mo)型(xing)存在(zai)三(san)種范式(shi):一是對大模(mo)(mo)(mo)(mo)型(xing)開箱即用,二是對大模(mo)(mo)(mo)(mo)型(xing)進(jin)行微調和持續訓練,三(san)是基(ji)于模(mo)(mo)(mo)(mo)型(xing)開發應用,其中最典型(xing)的(de)(de)需(xu)求(qiu)是RAG,以企業(ye)數(shu)據(ju)對大模(mo)(mo)(mo)(mo)型(xing)進(jin)行知識(shi)增強。圍繞這(zhe)些需(xu)求(qiu),百(bai)煉打造(zao)了模(mo)(mo)(mo)(mo)型(xing)中心和應用中心,提供(gong)最豐(feng)富的(de)(de)模(mo)(mo)(mo)(mo)型(xing)和最易用的(de)(de)工具箱。”
阿里(li)云于去年(nian)10月推出了百煉大模(mo)型(xing)平臺,開發者可通(tong)過(guo)“拖拉(la)拽”等交互(hu)形式,5分鐘開發一(yi)款大模(mo)型(xing)應用,幾小(xiao)時(shi)“煉”出一(yi)個(ge)專屬模(mo)型(xing),把精力專注(zhu)于應用創新。
今(jin)天,周(zhou)靖(jing)人宣布百煉(lian)平臺從(cong)模型(xing)開發(fa)、應用開發(fa)到(dao)算力底座全面升級至(zhi)2.0,更加易(yi)用、更加開放,引入更多(duo)模型(xing),還率先兼容LlamaIndex等開源框(kuang)架,企業(ye)可(ke)自由替換能力組件來適(shi)配自身(shen)系統。
▲百(bai)煉平臺(tai)升級2.0
針(zhen)對(dui)當下(xia)企業最關注(zhu)的RAG鏈(lian)路(lu),百煉提(ti)供靈活開放(fang)的企業級檢索(suo)增強服(fu)務(wu),只需5到10行代碼即可搭建RAG應用,實現低時(shi)延、高并發的檢索(suo)引擎。
▲百(bai)煉提供RAG應用(yong)服務
百煉集成了上(shang)百款大模型API,除了通義、Llama、ChatGLM等,還首家托(tuo)管百川(chuan)等系(xi)列三方模型,覆蓋國內外主流(liu)廠(chang)商。同時,百煉依托(tuo)阿里云(yun)AI基(ji)礎設(she)施(shi),支持千億級(ji)模型的(de)萬(wan)級(ji)并發(fa)推理,充分滿(man)足企業需求。
百煉內置豐富的(de)Prompt模板,支持基于LLM Meta-prompting的(de)智(zhi)能優化,用(yong)戶可用(yong)幾(ji)句(ju)話簡單陳(chen)述需(xu)求,無需(xu)費心調試Prompt工程(cheng)。
▲百(bai)煉提供Prompt模板
對需(xu)進一步(bu)訓(xun)練模型(xing)(xing)的(de)用戶,百煉提供從數(shu)據管理、模型(xing)(xing)調(diao)優、評(ping)測到部署的(de)全鏈(lian)路模型(xing)(xing)服務,用戶可彈性(xing)按(an)需(xu)調(diao)用算力,無需(xu)關心底層架構。訓(xun)練過程可視化,還(huan)可自動評(ping)測模型(xing)(xing)質量,并與其他模型(xing)(xing)對比。
百(bai)煉支持(chi)Assistant API開發(fa)模式,用戶可在百(bai)煉上創建知識庫,并一鍵開啟RAG,通(tong)過(guo)Assistant API聯合輸(shu)出。同時,百(bai)煉支持(chi)Agent開發(fa),能實現多智能體協作(zuo)、對話記憶等功能。
▲百煉提(ti)供Assistant API開發(fa)模(mo)式
周靖人稱,接(jie)下來百煉將(jiang)繼續做(zuo)對開發者(zhe)最友好、最開放的大(da)模(mo)型平臺。阿里云歡迎(ying)更(geng)多大(da)模(mo)型上架,百煉將(jiang)進一步支(zhi)持(chi)三方(fang)模(mo)型的微調訓練(lian)和(he)云上專屬部署(shu),幫(bang)助大(da)模(mo)型生態(tai)中的企業(ye)提供商業(ye)化服務。
結語:開源生態加速大模型應用落地
去年8月(yue),通義(yi)宣布(bu)加(jia)入開(kai)源行列,沿著“全模態(tai)(tai)、全尺(chi)寸”開(kai)源路線陸續(xu)推出(chu)十(shi)多款模型,其中(zhong)語(yu)言模型參數規(gui)模橫(heng)跨5億到1100億,多模態(tai)(tai)模型涵(han)蓋(gai)視(shi)覺理解(jie)、音頻(pin)理解(jie)、代碼等方(fang)面。
大模(mo)型的(de)訓練和迭代成本極高,絕大部分的(de)AI開(kai)發者和中小企業都難以負(fu)擔。Meta、阿(a)里云等頭(tou)部廠(chang)商致力于(yu)開(kai)源(yuan)生(sheng)態(tai),讓開(kai)發者不(bu)必從頭(tou)訓練模(mo)型,把模(mo)型選型的(de)主動權交給了開(kai)發者,加(jia)速了大模(mo)型的(de)應用落地進程。