
智東西(公眾號:zhidxcom)
作者 | 李水青
編輯 | 云鵬
智東西(xi)10月27日報道(dao),今日,在2023中國(guo)計算機大會(CNCC)上,智譜(pu)AI CEO張鵬宣(xuan)布,智譜(pu)AI推出第三代基座大模(mo)型ChatGLM3及(ji)相關系列產(chan)品。
這是(shi)智譜(pu)AI繼(ji)推出千億基座的(de)對話模型(xing)ChatGLM和ChatGLM2之后的(de)又一次重大突破(po)。評(ping)測(ce)顯(xian)示,在44個中英文公開數(shu)據集測(ce)試(shi)中,ChatGLM3在國(guo)內同尺寸模型(xing)中排名首位(wei)。
基于ChatGLM3,智(zhi)譜AI全(quan)新(xin)上(shang)線(xian)了(le)“智(zhi)譜清言”,國(guo)內首推代(dai)碼交互能(neng)力,支持圖像處(chu)理、數學計算、數據分(fen)析等多個(ge)場(chang)景,張鵬(peng)在現(xian)場(chang)對這些能(neng)力進行了(le)實時(shi)演示。
張鵬透(tou)露,最新版本的(de)ChatGLM-turbo在最新AgentBench上(shang)已略超(chao)出GPT-3.5。在算力(li)方(fang)面,ChatGLM3已支持(chi)昇騰、海光DCU等10余種國(guo)產硬件生態(tai);考慮更多邊緣側需求(qiu),ChatGLM3提(ti)供1.5B、3B等更豐富的(de)模型(xing)尺寸,支持(chi)在筆記(ji)本電腦(nao)、手機、汽車上(shang)部(bu)署。
在開源生態方面,智(zhi)(zhi)譜AI將對話ChatGLM3-6B、長文本ChatGLM3-6B-32k、多(duo)模(mo)態CogVLM-17B、智(zhi)(zhi)能體AgentLM開源。
此(ci)外(wai),面向企(qi)業級市場,智譜(pu)AI開放平臺推出私有模型方(fang)案、專(zhuan)屬(shu)模型方(fang)案、開放模型方(fang)案多(duo)種選擇,據稱ChatGLM-turbo的API價格下降50%。
一、ChatGLM3評測排名首位,新功能瞄向GPT-4V
ChatGLM3發布(bu),是(shi)智(zhi)譜AI今年來(lai)第(di)三次對ChatGLM基(ji)座(zuo)模(mo)型進行了深度優化(hua)。智(zhi)譜AI采用了多階段增(zeng)強(qiang)預訓練(lian)方(fang)(fang)法、更豐富的訓練(lian)數據(ju)和更優的訓練(lian)方(fang)(fang)案,使ChatGLM3-6B具備(bei)更強(qiang)大的性能。
1. 更強大性能,44項測試國內排名第一
測評顯(xian)示,ChatGLM3在44個中(zhong)英文公開(kai)數據集(ji)測試中(zhong)國內同(tong)尺(chi)寸模型排(pai)名首位,其中(zhong),MMLU提(ti)升36%、CEval提(ti)升33%、GSM8K提(ti)升179% 、BBH提(ti)升126%。
2. 瞄向GPT-4V,四大技術升級
瞄向GPT-4V,ChatGLM3 本次實現了若(ruo)干全新功能的(de)迭代升級(ji),包括:
(1)多模態理解能力的CogVLM,看圖識語義,在10余個國際標準圖文評測數據集上取得SOTA。
(2)代碼增強模塊Code Interpreter,根據用戶需求生成代碼并執行,自動完成數據分析、文件處理等復雜任務。
(3)網絡搜索增強WebGLM,接入搜索增強,能自動根據問題在互聯網上查找相關資料并在回答時提供參考相關文獻或文章鏈接。
(4)ChatGLM3的語義能力(li)與邏輯能力(li)大大增強。
3、更高效推理,速度提升2~3倍
ChatGLM3實現(xian)了更高效(xiao)的推理,ChatGLM3通過高效(xiao)動態推理和顯(xian)存優化技術的應用,相較(jiao)于目前(qian)最(zui)佳開源(yuan)實現(xian)vLLM速(su)度提升2~3倍(bei)。
4、 全新Agent智能體能力,比二代提高100倍
針對近期討(tao)論更火熱的AI Agent能(neng)力(li),ChatGLM3采用全新Agent智(zhi)能(neng)體算法,充分激活大模型(xing)智(zhi)能(neng)體能(neng)力(li),在智(zhi)能(neng)規劃和執(zhi)行方面(mian),相比ChatGLM二代提高1000%。
智譜AI還(huan)開啟國產大模(mo)型原生(sheng)支持工具調用、代碼執(zhi)行、游戲、數據庫(ku)操作、知識(shi)圖譜搜索與推理、操作系(xi)統等復雜場景。
二、與GPT-3.5平齊,全面適配國產硬件生態
張鵬透露,最新(xin)版本的ChatGLM-turbo在最新(xin)AgentBench上和GPT-3.5平齊,甚至略有超出。
智譜(pu)AI很早就(jiu)高度關注到(dao)算(suan)力問題,布(bu)局全面(mian)適配國產(chan)硬件生(sheng)態,以保證算(suan)力安全。
據悉(xi),自2022年初,GLM系列模(mo)型已支持(chi)在昇騰(teng)、神威超算、海(hai)(hai)光(guang)DCU架構上(shang)進(jin)行大規(gui)模(mo)預(yu)訓練和推理。當(dang)前其(qi)已支持(chi)10余種國產(chan)硬(ying)件生態(tai),包括(kuo)昇騰(teng)、神威超算、海(hai)(hai)光(guang)DCU、海(hai)(hai)飛(fei)科、沐(mu)曦曦云、算能科技、天數(shu)智芯、寒武紀、摩爾線(xian)程、百度昆侖芯、靈(ling)汐科技、長城超云等(deng)。
考慮(lv)更多邊緣(yuan)側(ce)需求,ChatGLM3提(ti)供1.5B、3B等更豐富的模(mo)型(xing)尺寸(cun)。支持(chi)國產芯片(pian)的Edge版模(mo)型(xing)ChatGLM3-1.5B,可在筆記本電腦、手機、汽(qi)車(che)上(shang)部(bu)署。支持(chi)移動(dong)平臺(tai)上(shang)CPU芯片(pian)推(tui)理,速(su)度(du)可達20 Tokens/s;精度(du)方(fang)面,1.5B和3B模(mo)型(xing)在公開Benchmark上(shang)與ChatGLM-60接近。
在開源(yuan)生態(tai)方面,智譜(pu)AI將對話(hua)ChatGLM3-6B、長文本(ben)ChatGLM3-6B-32k、多模(mo)態(tai)CogVLM-17B、智能(neng)體AgentLM開源(yuan)。據悉,ChatGLM-6B在全球已有超1000萬(wan)(wan)下載(zai)量(liang),累計四周居于Hugging Face趨勢榜第一,GitHub超5萬(wan)(wan)Stars。
三、全新“智譜清言”上線,國內首推代碼交互能力
在(zai)全新升級(ji)的(de)(de)ChatGLM3賦能下,生(sheng)成式(shi)AI助手智譜清言已成為國內首個(ge)具(ju)備代碼交互(hu)能力的(de)(de)大模型產品(Code Interpreter)。
體驗(yan)地址://chatglm.cn/main/code
“代(dai)碼”功(gong)能(neng)目前已(yi)支持(chi)圖像處理、數學計算(suan)、數據分析(xi)等(deng)使用場景。以下分別為各個能(neng)力的演示情況截圖:
處理數據生成圖表:
代碼繪制圖形:
上傳(chuan)SQL代(dai)碼分(fen)析:
隨著WebGLM大模型能力(li)的(de)加入(ru),智譜(pu)清言也具(ju)有(you)了搜(sou)索增強能力(li),可以幫助用戶整理出相關問題的(de)網上文(wen)獻或(huo)文(wen)章鏈(lian)接,并直接給出答案(an)。
此(ci)前已發布的CogVLM 模型則提(ti)高了智(zhi)譜清言的中文圖文理(li)解能(neng)(neng)力,取得了接近GPT-4V的圖片理(li)解能(neng)(neng)力,它(ta)可(ke)以回答各種類型的視覺問題,并且可(ke)以完成(cheng)復雜(za)的目標檢測,并打上標簽,完成(cheng)自動數據標注。
四、推出智譜AI開放平臺,API價格下降50%
面向企業級市場,智譜AI構建了智譜AI開(kai)放平臺,包括(kuo)私有模型(xing)方(fang)案、專(zhuan)屬模型(xing)方(fang)案、開(kai)放模型(xing)方(fang)案。
隨著本次發布,智譜(pu)AI的API產品矩(ju)陣發生變化:從提供ChatGLM-Pro、ChatGLM、ChatGLM-Lite多款產品,向提供一個整體ChatGLM-turbo演化,價格下降50%。
智譜AI開放平(ping)(ping)臺(tai)(tai)不僅能夠幫(bang)助提(ti)供API,也(ye)提(ti)供模型的(de)定制化私(si)有化以(yi)及自有數據的(de)使用。平(ping)(ping)臺(tai)(tai)還提(ti)供一些標準化的(de)組件(jian),比如外掛知識庫、向量化能力(li)等。
利(li)用(yong)這些能力,用(yong)戶能夠(gou)快速的去構建自己的一些基(ji)本應用(yong)。
結語:全面對標OpenAI,智譜AI大模型再升級
2020年是大模型(xing)(xing)元年,GPT-3的(de)(de)(de)出世標志著大模型(xing)(xing)進入“可(ke)用(yong)階(jie)段(duan)”,也是生(sheng)成(cheng)式AI落地的(de)(de)(de)第一(yi)(yi)階(jie)段(duan)。這一(yi)(yi)階(jie)段(duan),產業關注的(de)(de)(de)是怎么去構(gou)建一(yi)(yi)個(ge)精度(du)足夠高、穩定性足夠好、更大規模的(de)(de)(de)大模型(xing)(xing)。
智譜(pu)(pu)AI從2020年開始基于GLM預(yu)訓練(lian)模(mo)(mo)型的(de)(de)框架做研發,到2021年發布第一(yi)個(ge)(ge)開源(yuan)百億大模(mo)(mo)型GLM-10B,到后續(xu)的(de)(de)一(yi)系列(lie)模(mo)(mo)型的(de)(de)誕生,不斷(duan)迭代。對標(biao)OpenAI全模(mo)(mo)型產品線,是智譜(pu)(pu)AI在創立之初就一(yi)個(ge)(ge)寫在愿景里(li)的(de)(de)一(yi)個(ge)(ge)目標(biao)。
可以看到,對標(biao)OpenAI推出(chu)的ChatGPT、DALL.E、Codex、WebGPT和(he)(he)GPT-4V,智譜AI推出(chu)了(le)ChatGLM對話、CogView文生圖(tu)、CodeGeeX代碼、WebGLM搜索(suo)增強和(he)(he)ChatGLM3圖(tu)文理解等產品,體現了(le)國產大(da)模型(xing)的實力積淀。