
智東西(公眾號:zhidxcom)
編輯 | 程茜
智東西3月31日消息,今天,智譜在中關村論壇上正式發布AutoGLM沉思,這也是全球首個集深度研究與實際操作能力于一體的Agent。
AutoGLM沉思突破了實時聯網搜索、動態工具調用、深度分析和自我驗證,實現了(le)真正(zheng)的長(chang)程推理和任務(wu)執行,這也(ye)是國(guo)內首個正(zheng)式開放的Deep Research功能。
經智譜內部評估,AutoGLM沉思背后的深度思考模型GLM-Z1-Air,在性能表現上可以與DeepSeek-R1(671B,激活37B)媲美。
目前,該功能已經正式上線智譜清言(yan)網頁端(duan)、PC端(duan)和手機(ji)App,免費、不限量地開放。智譜此次發(fa)布(bu)的為(wei)preview版本,核心支(zhi)持research場景;在未來兩周(zhou),其將進一步(bu)擴展更多(duo)智能體執(zhi)行能力,包括推出“虛擬機(ji)”版本。
其技術演進路徑包括:GLM-4基座模(mo)(mo)(mo)型(xing)(xing) →GLM-Z1推(tui)理(li)模(mo)(mo)(mo)型(xing)(xing)→GLM-Z1-Rumination沉思模(mo)(mo)(mo)型(xing)(xing)→AutoGLM模(mo)(mo)(mo)型(xing)(xing)。其中核心鏈(lian)路的模(mo)(mo)(mo)型(xing)(xing)和技術,智譜將(jiang)于(yu)4月(yue)14日(ri)正式(shi)開(kai)源,并(bing)將(jiang)在未來(lai)兩周內陸續上線MaaS平臺。
體驗地址(zhi)://autoglm-research.zhipuai.cn/?channel=autoglm_android
一、AutoGLM沉思三大關鍵特性,讓機器“邊想邊干”
智譜打造AutoGLM沉思的目標就是:讓機器不僅能夠(gou)思考,還能主動行(xing)動,實現“邊想邊干”。
這(zhe)一能力的實現(xian)依賴(lai)于三(san)個(ge)關鍵特性:
深度思考能夠模擬人類在面對復雜問題時的推理與決策過程;感知世界能夠像人一樣獲取并理解環境信息;工具使用能夠像(xiang)人一樣調用(yong)和操作工(gong)具,完成(cheng)復雜任務。
AutoGLM沉思融合了以上三大能(neng)力(li)。與OpenAI的Deep Research不同(tong),它不僅能(neng)深入(ru)研究(jiu),還(huan)能(neng)真正執(zhi)行(xing)任務,推動AI Agent從單純的思考者,進化為能(neng)交(jiao)付結(jie)果的智(zhi)能(neng)執(zhi)行(xing)者。
AutoGLM沉思模型的背后,是智譜自主研發的全棧大模型技術,融合了GLM-4的(de)通用能(neng)力(li)(li)、GLM-Z1的(de)反(fan)思能(neng)力(li)(li)、GLM-Z1-Rumination的(de)沉(chen)思能(neng)力(li)(li),以(yi)及(ji)AutoGLM的(de)自動執行(xing)能(neng)力(li)(li)。
1、新版基座模型
基于最新的(de)(de)技術積累,智譜重新訓練(lian)了320億參(can)數的(de)(de)基座模(mo)型GLM-4-Air-0414,在(zai)預訓練(lian)階(jie)段加入了更多的(de)(de)代碼類(lei)、推理類(lei)數據,并在(zai)對(dui)齊階(jie)段針(zhen)對(dui)智能體(ti)能力(li)進(jin)行了優(you)化,模(mo)型在(zai)工具調(diao)用、聯網(wang)搜索、代碼等智能體(ti)任務上(shang)的(de)(de)能力(li)得到大大加強。
GLM-4-Air-0414以32B參(can)數量比肩更大參(can)數量的(de)國(guo)內外主流(liu)模型,這使得模型在適配智(zhi)能體(ti)(ti)任務(wu)方面(mian)特(te)別有效,是(shi)因為智(zhi)能體(ti)(ti)任務(wu)往往涉(she)及多輪復雜(za)交(jiao)互,32B的(de)參(can)數量使得GLM-4-Air-0414能快(kuai)速執(zhi)行復雜(za)任務(wu)。
2、新版推理模型
基于GLM-4-Air-0414,智譜引入了(le)更多(duo)推理類數據,并(bing)在(zai)對齊階段深(shen)度(du)優化了(le)通用能力(li),推出了(le)全新(xin)的深(shen)度(du)思考模型GLM-Z1-Air。
在性(xing)能表現上(shang),GLM-Z1-Air可(ke)以與DeepSeek-R1(671B,激(ji)活37B)媲美(mei)。智譜在AIME 24/25、LiveCodeBench、GPQA等基準測(ce)試中(zhong)對GLM-Z1-Air進(jin)行了評估,評估結果顯示GLM-Z1-Air展(zhan)現了較為強大的(de)(de)數理推理能力,為更多復雜任務的(de)(de)解(jie)決提供了支持:
在(zai)推理速度上,GLM-Z1-Air相比R1提升(sheng)了8倍,成本(ben)可(ke)以(yi)降(jiang)低至1/30。
此外,GLM-Z1-Air可在消費級(ji)顯卡上運(yun)行。
智譜還在(zai)MAAS平臺上將免費模(mo)型GLM-4-Flash的(de)基(ji)座版(ban)本(ben)更新(xin)至GLM-4-Flash-0414,并(bing)推(tui)出了對應的(de)推(tui)理版(ban)本(ben)GLM-Z1-Flash,在(zai)保留(liu)大(da)部分(fen)效果的(de)情況下更輕量級、更高速(su),完全免費調用。
3、沉思模型
基于GLM-Z1,智譜通(tong)過(guo)擴展(zhan)強化(hua)學(xue)習訓(xun)練,提升(sheng)了模(mo)型(xing)結合(he)工具使用完成(cheng)長程推理能力,訓(xun)練出沉思模(mo)型(xing)GLM-Z1-Rumination。
該模(mo)型突破了傳(chuan)統AI單(dan)純依賴內部(bu)知識推理的局限,結合實(shi)時聯網搜索、動態(tai)工具調用、深度分(fen)析(xi)和自我驗(yan)證(zheng),形成完整的自主(zhu)研究流(liu)程:
實時搜索可(ke)以(yi)主動獲取最新信息(xi),突(tu)破信息(xi)孤島;深度(du)分(fen)析進(jin)行多(duo)角度(du)邏輯(ji)推理,避免單一思維路徑(jing);動態驗(yan)證可(ke)以(yi)不斷修(xiu)正假設,提(ti)高研究的準確性與邏輯(ji)性。
GLM-Z1-Rumination能夠主動(dong)理(li)解用戶需求(qiu),在復雜任務中不(bu)斷優(you)化推理(li)、反(fan)復驗證與修正假(jia)設,使研究成(cheng)果更具可靠性與實(shi)用性。
4、AutoGLM
智譜的(de)AutoGLM系列再(zai)次(ci)取得重(zhong)要進展。
在(zai)斯坦福大(da)模型中心《AI指(zhi)數2024》選定的智(zhi)能體基準(zhun)評測AgentBench上(shang),AutoGLM系列模型在(zai)5個測試環境(jing)中也(ye)取得了(le)SOTA的成績。其中,在(zai)Phone Use基準(zhun)(AndroidLab & AndroidWorld)中,AutoGLM-Phone的任務成功率(lv)較此前最佳(jia)成績提升(sheng)超(chao)過20%;在(zai)Browser Use基準(zhun)上(shang),AutoGLM-Web也(ye)全(quan)面超(chao)越OpenAI GPT-4o和Anthropic Claude-3.5-Sonnet,展現(xian)了(le)在(zai)網頁交互場(chang)景中的領先能力。
在GUI智能體領域,智譜自(zi)研(yan)模型(xing)GLM-PC(CogAgent)在多個權威評測榜單上取得SOTA成績(ji)。憑借9B參(can)數規模,CogAgent超越了包括GPT-4o+UGround、Claude Computer Use等更大規模的同類模型(xing)或商用(yong)API。
二、聚焦Agentic GLM研發,聯手金融、教育、醫療、政務、企服賽道
智(zhi)譜在AI Agent領域的研(yan)發(fa),包(bao)括從最早推出具(ju)備(bei)Function Call能(neng)(neng)力的智(zhi)譜清言,到(dao)(dao)率先上線支持(chi)智(zhi)能(neng)(neng)體編排的GLMs,再到(dao)(dao)推出全球首(shou)個設備(bei)操控智(zhi)能(neng)(neng)體AutoGLM。
2025年,智(zhi)譜將戰略聚焦Agentic GLM的(de)研發。
在技術(shu)方面,智譜將(jiang)依托原(yuan)創自主大模(mo)(mo)型(xing)技術,持(chi)續推動(dong)具(ju)備邏(luo)輯推理和深度思考能力的Agent基(ji)座(zuo)模(mo)(mo)型(xing)與通用基(ji)座(zuo)模(mo)(mo)型(xing)的研發(fa),再(zai)到智能體框架(jia)與Agent應用,朝(chao)著(zhu)讓(rang)機(ji)器像人一樣思考和行動(dong)的目標不斷前(qian)進(jin)。
智譜還將搭建Agentic LLM平臺,助力(li)生(sheng)態合作伙伴利用智(zhi)(zhi)譜(pu)模型與智(zhi)(zhi)能體(ti)的強大能力(li),構建行業、地域與場(chang)景深度融合的智(zhi)(zhi)能體(ti)應用。
在行業生(sheng)態方面(mian),智譜(pu)將作為模型(xing)廠(chang)商,幫助(zhu)應用(yong)合作伙(huo)伴(ban)在GLM模型(xing)上實現(xian)成功的大模型(xing)應用(yong)。目前,智譜(pu)已攜手(shou)金融、教育、醫療、政務(wu)、企(qi)服等領域(yu)的合作伙(huo)伴(ban),共同推進Agentic LLM的落地應用(yong)。
與(yu)此同時(shi),智譜也相繼與(yu)北京、杭州、上海、成都、珠海等城市達(da)成合作,與(yu)當(dang)(dang)地(di)龍(long)頭企業攜(xie)手推動當(dang)(dang)地(di)大模(mo)型應用(yong)生態的建(jian)設。