智谱发布全新Agent，集深度研究和操作执行于一体，背后模型媲美DeepSeek-R1

智東西（公眾號：zhidxcom）
編輯 | 程茜

智東西3月31日消息，今天，智譜在中關村論壇上正式發布AutoGLM沉思，這也是全球首個集深度研究與實際操作能力于一體的Agent。

AutoGLM沉思突破了實時聯網搜索、動態工具調用、深度分析和自我驗證，實現了(le)真正(zheng)的長(chang)程推理和任務(wu)執行，這也(ye)是國(guo)內首個正(zheng)式開放的Deep Research功能。

智譜發布全新Agent，集深度研究和操作執行于一體，背后模型媲美DeepSeek-R1

經智譜內部評估，AutoGLM沉思背后的深度思考模型GLM-Z1-Air，在性能表現上可以與DeepSeek-R1（671B，激活37B）媲美。

目前，該功能已經正式上線智譜清言(yan)網頁端(duan)、PC端(duan)和手機(ji)App，免費、不限量地開放。智譜此次發(fa)布(bu)的為(wei)preview版本，核心支(zhi)持research場景；在未來兩周(zhou)，其將進一步(bu)擴展更多(duo)智能體執(zhi)行能力，包括推出“虛擬機(ji)”版本。

其技術演進路徑包括：GLM-4基座模(mo)(mo)(mo)型(xing)(xing) →GLM-Z1推(tui)理(li)模(mo)(mo)(mo)型(xing)(xing)→GLM-Z1-Rumination沉思模(mo)(mo)(mo)型(xing)(xing)→AutoGLM模(mo)(mo)(mo)型(xing)(xing)。其中核心鏈(lian)路的模(mo)(mo)(mo)型(xing)(xing)和技術，智譜將(jiang)于(yu)4月(yue)14日(ri)正式(shi)開(kai)源，并(bing)將(jiang)在未來(lai)兩周內陸續上線MaaS平臺。

智譜發布全新Agent，集深度研究和操作執行于一體，背后模型媲美DeepSeek-R1

體驗地址(zhi)：//autoglm-research.zhipuai.cn/?channel=autoglm_android

一、AutoGLM沉思三大關鍵特性，讓機器“邊想邊干”

智譜打造AutoGLM沉思的目標就是：讓機器不僅能夠(gou)思考，還能主動行(xing)動，實現“邊想邊干”。

這(zhe)一能力的實現(xian)依賴(lai)于三(san)個(ge)關鍵特性：

深度思考能夠模擬人類在面對復雜問題時的推理與決策過程；感知世界能夠像人一樣獲取并理解環境信息；工具使用能夠像(xiang)人一樣調用(yong)和操作工(gong)具，完成(cheng)復雜任務。

AutoGLM沉思融合了以上三大能(neng)力(li)。與OpenAI的Deep Research不同(tong)，它不僅能(neng)深入(ru)研究(jiu)，還(huan)能(neng)真正執(zhi)行(xing)任務，推動AI Agent從單純的思考者，進化為能(neng)交(jiao)付結(jie)果的智(zhi)能(neng)執(zhi)行(xing)者。

AutoGLM沉思模型的背后，是智譜自主研發的全棧大模型技術，融合了GLM-4的(de)通用能(neng)力(li)(li)、GLM-Z1的(de)反(fan)思能(neng)力(li)(li)、GLM-Z1-Rumination的(de)沉(chen)思能(neng)力(li)(li)，以(yi)及(ji)AutoGLM的(de)自動執行(xing)能(neng)力(li)(li)。

智譜發布全新Agent，集深度研究和操作執行于一體，背后模型媲美DeepSeek-R1

1、新版基座模型

基于最新的(de)(de)技術積累，智譜重新訓練(lian)了320億參(can)數的(de)(de)基座模(mo)型GLM-4-Air-0414，在(zai)預訓練(lian)階(jie)段加入了更多的(de)(de)代碼類(lei)、推理類(lei)數據，并在(zai)對(dui)齊階(jie)段針(zhen)對(dui)智能體(ti)能力(li)進(jin)行了優(you)化，模(mo)型在(zai)工具調(diao)用、聯網(wang)搜索、代碼等智能體(ti)任務上(shang)的(de)(de)能力(li)得到大大加強。

GLM-4-Air-0414以32B參(can)數量比肩更大參(can)數量的(de)國(guo)內外主流(liu)模型，這使得模型在適配智(zhi)能體(ti)(ti)任務(wu)方面(mian)特(te)別有效，是(shi)因為智(zhi)能體(ti)(ti)任務(wu)往往涉(she)及多輪復雜(za)交(jiao)互，32B的(de)參(can)數量使得GLM-4-Air-0414能快(kuai)速執(zhi)行復雜(za)任務(wu)。

智譜發布全新Agent，集深度研究和操作執行于一體，背后模型媲美DeepSeek-R1

2、新版推理模型

基于GLM-4-Air-0414，智譜引入了(le)更多(duo)推理類數據，并(bing)在(zai)對齊階段深(shen)度(du)優化了(le)通用能力(li)，推出了(le)全新(xin)的深(shen)度(du)思考模型GLM-Z1-Air。

在性(xing)能表現上(shang)，GLM-Z1-Air可(ke)以與DeepSeek-R1（671B，激(ji)活37B）媲美(mei)。智譜在AIME 24/25、LiveCodeBench、GPQA等基準測(ce)試中(zhong)對GLM-Z1-Air進(jin)行了評估，評估結果顯示GLM-Z1-Air展(zhan)現了較為強大的(de)(de)數理推理能力，為更多復雜任務的(de)(de)解(jie)決提供了支持：

智譜發布全新Agent，集深度研究和操作執行于一體，背后模型媲美DeepSeek-R1

在(zai)推理速度上，GLM-Z1-Air相比R1提升(sheng)了8倍，成本(ben)可(ke)以(yi)降(jiang)低至1/30。

智譜發布全新Agent，集深度研究和操作執行于一體，背后模型媲美DeepSeek-R1

此外，GLM-Z1-Air可在消費級(ji)顯卡上運(yun)行。

智譜發布全新Agent，集深度研究和操作執行于一體，背后模型媲美DeepSeek-R1

智譜還在(zai)MAAS平臺上將免費模(mo)型GLM-4-Flash的(de)基(ji)座版(ban)本(ben)更新(xin)至GLM-4-Flash-0414，并(bing)推(tui)出了對應的(de)推(tui)理版(ban)本(ben)GLM-Z1-Flash，在(zai)保留(liu)大(da)部分(fen)效果的(de)情況下更輕量級、更高速(su)，完全免費調用。

3、沉思模型

基于GLM-Z1，智譜通(tong)過(guo)擴展(zhan)強化(hua)學(xue)習訓(xun)練，提升(sheng)了模(mo)型(xing)結合(he)工具使用完成(cheng)長程推理能力，訓(xun)練出沉思模(mo)型(xing)GLM-Z1-Rumination。

智譜發布全新Agent，集深度研究和操作執行于一體，背后模型媲美DeepSeek-R1

該模(mo)型突破了傳(chuan)統AI單(dan)純依賴內部(bu)知識推理的局限，結合實(shi)時聯網搜索、動態(tai)工具調用、深度分(fen)析(xi)和自我驗(yan)證(zheng)，形成完整的自主(zhu)研究流(liu)程：

實時搜索可(ke)以(yi)主動獲取最新信息(xi)，突(tu)破信息(xi)孤島；深度(du)分(fen)析進(jin)行多(duo)角度(du)邏輯(ji)推理，避免單一思維路徑(jing)；動態驗(yan)證可(ke)以(yi)不斷修(xiu)正假設，提(ti)高研究的準確性與邏輯(ji)性。

GLM-Z1-Rumination能夠主動(dong)理(li)解用戶需求(qiu)，在復雜任務中不(bu)斷優(you)化推理(li)、反(fan)復驗證與修正假(jia)設，使研究成(cheng)果更具可靠性與實(shi)用性。

4、AutoGLM

智譜的(de)AutoGLM系列再(zai)次(ci)取得重(zhong)要進展。

在(zai)斯坦福大(da)模型中心《AI指(zhi)數2024》選定的智(zhi)能體基準(zhun)評測AgentBench上(shang)，AutoGLM系列模型在(zai)5個測試環境(jing)中也(ye)取得了(le)SOTA的成績。其中，在(zai)Phone Use基準(zhun)（AndroidLab & AndroidWorld）中，AutoGLM-Phone的任務成功率(lv)較此前最佳(jia)成績提升(sheng)超(chao)過20%；在(zai)Browser Use基準(zhun)上(shang)，AutoGLM-Web也(ye)全(quan)面超(chao)越OpenAI GPT-4o和Anthropic Claude-3.5-Sonnet，展現(xian)了(le)在(zai)網頁交互場(chang)景中的領先能力。

在GUI智能體領域，智譜自(zi)研(yan)模型(xing)GLM-PC（CogAgent）在多個權威評測榜單上取得SOTA成績(ji)。憑借9B參(can)數規模，CogAgent超越了包括GPT-4o+UGround、Claude Computer Use等更大規模的同類模型(xing)或商用(yong)API。

智譜發布全新Agent，集深度研究和操作執行于一體，背后模型媲美DeepSeek-R1

二、聚焦Agentic GLM研發，聯手金融、教育、醫療、政務、企服賽道

智(zhi)譜在AI Agent領域的研(yan)發(fa)，包(bao)括從最早推出具(ju)備(bei)Function Call能(neng)(neng)力的智(zhi)譜清言，到(dao)(dao)率先上線支持(chi)智(zhi)能(neng)(neng)體編排的GLMs，再到(dao)(dao)推出全球首(shou)個設備(bei)操控智(zhi)能(neng)(neng)體AutoGLM。

2025年，智(zhi)譜將戰略聚焦Agentic GLM的(de)研發。

在技術(shu)方面，智譜將(jiang)依托原(yuan)創自主大模(mo)(mo)型(xing)技術，持(chi)續推動(dong)具(ju)備邏(luo)輯推理和深度思考能力的Agent基(ji)座(zuo)模(mo)(mo)型(xing)與通用基(ji)座(zuo)模(mo)(mo)型(xing)的研發(fa)，再(zai)到智能體框架(jia)與Agent應用，朝(chao)著(zhu)讓(rang)機(ji)器像人一樣思考和行動(dong)的目標不斷前(qian)進(jin)。

智譜還將搭建Agentic LLM平臺，助力(li)生(sheng)態合作伙伴利用智(zhi)(zhi)譜(pu)模型與智(zhi)(zhi)能體(ti)的強大能力(li)，構建行業、地域與場(chang)景深度融合的智(zhi)(zhi)能體(ti)應用。

智譜發布全新Agent，集深度研究和操作執行于一體，背后模型媲美DeepSeek-R1

在行業生(sheng)態方面(mian)，智譜(pu)將作為模型(xing)廠(chang)商，幫助(zhu)應用(yong)合作伙(huo)伴(ban)在GLM模型(xing)上實現(xian)成功的大模型(xing)應用(yong)。目前，智譜(pu)已攜手(shou)金融、教育、醫療、政務(wu)、企(qi)服等領域(yu)的合作伙(huo)伴(ban)，共同推進Agentic LLM的落地應用(yong)。

智譜發布全新Agent，集深度研究和操作執行于一體，背后模型媲美DeepSeek-R1

與(yu)此同時(shi)，智譜也相繼與(yu)北京、杭州、上海、成都、珠海等城市達(da)成合作，與(yu)當(dang)(dang)地(di)龍(long)頭企業攜(xie)手推動當(dang)(dang)地(di)大模(mo)型應用(yong)生態的建(jian)設。

久久婷婷五月综合97色直播,日本日本熟妇中文在线视频,精品国精品自拍自在线,7777精品伊人久久久大香线蕉,男人用嘴添女人下身免费视频

一、AutoGLM沉思三大關鍵特性，讓機器“邊想邊干”

二、聚焦Agentic GLM研發，聯手金融、教育、醫療、政務、企服賽道

相關推薦