智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影

智東西7月29日報道,7月28日,世界人工智能大會WAIC 2025期間,在由中國信息通信研究院舉辦的“大模型智塑全球產業新秩序論壇”上,螞蟻集團大模型安全解決方案“蟻天鑒”宣布升級,新增智能體(AI Agent)安全評測工具,具備Agent對齊、mcp安全掃描、智能體安全掃描、零信任防御等四大核心功能。

AI領域(yu)正從大模型時(shi)代邁向智(zhi)能(neng)(neng)(neng)體時(shi)代。智(zhi)能(neng)(neng)(neng)體不僅具(ju)備對話生成能(neng)(neng)(neng)力,還擁有自主規劃(hua)、跨領域(yu)推理,甚(shen)至能(neng)(neng)(neng)做出超越人類理解的決策,AI已進入“行動”階段。然而,智(zhi)能(neng)(neng)(neng)體的越權、過度代理等(deng)問題(ti)也帶來了安全挑戰(zhan)。

數(shu)(shu)據顯示,超(chao)過70%的(de)智能體從業者擔憂(you)AI幻覺(jue)與錯誤(wu)決策、數(shu)(shu)據泄露等問題(ti),因為(wei)AI生成的(de)內容往(wang)(wang)往(wang)(wang)包(bao)含事實錯誤(wu),或者對指令產生誤(wu)解,其中超(chao)半數(shu)(shu)受訪者表示,所在企業尚未設立明確的(de)智能體安全負責(ze)人(ren)。

世界數字科學(xue)院(yuan)(WDTA)最(zui)新發布《AI智能(neng)體運(yun)行安全測試標準》提出(chu)將(jiang)輸(shu)入輸(shu)出(chu)、大模型、RAG、記憶和(he)工具五(wu)個關鍵鏈(lian)路(lu)(lu)與(yu)運(yun)行環境對應(ying)起(qi)來,分析(xi)智能(neng)體全鏈(lian)路(lu)(lu)風險。

“蟻天(tian)鑒(jian)”為(wei)螞蟻集團聯合清華大學共同研發推出的大模型安全(quan)(quan)一(yi)體化解決(jue)方(fang)案(an),確保大模型技術在安全(quan)(quan)可(ke)靠的環境(jing)中(zhong)發揮效能,打造AI大模型的安全(quan)(quan)鎧甲。“蟻天(tian)鑒(jian)”新增的智能體安全(quan)(quan)評測功能,正與WDTA標準框架契(qi)合。

螞蟻集團“蟻天鑒”升級,新增智能體安全評測工具,提供四大核心功能

▲大模型安(an)全(quan)解(jie)決方案“蟻天鑒(jian)”新(xin)增智能(neng)體安(an)全(quan)評(ping)測(ce)工具

據介紹,升級的“蟻天鑒”在Agent運行階段,構建了一套智能體安全掃描系統,通過(guo)一系(xi)列(lie)專用工具來(lai)檢測Agent可(ke)能面臨的(de)(de)安(an)全風險(xian),實現端到端掃描(miao),確保工具與Agent的(de)(de)交互鏈路不被篡(cuan)改或(huo)繞過(guo),為復雜(za)環境下的(de)(de)穩定運行提供可(ke)驗證的(de)(de)安(an)全基線。

目前,“蟻天鑒”的風險研判Agent準確率可以達到96%以上,并可支持11個行業的智能體測試

MCP安全掃描功能,是(shi)行業內首個對外發布的MCP安全掃描工(gong)具,可自動化(hua)識別AI工(gong)具集成與(yu)數(shu)據交(jiao)換鏈路中的安全漏洞及風險(xian)行為,覆(fu)蓋工(gong)具投毒攻擊、間(jian)接提示詞(ci)注入、惡意(yi)代碼注入等3大類共10項子類風險(xian)。

此外,其Agent對齊功能集成了高效工具調用、敏(min)感(gan)雙重驗證(zheng)、多(duo)通道(dao)惡意識別及(ji)沙盒環境(jing)訓(xun)練,確保智能體的決策、行為與開(kai)發者預設目標(biao)、價(jia)值觀及(ji)倫理(li)道(dao)德保持一致。

通過深度理解智能體服務上下文與風險情境,“蟻天鑒”還可對每一次調用進行內容、鏈路、行為、權限、組件、來源、身份七層校驗,并依據策略引擎動態決策放行、降級或阻斷,實現 “永不信任,始終驗證”的零信任動態防御

“蟻天鑒(jian)”2.0在(zai)去年的世界人(ren)工智(zhi)能大會上發(fa)布,形成了包括大模型基礎設施(shi)測評(ping)、大模型X光測評(ping)、應用安全測評(ping)、AIGC濫用檢測、證件偽造檢測、圍欄防御等在(zai)內的完整技術(shu)鏈條,面向行業提供全方位智(zhi)能化的大模型安全測評(ping)和防御解決方案(an)。

螞蟻集團機器智(zhi)能部總經理、安全實(shi)驗室首席科(ke)學家王維強談道(dao):“升級的‘蟻天(tian)鑒’基于‘以攻促(cu)防(fang)’的安全理念(nian),通過構(gou)建‘對齊-掃描-防(fang)御’技(ji)術棧(zhan),形成全流程防(fang)護體(ti)系,從(cong)而為智(zhi)能體(ti)提供風險掃描與(yu)實(shi)時防(fang)御能力(li),我(wo)們(men)也(ye)將與(yu)行(xing)業(ye)共(gong)建,未(wei)來(lai)逐步開源開放安全工(gong)具。”