智東西(公眾號:zhidxcom)
作者|陳駿達
編輯|程茜

智(zhi)東西(xi)4月10日(ri)報道,今天,在谷(gu)歌(ge)(ge)云(yun)Next大會(hui)上,谷(gu)歌(ge)(ge)正(zheng)式發(fa)布Agent2Agent(A2A)開放協(xie)議。A2A協(xie)議讓智(zhi)能(neng)體(ti)之間的溝通(tong)與協(xie)作更為順暢,不同開發(fa)者發(fa)布的智(zhi)能(neng)體(ti)也可以有效(xiao)通(tong)信。

以(yi)(yi)招(zhao)聘場景的多智(zhi)能(neng)體(ti)系統為例,通過A2A協作,主智(zhi)能(neng)體(ti)可以(yi)(yi)在理解用(yong)戶(hu)需求后,以(yi)(yi)高效準確的方式,與其(qi)他(ta)專業智(zhi)能(neng)體(ti)互動,合作給(gei)出人選建議。用(yong)戶(hu)還可以(yi)(yi)參與到這一流程中,如指示智(zhi)能(neng)體(ti)安排(pai)進一步的面(mian)試(shi)。

谷歌給Agent造了個“微信”,和MCP功能互補,多智能體協作更順暢了

這一協議給智能體配備了一張“名片”,讓不同智能體看到彼此的功能。A2A還界定了智能體間溝通的固定方式,允許智能體相互發送消息,以傳達上下文、回復、交付物或用戶說明等信息。

A2A幫助智能體跨越孤立的數據系統和應用程序,完成協作,有望進一步提升智能體的自主性,并大幅提高其生產力,長期來看有望降低多智能體系統的使用成本

目前,A2A協議已經獲得了50多家企業與組織的技術支持(chi)和貢獻,包括PayPal、SAP、ServiceNow、埃森哲、德勤(qin)、畢馬威等知(zhi)名企業。

A2A協議與Anthropic的MCP(模型上下文協議)屬于互補關系,前者關注智(zhi)(zhi)能(neng)體(ti)間通信,后(hou)者將智(zhi)(zhi)能(neng)體(ti)與(yu)數據、資源和工具連接(jie),讓智(zhi)(zhi)能(neng)體(ti)更好(hao)地與(yu)現實世界交互。

為了更直觀的(de)講解A2A的(de)原理及其與MCP協議的(de)互補(bu)關(guan)系,谷歌提(ti)供了一個生動的(de)案(an)例:

假設存在一家汽車維修廠,這家店雇傭具備自主行為能力的員工,他們使用千斤頂、萬用表和套筒扳手等工具來診斷和修復問題。工人經常不得不診斷和修復他們以前從未見過的問題。維修過程可能涉及與客戶的對話、研究以及與零件供應商的合作。

谷歌給Agent造了個“微信”,和MCP功能互補,多智能體協作更順暢了

可以將上述場景中的員工類比為智能體,MCP協(xie)議處理的是員(yuan)工(gong)對(dui)工(gong)具的調度,A2A協(xie)議處理的是員(yuan)工(gong)與員(yuan)工(gong)、員(yuan)工(gong)與客戶(hu)(hu)(對(dui)應AI用(yong)戶(hu)(hu))間的溝(gou)通與協(xie)作。

具體來看,在修理廠場景(jing)中,MCP讓員工(gong)能使用工(gong)具,完成類似“將汽車抬升(sheng)50cm”、“將扳手往右擰4mm”這樣的(de)操作。

而A2A協議則讓用(yong)戶或(huo)員(yuan)工(gong)能與其他員(yuan)工(gong)合作,通過持續的溝通和不斷改善的計劃以實現結果(guo)。在汽車修理(li)廠情境(jing)里,A2A協議讓員(yuan)工(gong)可以主動詢問客戶或(huo)者其他員(yuan)工(gong):

“給我發一張左側輪胎的照片。”

“我注意到液體泄漏,這種情況已經發生了多長時間?”

A2A還可以(yi)幫助(zhu)汽(qi)車(che)修理廠(chang)員工(gong)與外部員工(gong)合(he)作,例如他們(men)的零件(jian)供應商。

上述交互過程中,A2A協議促進了“客戶端”智能體“遠端”智能體之間的通信(xin)。客戶端智(zhi)能體(ti)負責(ze)制定和傳(chuan)達(da)任務(wu),而遠(yuan)端智(zhi)能體(ti)負責(ze)處理這些任務(wu),提供(gong)正確的信(xin)息或(huo)采取正確的動作(zuo)。此交互(hu)涉及(ji)幾個關鍵功能:

1、功能發現:智(zhi)能(neng)體(ti)(ti)可(ke)以使用(yong)JSON格式的智(zhi)能(neng)體(ti)(ti)卡(類似智(zhi)能(neng)體(ti)(ti)的名片)公布(bu)其功能(neng)與(yu)驗證方(fang)式,讓(rang)客戶(hu)端智(zhi)能(neng)體(ti)(ti)確定可(ke)以執行任(ren)務的最(zui)佳智(zhi)能(neng)體(ti)(ti),并利(li)用(yong)A2A與(yu)遠端智(zhi)能(neng)體(ti)(ti)進(jin)行通信。

2、任務管理:客戶端智能體(ti)與(yu)遠端智能體(ti)之間的(de)(de)通信以任(ren)(ren)務完(wan)(wan)成為導向,雙方通過協作(zuo)滿(man)足(zu)終(zhong)端用戶的(de)(de)請求。該協議定義的(de)(de)“任(ren)(ren)務”對象具(ju)有完(wan)(wan)整生命(ming)周期(qi)——對于(yu)即時任(ren)(ren)務可(ke)快(kuai)速完(wan)(wan)成;對于(yu)耗時較長的(de)(de)任(ren)(ren)務,各智能體(ti)將持續同步任(ren)(ren)務的(de)(de)最新執行狀態。任(ren)(ren)務最終(zhong)產出(chu)的(de)(de)結果(guo)被稱為“交付物”。

3、協作:智(zhi)能體可以相(xiang)互發送消息,以傳達上下文、回復、交付物或用戶(hu)說(shuo)明(ming)。

4、用戶體驗協商機制:每條(tiao)消息均(jun)(jun)包(bao)含若干“內容(rong)單元”(如(ru)生成的(de)圖像等完整內容(rong)模塊(kuai))。每個單元均(jun)(jun)標注特定內容(rong)類型,使客(ke)戶端與遠端智能體能夠(gou)協(xie)商(shang)確定所需格(ge)式(shi),并特別涵蓋UI能力的(de)協(xie)調——包(bao)括嵌入式(shi)框架、視(shi)頻、網頁表單等交互元素(su)的(de)適配(pei)。

谷歌給Agent造了個“微信”,和MCP功能互補,多智能體協作更順暢了

谷(gu)歌(ge)與(yu)(yu)其合(he)作伙伴將(jiang)A2A建立在HTTP、SSE、JSON-RPC等廣泛使用的現有標(biao)準之(zhi)上,這意(yi)味著它(ta)能(neng)與(yu)(yu)企業日常(chang)使用的IT基礎設施集成(cheng)。A2A支持企業級身份驗證與(yu)(yu)授權,其認證方(fang)案在發布時(shi)即(ji)與(yu)(yu)OpenAPI標(biao)準保持同步。

A2A協議支持包括音視頻流在內的多種交互模態,并采用靈活設計,既能高效處理即時任務,也能支持需要數小時甚至數天(含人工介入環節)的深度研究任務

在整個過程中,A2A會向用(yong)戶提供實時反饋、通知和狀態更新。

結語:采用率未達臨界點,將繼續拓展用例和場景

在(zai)接受科技媒(mei)體VeatureBeat采(cai)(cai)訪時,谷歌云業(ye)務應用(yong)平臺副總裁(cai)兼總經(jing)理Rao Surapaneni稱,目前A2A雖(sui)獲得50多家合作伙伴的采(cai)(cai)用(yong),但(dan)并(bing)未(wei)達到采(cai)(cai)用(yong)率(lv)的“臨界點(dian)”。

未來,A2A能否成為一項易用(yong)、通行的(de)(de)協議,或將(jiang)在很大程度上取決于企(qi)業(ye)的(de)(de)采用(yong)率。Surapaneni稱(cheng),谷(gu)歌將(jiang)為A2A尋找更為廣(guang)闊的(de)(de)用(yong)例和(he)場(chang)景(jing),實(shi)現持續增長。

博客(ke)地址:
//developers.googleblog.com/en/a2a-a-new-era-of-agent-interoperability/