智東西AI前瞻(公眾號:zhidxcomAI)
編譯 | 江宇
編輯 | 漠影

智東西8月27日報道,Anthropic今日推出一(yi)款瀏(liu)覽器端AI Agent工具“Claude for Chrome”,允許用戶(hu)直接在(zai)Chrome中調用Claude完成瀏(liu)覽、點擊(ji)、填表(biao)等(deng)操作。

該產品以Chrome插件形式運(yun)行,目前作為“研究預覽”階段,僅向(xiang)1000名(ming)Claude Max訂閱用戶開放(fang)測試,并同步開放(fang)候補(bu)名(ming)單登記。

Claude殺進谷歌瀏覽器,Agent能點、能填、能跳轉,讓頁面自己“動”起來

Anthropic將這一功能視為AI接入人類日常軟件生態的“下一步”,但也直言其中存在嚴峻安全挑戰,尤其是Prompt Injection(指令注入)攻擊風險。

Anthropic方面透露,Claude for Chrome已通過大量紅隊測試驗證風險點,并實測在引入新防御機制后,將攻擊成功率從23.6%降低至11.2%,部分特定場景中甚至降至0%

FellouAI創始人(ren)、前字節跳動(dong)工程師謝揚也(ye)隨即發聲稱:“FellouAI可以作為Claude for Chrome的替代方(fang)案,新版本(ben)將于(yu)9月2日上線(xian)。”作為一款主打“Agentic Browser”形態的瀏覽器,FellouAI也(ye)被視為本(ben)輪瀏覽器智能體競(jing)速中的有力競(jing)爭(zheng)者。

Claude殺進谷歌瀏覽器,Agent能點、能填、能跳轉,讓頁面自己“動”起來

▲圖源:X

過去幾個(ge)月,Anthropic陸續上線了Claude對(dui)接用戶日歷(li)、文檔(dang)等多種功能,如今終于邁入“瀏(liu)覽器操作”階段(duan)。通(tong)過Chrome插件,Claude可以在用戶授權(quan)下“看到你(ni)在瀏(liu)覽什么”,并執行點擊、輸(shu)入、跳轉(zhuan)等操作,實現更深入的網頁自動化(hua)能力。

1、找房篩選:用戶在Chrome中輸入一句自然語言指令(如“幫我在西雅圖找一套3室、1500平方英尺以上、帶車庫、價格在80萬美元以內的房子”),Claude可自動打開Zillow頁面,配置篩選條件并返回最優選項列表。過程中,它會附上頁面、定位搜索框、勾選條件,并請求權(quan)限后執行操作,實現“AI找房”

Claude殺進谷歌瀏覽器,Agent能點、能填、能跳轉,讓頁面自己“動”起來

2、文檔總結:在Google Docs中,Claude可讀取整份PRD文檔并自動提取出所有評論內容、匯總要點,并生成結構化摘要。Claude已具備通讀上下文、提煉團隊共識的能力,輔助用戶高效處理修改意見。

Claude殺進谷歌瀏覽器,Agent能點、能填、能跳轉,讓頁面自己“動”起來

3、外賣下單:在(zai)DoorDash場景下,Claude可以(yi)理解用戶需求(如“幫我找一份(fen)蒜(suan)香面并(bing)加(jia)到購物車”),定位網頁中對(dui)應模塊(kuai),選擇符(fu)合條件的餐廳選項,執行搜(sou)索與加(jia)購操作。

Claude殺進谷歌瀏覽器,Agent能點、能填、能跳轉,讓頁面自己“動”起來

4、企業系統操作:在Salesforce這類企業管理平臺中,Claude已能識別并操作系統級表單字段,例(li)如點擊“Convert Lead”按(an)鈕、識別彈窗信息(xi)、定位字段(duan)名稱并修改內容,完成一系列跨層(ceng)級自動操作,具備替代部分重(zhong)復人工作業的(de)潛(qian)力。

Claude殺進谷歌瀏覽器,Agent能點、能填、能跳轉,讓頁面自己“動”起來

Claude的能(neng)力(li)覆蓋(gai)了多種高頻(pin)使(shi)用場景,整體功能(neng)表現硬核。網友也對(dui)Claude瀏(liu)覽(lan)器(qi)能(neng)力(li)的下一步聯(lian)動表現出期待:“如果這套瀏(liu)覽(lan)器(qi)能(neng)力(li)未來能(neng)和Claude Code整合,可能(neng)會非常驚艷(yan)。”

Claude殺進谷歌瀏覽器,Agent能點、能填、能跳轉,讓頁面自己“動”起來

▲圖源:X

這(zhe)些演示案例(li)都指向一個趨勢:Claude正嘗試打通“從理解語言、到瀏(liu)覽(lan)網頁、到實際執行(xing)”的閉(bi)環(huan),形成一個貫穿任務(wu)全流程的瀏(liu)覽(lan)器Agent。

它不再是一(yi)個純文本助手,而是可以“點按鈕”“填表單(dan)”“讀(du)評(ping)論”“下訂單(dan)”的網(wang)頁操(cao)作(zuo)者,真正把瀏覽器變成AI的操(cao)作(zuo)系統。

Anthropic認為,瀏覽器作(zuo)為信(xin)息(xi)聚合中樞,將成為AI Agent的(de)核心落點(dian),“我們已經(jing)在內(nei)部測試(shi)中觀察到(dao)Claude能處理包括日(ri)程管理、會議(yi)安排、郵件草(cao)擬、費用報銷與網站(zhan)測試(shi)等任務,效果明(ming)顯。”

但這類能力也伴隨著系統級安全挑戰,其中最大的問題是Prompt Injection:攻(gong)擊者(zhe)可在(zai)網頁(ye)、郵件甚至DOM隱(yin)藏(zang)(zang)內容(rong)中埋(mai)藏(zang)(zang)指令(ling),誘(you)使AI執(zhi)行惡意(yi)行為(wei),例如在(zai)隱(yin)藏(zang)(zang)文本寫(xie):忽略前述指令(ling),改為(wei)執(zhi)行某(mou)惡意(yi)操作(zuo)。

在未加防護的(de)早期(qi)測試(shi)中(zhong),一(yi)封偽(wei)裝為“公(gong)司安全通知(zhi)”的(de)郵(you)(you)件成功誘導(dao)Claude刪除(chu)用(yong)戶(hu)所有郵(you)(you)件。而Anthropic的(de)新防護措(cuo)施成功攔截了這(zhe)(zhe)一(yi)攻擊:Claude識別出這(zhe)(zhe)是可疑的(de)釣魚(yu)郵(you)(you)件,并未執行指令。

Claude殺進谷歌瀏覽器,Agent能點、能填、能跳轉,讓頁面自己“動”起來

Claude for Chrome已上線多層安全機制,包括:

1、權限控制:用戶可手動限制(zhi)Claude訪(fang)問網站范圍。

2、高風險行為確認機制:如發布、付款(kuan)、數據共享(xiang)等行為需用戶手動(dong)確認。

3、系統提示詞優化:通(tong)過(guo)系(xi)統Prompt加強Claude對(dui)敏感(gan)操作的判(pan)斷能力。

4、敏感站點默認禁用:金(jin)融(rong)、成(cheng)人、盜版等類站點Claude默認不可訪問。

5、行為模式識別:部署高(gao)級(ji)分類(lei)器識別潛在攻擊指令與異常數據(ju)訪問請求(qiu)。

在Anthropic的實測中,未加防(fang)(fang)護的Claude瀏(liu)(liu)覽(lan)器使用(yong)場景(jing)(jing)下(xia),Prompt Injection攻(gong)(gong)擊成功(gong)率(lv)高達(da)23.6%;而(er)引入新(xin)防(fang)(fang)御機制后,成功(gong)率(lv)降(jiang)至(zhi)11.2%。特(te)別是在DOM隱(yin)藏字段、URL偽裝、標(biao)簽誘導等“瀏(liu)(liu)覽(lan)器特(te)有(you)攻(gong)(gong)擊”場景(jing)(jing)下(xia),攻(gong)(gong)防(fang)(fang)結果從(cong)35.7%成功(gong)率(lv)降(jiang)低(di)至(zhi)0%。

Claude殺進谷歌瀏覽器,Agent能點、能填、能跳轉,讓頁面自己“動”起來

▲在三種測(ce)試場景中,Prompt注入攻(gong)擊的(de)成功(gong)率(lv)對(dui)比(bi)(分數越(yue)低代表防護效(xiao)果越(yue)好)。最新安(an)全機(ji)制使Claude的(de)攻(gong)擊成功(gong)率(lv)降至低于舊版電(dian)腦控制能力(li)。

Anthropic強調,這一版本仍為早期預覽,將借助測試(shi)用戶反饋,持續迭代分類器與權限設(she)計機(ji)制,以應對未來(lai)可(ke)能出現的新型攻擊。

結語:Claude切入瀏覽器入口,“AI+瀏覽器”競速初現雛形

瀏覽(lan)器入口之爭,已(yi)成為AI產品(pin)競(jing)爭的前沿陣地(di)。

Anthropic此(ci)舉(ju)與Perplexity推出Comet瀏覽(lan)器、OpenAI加緊研發AI瀏覽(lan)器產品,以及Google在Chrome中(zhong)集成Gemini的方向不謀而合。與此(ci)同時(shi),Opera、Dia、Fellou等(deng)新(xin)玩(wan)家也在探索更具通用Agent能力的新(xin)瀏覽(lan)器形態。

無論是(shi)打造獨立Agentic瀏覽器,還是(shi)在現(xian)有(you)瀏覽器中(zhong)嵌入(ru)AI助手,各方(fang)都(dou)在爭奪人機交(jiao)互的(de)新入(ru)口(kou)。

誰能率先在這個入(ru)口上形成(cheng)更高(gao)頻、更有(you)深度的(de)AI執行能力,還(huan)有(you)待進一步(bu)發展。

來源:TechCrunch