智東西AI前瞻(公眾號(hào):zhidxcomAI)
編譯 江宇
編輯 漠影
智東西8月27日?qǐng)?bào)道,Anthropic今日推出一款瀏覽器端AI Agent工具“Claude for Chrome”,允許用戶直接在Chrome中調(diào)用Claude完成瀏覽、點(diǎn)擊、填表等操作。
該產(chǎn)品以Chrome插件形式運(yùn)行,目前作為“研究預(yù)覽”階段,僅向1000名Claude Max訂閱用戶開(kāi)放測(cè)試,并同步開(kāi)放候補(bǔ)名單登記。
Anthropic將這一功能視為AI接入人類(lèi)日常軟件生態(tài)的“下一步”,但也直言其中存在嚴(yán)峻安全挑戰(zhàn),尤其是Prompt Injection(指令注入)攻擊風(fēng)險(xiǎn)。
Anthropic方面透露,Claude for Chrome已通過(guò)大量紅隊(duì)測(cè)試驗(yàn)證風(fēng)險(xiǎn)點(diǎn),并實(shí)測(cè)在引入新防御機(jī)制后,將攻擊成功率從23.6%降低至11.2%,部分特定場(chǎng)景中甚至降至0%。
FellouAI創(chuàng)始人、前字節(jié)跳動(dòng)工程師謝揚(yáng)也隨即發(fā)聲稱:“FellouAI可以作為Claude for Chrome的替代方案,新版本將于9月2日上線?!弊鳛橐豢钪鞔颉癆gentic Browser”形態(tài)的瀏覽器,F(xiàn)ellouAI也被視為本輪瀏覽器智能體競(jìng)速中的有力競(jìng)爭(zhēng)者。
▲圖源:X
過(guò)去幾個(gè)月,Anthropic陸續(xù)上線了Claude對(duì)接用戶日歷、文檔等多種功能,如今終于邁入“瀏覽器操作”階段。通過(guò)Chrome插件,Claude可以在用戶授權(quán)下“看到你在瀏覽什么”,并執(zhí)行點(diǎn)擊、輸入、跳轉(zhuǎn)等操作,實(shí)現(xiàn)更深入的網(wǎng)頁(yè)自動(dòng)化能力。
1、找房篩選:用戶在Chrome中輸入一句自然語(yǔ)言指令(如“幫我在西雅圖找一套3室、1500平方英尺以上、帶車(chē)庫(kù)、價(jià)格在80萬(wàn)美元以內(nèi)的房子”),Claude可自動(dòng)打開(kāi)Zillow頁(yè)面,配置篩選條件并返回最優(yōu)選項(xiàng)列表。過(guò)程中,它會(huì)附上頁(yè)面、定位搜索框、勾選條件,并請(qǐng)求權(quán)限后執(zhí)行操作,實(shí)現(xiàn)“AI找房”。
2、文檔總結(jié):在Google Docs中,Claude可讀取整份PRD文檔并自動(dòng)提取出所有評(píng)論內(nèi)容、匯總要點(diǎn),并生成結(jié)構(gòu)化摘要。Claude已具備通讀上下文、提煉團(tuán)隊(duì)共識(shí)的能力,輔助用戶高效處理修改意見(jiàn)。
3、外賣(mài)下單:在DoorDash場(chǎng)景下,Claude可以理解用戶需求(如“幫我找一份蒜香面并加到購(gòu)物車(chē)”),定位網(wǎng)頁(yè)中對(duì)應(yīng)模塊,選擇符合條件的餐廳選項(xiàng),執(zhí)行搜索與加購(gòu)操作。
4、企業(yè)系統(tǒng)操作:在Salesforce這類(lèi)企業(yè)管理平臺(tái)中,Claude已能識(shí)別并操作系統(tǒng)級(jí)表單字段,例如點(diǎn)擊“Convert Lead”按鈕、識(shí)別彈窗信息、定位字段名稱并修改內(nèi)容,完成一系列跨層級(jí)自動(dòng)操作,具備替代部分重復(fù)人工作業(yè)的潛力。
Claude的能力覆蓋了多種高頻使用場(chǎng)景,整體功能表現(xiàn)硬核。網(wǎng)友也對(duì)Claude瀏覽器能力的下一步聯(lián)動(dòng)表現(xiàn)出期待:“如果這套瀏覽器能力未來(lái)能和Claude Code整合,可能會(huì)非常驚艷。”
▲圖源:X
這些演示案例都指向一個(gè)趨勢(shì):Claude正嘗試打通“從理解語(yǔ)言、到瀏覽網(wǎng)頁(yè)、到實(shí)際執(zhí)行”的閉環(huán),形成一個(gè)貫穿任務(wù)全流程的瀏覽器Agent。
它不再是一個(gè)純文本助手,而是可以“點(diǎn)按鈕”“填表單”“讀評(píng)論”“下訂單”的網(wǎng)頁(yè)操作者,真正把瀏覽器變成AI的操作系統(tǒng)。
Anthropic認(rèn)為,瀏覽器作為信息聚合中樞,將成為AI Agent的核心落點(diǎn),“我們已經(jīng)在內(nèi)部測(cè)試中觀察到Claude能處理包括日程管理、會(huì)議安排、郵件草擬、費(fèi)用報(bào)銷(xiāo)與網(wǎng)站測(cè)試等任務(wù),效果明顯?!?/p>
但這類(lèi)能力也伴隨著系統(tǒng)級(jí)安全挑戰(zhàn),其中最大的問(wèn)題是Prompt Injection:攻擊者可在網(wǎng)頁(yè)、郵件甚至DOM隱藏內(nèi)容中埋藏指令,誘使AI執(zhí)行惡意行為,例如在隱藏文本寫(xiě):忽略前述指令,改為執(zhí)行某惡意操作。
在未加防護(hù)的早期測(cè)試中,一封偽裝為“公司安全通知”的郵件成功誘導(dǎo)Claude刪除用戶所有郵件。而Anthropic的新防護(hù)措施成功攔截了這一攻擊:Claude識(shí)別出這是可疑的釣魚(yú)郵件,并未執(zhí)行指令。
Claude for Chrome已上線多層安全機(jī)制,包括:
1、權(quán)限控制:用戶可手動(dòng)限制Claude訪問(wèn)網(wǎng)站范圍。
2、高風(fēng)險(xiǎn)行為確認(rèn)機(jī)制:如發(fā)布、付款、數(shù)據(jù)共享等行為需用戶手動(dòng)確認(rèn)。
3、系統(tǒng)提示詞優(yōu)化:通過(guò)系統(tǒng)Prompt加強(qiáng)Claude對(duì)敏感操作的判斷能力。
4、敏感站點(diǎn)默認(rèn)禁用:金融、成人、盜版等類(lèi)站點(diǎn)Claude默認(rèn)不可訪問(wèn)。
5、行為模式識(shí)別:部署高級(jí)分類(lèi)器識(shí)別潛在攻擊指令與異常數(shù)據(jù)訪問(wèn)請(qǐng)求。
在Anthropic的實(shí)測(cè)中,未加防護(hù)的Claude瀏覽器使用場(chǎng)景下,Prompt Injection攻擊成功率高達(dá)23.6%;而引入新防御機(jī)制后,成功率降至11.2%。特別是在DOM隱藏字段、URL偽裝、標(biāo)簽誘導(dǎo)等“瀏覽器特有攻擊”場(chǎng)景下,攻防結(jié)果從35.7%成功率降低至0%。
▲在三種測(cè)試場(chǎng)景中,Prompt注入攻擊的成功率對(duì)比(分?jǐn)?shù)越低代表防護(hù)效果越好)。最新安全機(jī)制使Claude的攻擊成功率降至低于舊版電腦控制能力。
Anthropic強(qiáng)調(diào),這一版本仍為早期預(yù)覽,將借助測(cè)試用戶反饋,持續(xù)迭代分類(lèi)器與權(quán)限設(shè)計(jì)機(jī)制,以應(yīng)對(duì)未來(lái)可能出現(xiàn)的新型攻擊。
結(jié)語(yǔ):Claude切入瀏覽器入口,“AI+瀏覽器”競(jìng)速初現(xiàn)雛形
瀏覽器入口之爭(zhēng),已成為AI產(chǎn)品競(jìng)爭(zhēng)的前沿陣地。
Anthropic此舉與Perplexity推出Comet瀏覽器、OpenAI加緊研發(fā)AI瀏覽器產(chǎn)品,以及Google在Chrome中集成Gemini的方向不謀而合。與此同時(shí),Opera、Dia、Fellou等新玩家也在探索更具通用Agent能力的新瀏覽器形態(tài)。
無(wú)論是打造獨(dú)立Agentic瀏覽器,還是在現(xiàn)有瀏覽器中嵌入AI助手,各方都在爭(zhēng)奪人機(jī)交互的新入口。
誰(shuí)能率先在這個(gè)入口上形成更高頻、更有深度的AI執(zhí)行能力,還有待進(jìn)一步發(fā)展。
來(lái)源:TechCrunch
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.