就在剛剛,全球首個手機(jī)通用Agent,來了!
現(xiàn)在,假如你正在開會,但只需要給手機(jī)打一句話,就能讓它“自己動起來”,給你點外賣:
- 幫我在美團(tuán)外賣上,找最近的瑞幸咖啡,點一杯大杯的冰美式。
完整視頻見量子位公眾號
可以看到,AI在接收到任務(wù)的一瞬間,就開始“嗖嗖”地執(zhí)行起了任務(wù)。
它會直接接管你的手機(jī),不需要在各種APP之間跳來跳去,就可以把點外賣的活兒給干完。
嗯,非常直觀的感受就是:夠方便,夠智能。
那么這個Agent到底是什么來頭?
它就是智譜剛剛發(fā)布的全球第一個手機(jī)通用Agent,就好比把Manus的能力搬到了手機(jī)一樣。
劃個重點:免費,人人可用!
或許這時候有小伙伴要說了,讓手機(jī)自己動的Agent不是已經(jīng)有了嘛?
非也非也,這次真的有點不太一樣。
因為智譜的這個Agent,所有任務(wù)都是在云端執(zhí)行,也就是相當(dāng)于給你的設(shè)備安了個云手機(jī)或云電腦,不僅任務(wù)執(zhí)行得流暢,更不影響你使用其它APP!
更重要的是,這也是全球第一個大眾消費級的Agent,不只手機(jī)(安卓、iOS均可),甚至可以操控云電腦幫你干活哦~
或許,這是你真正免費接觸、感受Agent的最佳時刻。
還能做什么?
我們先簡單介紹一下AutoGLM的操作方式。
在進(jìn)入APP之后,可以看到有兩個大類別的任務(wù)可選,一個是“生活助手”,另一個是“辦公助手”。
以生活助手為例,點進(jìn)來后是一個正常跟AI對話的窗口,但我們需要先點擊右上角的“手機(jī)”:
然后我們再點擊底部的“接管手機(jī)”,就來到了之前我們提到的“云端智能手機(jī)”界面了:
在這里,我們可以像操作正常手機(jī)一樣,進(jìn)入到任務(wù)可能需要的APP里,登錄并設(shè)置咱們自己的賬號等。
設(shè)置完畢后,我們就讓它auto起來了,這一次,我們來個復(fù)雜一點的任務(wù):
- 我要買一個200塊錢左右的保溫杯,幫我在淘寶、京東和拼多多上比一下貨。
完整視頻見量子位公眾號
可以看到,對于“貨比三家”這樣繁瑣的任務(wù),AutoGLM都可以“嗖嗖”地自主跨APP且精準(zhǔn)地執(zhí)行。
而我們所要做的,就是“發(fā)起任務(wù)→靜候結(jié)果”即可。
除了這些日常生活中能用到的功能之外,AutoGLM還特別擅長把工作、學(xué)習(xí)場景中的任務(wù)給auto起來。
而且不同于現(xiàn)在PC網(wǎng)頁端的Agent,AutoGLM是直接在手機(jī)里調(diào)用一臺云電腦給你干活!
我們先切換到“辦公助手”這個模式,界面是這樣的:
可以看到,在輸入欄的上方,便很方便地展示了“AI視頻”、“AI PPT”、“AI 網(wǎng)頁”等功能的入口。
這一次,我們先小試牛刀,讓AutoGLM生成一份關(guān)于Agent的調(diào)研報告:
- 幫我生成一份關(guān)于Agent的調(diào)研報告。
同樣的,我們無需做任何操作,就能看到AutoGLM自己用“云電腦”搜集、整理資料,在靜候幾分鐘之后,一份基于近100份參考源、數(shù)千字的報告就水靈靈地出來了:
進(jìn)一步的,我們可以要求AutoGLM把文字的結(jié)果做成一份PPT:
- 把這個報告做成一個精美的PPT。
不得不說,原先需要我們耗時起碼一天的工作,到了AutoGLM這里,真的僅僅需要幾分鐘的時間。
怎么做到的?
以上種種實測不難看出,相比傳統(tǒng)聊天機(jī)器人只會“告訴你怎么做”,AutoGLM已經(jīng)進(jìn)化到“直接幫你做”。
而且最重要的一點是,它幾乎不占用本地資源。
這也是本次AutoGLM的關(guān)鍵升級之處——為每位用戶準(zhǔn)備了一臺云手機(jī)和一臺云電腦,類似于云端備用機(jī)(里面提前裝好了一堆APP)。
有了這個東西,用戶無需安裝任何應(yīng)用、無需額外連接,就能直接調(diào)動AutoGLM執(zhí)行各種任務(wù);而且,AutoGLM干活時不會影響用戶正常使用自己的設(shè)備,二者互不干擾。
更妙的是,一些不常用但不得不裝的應(yīng)用,也可以直接放到云端備用機(jī)中,從而釋放更多本地存儲,讓設(shè)備運行更流暢。
總而言之,AutoGLM之所以能在手機(jī)、PC等設(shè)備上流暢運行,背后實打?qū)嶋x不開云端執(zhí)行這一底層設(shè)計。
從更廣的視角來看,“云端執(zhí)行”不僅精準(zhǔn)擊中了行業(yè)痛點,還順應(yīng)了當(dāng)下正在興起的一股趨勢。
今年以來,Agent的火爆有目共睹,但一到落地環(huán)節(jié)大家就開始集體頭疼:
第一,本地設(shè)備算力有限,普通手機(jī)電腦根本無法支撐高并發(fā)、高算力需求的Agent任務(wù)。換句話說,偶爾跑跑簡單任務(wù)還行,一遇到復(fù)雜任務(wù)就容易“宕機(jī)”。
第二,即便是執(zhí)行一些簡單任務(wù),Agent在運行時也會持續(xù)占用本地CPU、內(nèi)存甚至操作權(quán)限,嚴(yán)重影響用戶正常使用自己的設(shè)備,體驗感差。
而“云端執(zhí)行”恰好對癥下藥——既不占用本地資源,也不干擾用戶對真實設(shè)備的操作。
正因如此,目前已經(jīng)能看到有越來越多的行業(yè)玩家開始布局云端Agent。
例如互聯(lián)網(wǎng)大廠這邊,阿里云就在世界人工智能大會論壇上推出了專為智能體打造的“超級大腦”——無影AgentBay,以云端電腦形態(tài)執(zhí)行各項任務(wù)。
另外,PPIO等云廠商也推出了“Agent沙箱”等產(chǎn)品,為Agent提供專門的云端運行環(huán)境。
這些動作都說明,行業(yè)內(nèi)部已經(jīng)認(rèn)識到云端執(zhí)行對于Agent發(fā)展的重要性,并開始積極投入資源進(jìn)行布局。
而智譜此次推出的AutoGLM,正是依托這一設(shè)計,從只能跑跑簡單任務(wù)的初級Agent中脫穎而出,切實融入了普通人的工作與生活中。
萬物皆可AutoGLM
與此同時,AutoGLM并不局限于手機(jī)和電腦,還能被集成到更多載體中——
如智能音箱、車載系統(tǒng)甚至毛絨玩具里,主打一個“萬物皆可AutoGLM”。
為實現(xiàn)其廣泛應(yīng)用,智譜即日起還上線了移動端API申請通道及「AutoGLM開發(fā)者生態(tài)共建計劃」,通過開放API將AutoGLM的能力賦能給更多開發(fā)者的智能產(chǎn)品。
顯而易見,智譜在AutoGLM上的布局,有著自己的節(jié)奏和長遠(yuǎn)考量。
從成立的第一天起,這家公司就將通用人工智能(AGI)作為追求目標(biāo),并在后續(xù)提出了“讓機(jī)器像人一樣思考”的愿景。
圍繞這一目標(biāo),智譜規(guī)劃了L1-L5的AGI路線圖:從預(yù)訓(xùn)練大模型,到對齊推理、自我學(xué)習(xí)、自我認(rèn)知,直至最終的意識智能,一步步循序推進(jìn)。
而AutoGLM,正是智譜通往L3“自主學(xué)習(xí)智能體”的關(guān)鍵一步——通過將Agent能力帶給更廣泛的普通用戶,不僅驗證了當(dāng)前技術(shù)的可行性,還能在真實應(yīng)用中不斷積累經(jīng)驗與反饋,推動模型自主學(xué)習(xí)。
這種自我學(xué)習(xí)能力,使機(jī)器能夠突破單純依賴歷史數(shù)據(jù)獲取知識的局限,在與用戶和環(huán)境的持續(xù)交互中發(fā)現(xiàn)新知識、總結(jié)新方法,并反過來提升自身能力,形成技術(shù)與應(yīng)用的正向飛輪。
一旦這個飛輪持續(xù)運轉(zhuǎn),自然也能進(jìn)一步夯實智譜在Agent領(lǐng)域的領(lǐng)先位置。
而且這一次有個比較新的變化是,和GPT-5類似,AutoGLM也實現(xiàn)了能力“大一統(tǒng)”——
背靠智譜最新開源SOTA語言模型GLM-4.5與視覺推理模型GLM-4.5V(純國產(chǎn)Agent),首次將推理、非推理、編碼、研究、Agentic、GUI Agent等能力整合進(jìn)一個模型。
這也代表著智譜對AGI的早期理解:
- 具備通用完整的多模態(tài)和思維能力的模型是通向AGI的一個重要里程碑,AutoGLM是其對AGI的又一階段性探索成果。
另外從行業(yè)角度來看,AutoGLM更重要的意義或許在于,它用真實產(chǎn)品驗證了“云端執(zhí)行”這一路線的可行性與可靠性。
不過有一說一,AutoGLM在給行業(yè)提供新解法的同時,也為本就競爭激烈的Agent賽道再添一把火。
因為Agent發(fā)展到現(xiàn)在這個階段,拼的已經(jīng)不只是能否完成任務(wù),而是能否從簡單的執(zhí)行者,升級為能夠處理更復(fù)雜場景、更穩(wěn)妥應(yīng)對不確定性的“全能型選手”。
當(dāng)然,拋開廠商們之間的“腥風(fēng)血雨”,對普通用戶而言,AutoGLM這一新工具無疑正在真實改變我們和機(jī)器之間進(jìn)行交互的方式——
手中的大模型不再只是“會聊天”,而是能直接操作系統(tǒng),真正幫忙完成任務(wù)。
更進(jìn)一步,智譜還提出了從Agent邁向AGI應(yīng)始終追求的3A原則:
- Around-the-clock(全時):24小時待命與持續(xù)執(zhí)行,在用戶睡覺/離開/設(shè)備黑屏?xí)r仍可運行與產(chǎn)出。
- Autonomy without interference(自運轉(zhuǎn)、零干擾):Agent在云端設(shè)備運行,不占用用戶屏幕/算力。
- Affinity(全域連接):跳出瀏覽器對話框,連接手機(jī)、電腦、手表、眼鏡、PIN、家電等多種設(shè)備與服務(wù),覆蓋數(shù)字與物理世界。
可以預(yù)見,隨著技術(shù)的持續(xù)迭代與生態(tài)的不斷豐富,“問一句,剩下全交給Agent”的時代離我們真的不遠(yuǎn)了。
傳送門:
開發(fā)者生態(tài)共建計劃:https://autoglm.zhipuai.cn/misc/developer-apply
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.