a一级爱做片免费观看欧美,久久国产一区二区,日本一二三区免费,久草视频手机在线观看

新聞中心

EEPW首頁 > 編輯觀點 > 「Agent代理人」將是AI競賽新的破局者?

「Agent代理人」將是AI競賽新的破局者?

作者:陳玲麗 時間:2025-03-13 來源:電子產品世界 收藏

號稱“全球首款真正意義上的通用 ”的國產產品風頭十足,刷屏海內外社媒。的名字來源于拉丁語Mens et ,意為“mind and hand”,即手腦并用,這也是麻省理工學院的校訓。

本文引用地址:http://www.j9360.com/article/202503/468051.htm

值得注意的是,Manus在權威的GA(General Assistants,通用AI助手)基準測試中創下了新紀錄,全部難度級別中的評分都超越了OpenAI的DeepResearch。Manus的出現標志著人機協作進入了一個新的范式,它可能是通向通用人工智能(AGI)的一個重要窗口。由于產品處于內測階段,僅以邀請碼形式開放使用,Manus急劇進入一個供不應求的狀態。

640-5.jpeg

經過2023年的百模大戰,2024年的應用之爭,行業淘汰賽加劇,2025年對于初創企業而言,落地路線的選擇至關重要。Manus不僅僅是一個只會聊天的對話式AI工具,它是一個多模型、多智能體產品,擁有“獨立思考”能力,能夠對復雜的通用任務進行多步驟拆解并執行。只需要告訴它最終目標,Manus就可以靈活調用各類工具,自主執行瀏覽網頁、操作網頁應用、編寫并執行代碼等操作來實現。

人」有多強?

業內常規產品中,通行的邏輯是在平臺內整合全球供應鏈企業信息,來幫助用戶完成供貨商/需求方匹配這件事。但在Manus的案例中,你能看到完全不同的實現方式。Manus與傳統AI助手最大的不同在于自主規劃與執行能力,從“被動響應”向“主動執行”的跨越,其核心架構通過多模型協作將復雜任務拆解為子目標,并調用外部工具逐步完成。例如,用戶只需輸入“分析特斯拉股票并制作PPT”,Manus會自動完成數據搜集、分析、圖表生成及PPT排版,全程無需人工干預。類似任務如簡歷篩選、房產推薦等,Manus均能通過虛擬機技術分解步驟,模擬人類工作流。

打開Manus界面,有四部分構成,分別是瀏覽器、搜索、編輯器和終端,是把各類功能組合封裝好的一款產品。具體來看,第一步跟ChatGPT一樣有對話界面,用戶需要提出具體的訴求,之后操作界面被劃分為了兩部分,左面是對話界面,右面是終端。當開始執行任務后,左面開始識別意圖、制定執行步驟以及開始搜索、調用所需的各類工具,右面的終端相當于一個虛擬機,可以同步執行文件處理、代碼生成、搜索瀏覽器等工作。

里面有一個小插曲,據說,Manus團隊一開始的方向是AI瀏覽器。在偶然看到Arc被放棄后,他們才決定了終止AI瀏覽器的研發工作。現在在使用過程中,也能看到瀏覽器的痕跡。

Manus目前采用「Multiple 」架構,運行在獨立的虛擬機中。通過規劃型Agent負責任務拆解、執行型Agent調用具體工具、監控驗證Agent跟蹤任務進度和debug等多層分工協作機制,來大幅提升對復雜任務的處理效率,并通過并行計算縮短響應時間。此外,Manus還具備記憶能力,能夠在執行類似任務時不斷優化和提升自己的工作效率:例如若用戶習慣以Excel接收結果,后續任務會自動優先生成表格。整個過程在云端異步完成,這意味著用戶可以隨時關閉電腦,等待結果生產。

640.gif

在這個架構中,每個可能基于獨立的語言模型或強化學習模型,彼此通過API或消息隊列通信。同時每個任務也都在沙盒中運行,避免干擾其他任務。專用RL小模型負責系統中最關鍵的決策環節:意圖識別、任務規劃和工具調用。整個工作流程設計以一份todo.md文件為核心,它兼顧記憶和指揮,解決了AI Agent長期面臨的上下文管理難題,并且能夠保持執行反饋與todo.md之間的動態聯系。

使用Manus過程中,用戶能感受到的體驗感更多是跨App操作能力及其可視化過程帶來的,而輸出結果的可用性完全有賴于基礎模型的能力。最近幾個月的一系列推理模型比如GPT o3、DeepSeek R1、QWQ、Claude 3.7 Sonnet等的發布甚至開源,一定程度上提升了路徑規劃能力、深度研究能力和代碼寫作的準確率,為更具生產力的agent提供了可能。

Manus的火爆加速了開源社區的創新進程,MetaGPT等團隊迅速推出OpenManus、OWL等開源項目,通過復現核心架構推動Agent技術普惠化。開源社區的活躍表明,行業競爭壁壘正從單一模型性能轉向工程化能力,包括工具鏈封裝效率、場景適配性及用戶體驗優化。不過,實際應用仍需解決模型幻覺、響應速度等體驗問題,這將是下一階段技術演進的重點。

Manus存在的爭議

在Manus的解釋理虛擬機中的計算機應用并不多,主要體現在模擬用戶點擊、瀏覽和切換工具使用,意義不是十分大。因此Zengyi Qin(MIT博士)認為它在本質上還是一個預先設定的“workflow”,在無邊界操作系統級環境(open-ended OS Level environment)中并未取得突破。官網上介紹的智能研究、高級數據分析、任務自動化三大功能其實也就是Manus的極限了。

640-6.jpeg

Manus真正的殺手锏是它模擬人類方式工作方式的能力,它并沒有做到哪些人類當前真正無法做到的事,這也就是為什么一些已經體驗過的用戶,形容Manus為“一個實習生”。而Manus團隊本身并不自研,而是基于業內開發“套殼”產品,這也是Manus被不少AI業內人士認為不具備“護城河”、以及在技術層面并沒有太多新東西的原因之一。

需要指出的是,根據參加過溝通會的行業人士表述,Manus并不諱言自己是一個“套殼”產品,其價值在于工程化創新 —— 通過逆向工程實現任務拆解邏輯的標準化,降低開發門檻,為行業提供了可復用的技術框架。這種將底層模型與工具調用深度集成的模式,或將成為Agent產品的通用范式。

一場產品經理式的成功

在Manus獲得如此熱度之后,就如同好奇DeepSeek團隊成員一樣,外界也開始關心這家應用層公司團隊的來歷。Manus團隊主要成員包括創始人肖弘、產品合伙人張濤和首席科學家季逸超。其中,張濤曾在字節跳動負責國際化產品,隨后在光年之外擔任產品負責人,與肖弘、季逸超共同成立Manus AI并擔任合伙人后,目前負責產品戰略、市場溝通及用戶體驗優化,主導構建了Manus的多代理架構設計,提出“用戶體驗應從答案交付轉向成果交付”的產品理念。

一個很明確的事實是,Manus誕生的必要前提是基座模型的性能提升,但這是過去兩年來整個行業有目共睹的趨勢,為什么率先讓Agent獲得注意力的會是Manus?從傳播路徑上來看,Manus與DeepSeek-R1一樣,爆火是因為成功打出了用戶體驗上的低門檻和時間差。DeepResearch只有200美元/月的ChatGPT Pro用戶才能夠使用,因而Manus更容易在體驗上形成沖擊。

這是一場產品經理式的成功,考驗的是產品設計能力和產品實現技能。這種能力,是Manus團隊所擅長的,也是曾被市場所低估的。

Manus控股公司蝴蝶效應(Butterfly Effect Hong kong)成立于2023年,境內企業名為北京紅色蝴蝶科技有限公司,還在武漢設有分公司。在Manus之前,主要有兩款產品:2023年初推出號稱All-in-One的AI助手瀏覽器插件Monica,接入了ChatGPT等工具的API,可為用戶提供搜索、閱讀、寫作、翻譯、創作等多種任務的協助,截至2024年年底,主打海外市場的Monica已經擁有了超過1000萬的用戶;另一款則是2023年收購而來的另一款插件ChatGPT for Google。

現在的Manus距離正式版想交付給大家的體驗還差很遠,像模型幻覺、交付物友好度、運行速度等方面都還有很大的提升空間。未來,Manus或將基于AHPU(Agentic Hours Per User)這一新指標打造出獨屬于AI的商業模式,即衡量用戶委托AI完成任務的時間效率,目標是通過并行任務提升生產力,否則很難完成規模化。目前,Manus通過KV cache優化、推理時延壓縮、執行流程精簡等手段,實現了單次任務消耗控制在兩美元左右的成本。但是,單次任務的成本可能只是一個平均數或中位數,許多動輒兩小時的任務生成,其消耗成本應該不止于此。

AI的下一個關鍵階段

2025年是AI Agent爆發的元年已經成為行業共識。根據麥肯錫等多份權威報告,在多元化需求驅動下,AI Agent市場呈爆發式增長態勢,2024年全球AI Agent市場規模約為51億美元,預計2030年將飆升至471億美元,復合年增長率高達44.8%。

與GPT等對話式AI不同,AI Agent能像人類助手般獨立規劃任務、調用工具并交付成果。如果說讓AI長出了“腦”,那AI Agent就是讓AI長出了“手和腳”。借用OpenAI前應用研究主管Lilian Weng的經典定義,一個合格的Agent需要三大核心能力:Planning(規劃)、Tool use(工具使用)、Memory(記憶)。

640-7.jpeg

AI Agent的熱潮并非偶然,而是技術演進的必然產物。早在2024年紅杉AI峰會上,吳恩達教授便預言“AI Agent是AI發展的下一個關鍵階段”。實際上,市場對AI Agent更早的感知來自于OpenAI和Anthropic。

· 2024年10月,由OpenAI前研究副總裁達里奧·阿莫迪、大語言模型GPT-3論文的第一作者湯姆·布朗等人共同創立的企業Anthropic,推出了基于Claude模型的擴展功能Computer Use,用戶能夠像指揮人類一樣指導Claude操作電腦,包括移動光標、點擊按鈕和輸入文本。在國內,智譜是最早探索Agent的初創企業,同期推出自主智能體AutoGLM。

· 2025年1月,OpenAI推出基于Computer-Using Agent模型的了首款AI智能體Operator,可以根據用戶指令,在云端執行任務,如訂餐、制定計劃、購物等。具體來說,CUA將GPT-4o的視覺能力與強化學習的高級推理能力相結合,經過訓練可以與圖形用戶界面(GUI)交互,就像人類使用鼠標和鍵盤操作一樣。如果遇到問題,Operator可以利用其推理能力自我糾正,遇到故障卡頓、需要幫助時,它會將控制權還給用戶,就像自動駕駛一樣。

可以預判的是,AI Agent是大模型公司不會錯過的產品方向,憑借算力、數據等優勢,大廠基本都是在模型端、應用端、智能體開發平臺協同三個領域閉環發展,傾向于以MaaS(模型即服務)形式將Agent嵌入現有應用生態。大廠們的思路在于,利用AI智能體賦能業務,完善AI應用生態,提高業務及自身在AI時代的競爭力。垂類企業則聚焦行業Know-how,開發場景化解決方案:例如,工業軟件廠商可基于Agent優化生產流程,而網絡安全企業可增強威脅響應能力。

大廠現在幾乎人手一個AI應用,有自研大模型,同時接入了DeepSeek-R1推理模型,RAG、聯網搜索更是現成的,原地改造或者再造一個Manus幾乎不是問題。而AI初創企業布局智能體的思路在于,推出更多可場景化的落地方案,尋找商業變現的路徑。隨著技術的不斷發展和市場的逐漸成熟,AI Agent領域的競爭將愈發激烈,各企業的產品也將不斷迭代升級,以滿足用戶日益增長的需求。

進入2025年,從Operator到Manus,從大廠到獨角獸的競相加速,一場圍繞AI Agent的競逐賽悄然拉開帷幕。就像比爾·蓋茨曾說的,“誰能主宰AI Agent,那才是大事,因為你將永遠不用去搜索網站或者亞馬遜”。Manus的爆火出圈,反映的是大眾對于以Manus為代表的這一類AI Agent產品的期待,拋開“套殼”帶來的爭議,當智能體的價值被更多人看到,智能體時代有望加速到來。



關鍵詞: Agent 代理 AI Manus 大模型

評論


相關推薦

技術專區

關閉