2025-05-12
IDOPRESS
2025年1月至今,AI领域最出圈的除了DeepSeek,就是号称首个“通用AI Agent”(智能体)的Manus了,其邀请码一度被炒到8万元。很快,通用Agent就成为互联网大厂、AI独角兽们的新方向,迅速地“卷”了起来。
国外市场,Open AI、Claude、微软等迅速推出Agent产品或构建平台,国内企业也在4月迅速跟进。
4月,字节跳动、阿里巴巴、百度纷纷入局通用Agent市场,主打复杂的多任务、工作流功能,并对个人用户免费。腾讯则迅速更新腾讯元器的API接口和工具,助力开发者创建智能体并部署到微信、QQ等平台。同时,联想在其春季新品发布会带来“天禧个人超级智能体”,成为首个在硬件终端上集成通用Agent的PC OEM厂商。(详情见:AI数智人进入下半场,揭秘腾讯云的底气与野心)
由于目前大多数产品尚处于邀请测试阶段,公众感知还不算高。较为广泛的质疑是:相比传统的AI对话应用,通用Agent究竟是“真正能干活的AI”,还是AI产业的又一次炒作呢?
什么是通用 Agent?
所谓“通用 Agent”,可以简单理解成:一个拥有自主规划能力、上下文传递能力,可调用工具处理多任务并自动化执行的综合AI工具,更像是一个助手;而DeepSeek、豆包之类的AI Talkbot(AI对话应用)的定位更像是参谋,能够搜索答案、给出建议,但不参与执行。
举个简单的应用案例:如果你让DeepSeek调研一个产业并生成含有详细数据的报告,基本上只能得到一篇长文本;但如果使用Agent,它能生成一份带有详细文字和复杂图表(如饼状图、曲线图)的综合报告,并且能够保存为HTML或PDF文件。另外,两者在硬件要求、成本结构等方面也有所不同,具体入下表:
需要指出的是,一款出色的通用Agent并不一定需要自研大模型。以Manus为例,联合创始人季逸超曾公开表示其调用的模型是Claude和微调后的阿里Qwen模型。对于初创企业来说,开发通用Agent的门槛相对低一些,但并非简单“套壳”。还是用Manus举例,其技术架构由三大核心部分组成:Claude的MCP协议应用、专用RL小模型和自研工具包生态。通过精心设计深度融合,才有了Manus在该领域较为领先的地位。
通用Agent的另一个重大意义,是推动了MCP协议(Model Context Protocol,模型上下文协议)的普及,使其成为行业主流标准。MCP是一种专为人工智能模型设计的通信协议,可实现标准化的协同、资源管理,用于提升效率,相当于 “AI生态的USB接口”。
百度CEO李彦宏在Create 2025大会上这样形容MCP:“基于MCP开发智能体,就像2010年开发移动App。”可见其重要性。目前,谷歌、微软、阿里云、腾讯、百度等国内外巨头以及众多初创企业的Agent产品,均已支持MCP协议。(详情见:百度AI战略生变,背后是举棋不定的李彦宏)
有了全球爆款+通用协议背书,通用Agent的市场无疑即将起飞。据相关调研显示,中国AI Agent行业市场规模2023至2028年的复合增长率有望达到72.7%,达到约8000亿元规模。对于创业者们来说,这是一个融资上市、实现财富自由的新风口;而之于互联网大厂们,则是不得不争夺的流量入口,承担着转化、赋能的重任。
字节通用Agent,刚过及格线
在AIGC市场,不缺钱的大厂们能够在爆款出现后,以最快速度整合资源实现像素级复制,那么实际使用效果如何呢?为此,《华尔街科技眼》简单测试了一下两家大厂的通用Agent,分别是字节跳动的“扣子空间”和阿里巴巴的“心流”。
字节的“扣子空间”使用豆包1.5Pro为主的多款模型,目前处于内测期,需要申请排队才能使用。它的定位更像是“全技能实习生”,可以做PPT、生成行业报告等,亮点是接入了不少主流MCP工具,比如飞书、高德地图和Github等,对于互联网打工人来说很友好。
扣子空间的商业模式相对清晰,赢利策略由订阅服务(45%)、技术授权(25%)和企业解决方案(20%)三个部分构成。其中,个人基本版免费,进阶版、团队版和企业版的价格分别为9.9元/月、178元/月和4980元/月。目前,扣子空间已完成7500万美元融资,估值2亿美元。
阿里的“心流”则主打高级研究,在该模式下处理时长至少20分钟,适合做深度调研、写报告或是代码,消耗的Token资源更多。同样,心流目前也处于测试阶段,需要申请并通过审核才能使用。
笔者下达的具体任务是:统计一下全网通用AI Agent,做一个表格,需要统计每一个AI Agent的特色、目前是否上线,订阅价格等信息。先来看测试结果:
扣子空间的任务执行速度很快,几分钟便完成了统计。相对来说,扣子空间对“通用”这个关键字的理解比较准确,罗列了罗列了包括Manus、扣子(Coze)、钉钉AI助理等;不太准确的部分是将BetterYeah、亚马逊Lex等也归结为通用Agent,而实际上它们是一站式AI智能体开发平台,并非具体产品。另外,扣子空间可以将结果保存为MD表格和PDF文件。
图:扣子空间生成结果
心流方面,在高级研究的模式下,耗时29分52秒完成了任务,其浏览的数据明显更多,所以处理时间较长。贴心的是,在完成任务后心流会通过邮件通知使用者。心流生成的报告非常详细且图文并茂,使用曲线、六维图来丰富报告内容,支持HTML下载,PDF功能暂时为开放。然而,心流对“通用Agent”的理解完全错误,罗列了GPT-4o等主流大模型AI应用,还错误地将Manus的开发公司写成了字节跳动,报告的实际价值大幅降低。
图:心流生成结果
就此次测试结果而言,扣子空间的结果筛选后可用,勉强打60分;心流则明显不及格,毕竟在核心定义上出现了错误。结合网上众多Manus的测试结果来看,目前大厂的产品并不占据优势,这意味着初创企业们还有一定的发展空间,只是技术优势的窗口期是在不断缩短的。
初创企业们已经开始赚钱了
与大厂们不同,初创企业对于通用Agent的商业化更迫切。前小度CEO景鲲离职创业,其初创公司MainFunc已获得6000万美元融资,并发布了首款产品AI搜索引擎Genspark。
4月初,Genspark发布新产品Super Agent,主打数据检索、生成PPT、深度研究三大功能,日前又新增了AI Sheets工具集,表现十分全面。据景鲲表示,Super Agent 发布 9 天时间其年度经常性收入(ARR)便突破1000万美元。按照20美元/月的订阅费用来计算,其付费用户已经破万。
不过,Genspark目前的市场重心还是放在海外,景鲲似乎暂时没有回流国内的打算,Genspark封锁国内IP,无法使用。
作为首个通用Agent,Manus的成绩自然是目前最好的,海外市场39美元/月和199美元/月两种订阅模式,也充分展现了其自信。据非凡产研数据显示,Manus上线一个月后,其ARR已经达到4149万美元,月度经常性收入(MRR)环比激增755%,意味着开始盈利了。目前,Manus已成功融资7500美元、估值5亿美元,同时宣布与阿里通义合作开发中文版本。
大厂入局,殊途同归
除了字节和阿里,百度也有一款“心响”Agent推出,目前仅上线安卓版,iOS和PC版本尚未推出。百度的方向与竞品不同,更贴近普通消费者,官网给出的使用案例包括旅行规划、AI相亲等,感觉上有文小言的影子,但更注重一站式规划和任务托管场景。
除了互联网大厂,联想是首个推出通用智能体的硬件厂商。刚刚发布的天禧个人超级智能体,是一个典型的通用Agent,采用了端云混合部署架构,据悉其智能水平已部分达到L3级别。事实上从算力角度来看,“PC+通用Agent”的方案非常理想,轻薄本可通过处理器的NPU实现,游戏本或台式机的高端显卡算力甚至超过很多新能源汽车芯片。
对于大厂而言,通用Agent可以暂时不好用,但不能没有。一方面,这些应用深度绑定大厂各自的云服务,如火山引擎、阿里云等,在一定程度上起到了为ToB业务引流的作用;另一方面,在研发通用Agent的过程中,一些技术和应用形式可以赋能自身业务,比如电商、硬件等,带来了新的想象空间。
正如阿里巴巴集团CEO吴泳铭近日在阿里内网的发言:““阿里巴巴必须放下过去的成绩,回到创业初心,以创业者的心态,开启一段全新征程。”AI驱动这个词近年来频繁出现在阿里财报中,多维度赋能其电商、云计算业务,还吸引了苹果等新的合作伙伴。事实上,不论是国内的BAT还是微软、谷歌、亚马逊,终极愿景都是成为AI平台和技术的供应商。2025年的AI大战,将由通用Agent拉开序幕。
(责任编辑:zx0600)