大模型的征战还未结束,一场关于AI Agent(智能体)的围猎之战又轰然开启。
被称为“全球首款真正意义通用AI Agent”的Manus,据报道近日完成一轮7500万美元的融资,融资后估值达5亿美元,比之前增长了约五倍。这距离其3月初上线只过去了个把月。
而这可能仅仅是大战序幕。近日,字节跳动悄然上线内测“扣子空间”;百度在开发者大会推出“心响”App;阿里云则以Qwen3开源模型引爆技术圈;OpenAI豪赌编程Agent;MCP 协议成为行业“通用插座”……大厂们在Agent赛道上正展开一场决定未来十年话语权的生态暗战。
AI Agent是什么,与人们日常使用的大模型有何不同?为什么这么火?大厂们在这场角逐中又各自抢得了怎样的竞争身位?
「不敢错失的战场」
3月6日,Manus一夜之间名声大噪,它生动诠释了AI Agent的概念:通过大模型的感知推理能力,它能自主拆解任务链,调用知识库、联网搜索、软件工具等资源,执行复杂任务,完成闭环操作。
以筛选简历为例,Manus不仅能解压文件、浏览简历,还能给出排名建议和评估标准,最终以电子表格形式呈现结果,俨然一名负责招聘的实习生。
当前,人们主要通过Chatbot(聊天机器人)与大模型交互,Chatbot属于能说会道,但不干实事儿。Agent则可以自主调用工具,能实际执行一些人们生活和工作中的常见任务,也就是能真正干活儿了。
这种从对话响应到任务执行的跨越,开启了远超Chatbot的商业想象空间。
Anthropic CEO Dario Amodei曾断言,未来2~3年内,AI可能在几乎所有任务上超越人类,五年内智能体将渗透90%的企业工作流。而据Markets & Markets测算,2024年全球AI Agent市场规模约为51亿美金,2030年有望增长至471亿美元,年复合增长率达44.8%。
面对AI Agent的巨大潜力,国内外AI厂商纷纷加快布局。
4月17日,OpenAI推出了具备更强Agent能力的推理模型o3和o4-mini,并预测至2029年,AI Agent及其他新产品的销售额将超越ChatGPT,推高总营收至1250亿美元,2030年总营收有望达到1740亿美元。
字节跳动则在Manus出圈后,调动多个团队开发不同的Agent产品,并于近日内测上线了“扣子空间”,提供多项技能的AI通用实习生。
*图源百度
“Agent是我们最看好的AI应用发展方向。”百度李彦宏曾如此表示。4月25日,在Create2025百度AI开发者大会上,百度发布文心大模型4.5 Turbo和深度思考模型X1 Turbo两款新模型之外,还发布了多款AI应用产品,其中就包括官方定位为通用超级智能体的心响App。
4月29日,阿里云开源了Qwen3系列模型,并在评估模型Agent能力的BFCL评测中,创下70.8分的新高,超越Gemini2.5-Pro、OpenAI-o1等顶尖模型,这将大幅降低Agent调用工具的门槛,为即将到来的智能体和大模型应用爆发提供更好的支持。
「个人版“贾维斯”VS数字化员工」
各大厂商对Agent的探索方向已现分野——有的走通用路线,有的走专业垂直路线;有的选择To C突围,扮演钢铁侠的“贾维斯”,争夺个人助理入口;有的则选择To B 深耕,嵌入企业工作流,打造数字化员工。
百度和OpenAI目前走的是To C路线。OpenAI的ChatGPT是常年霸榜的头部应用,月活跃用户已达5亿。拥有这个超级入口,OpenAI自然希望通过ChatGPT构建可适应任意场景的认知引擎。
另外,OpenAI还着重押注编程Agent。此前发布的“Operator”能让智能体接管用户电脑操作,例如自动编写代码并调试运行。前些天,OpenAI又发布了一个叫Codex CLI的开源轻量化编程Agent,可以使用OpenAI的模型,接管本地计算机终端命令行界面,直接进行代码编写。OpenAI还表示,未来将发布一系列编程工具,重新定义AI时代的编程。
百度则是专门研发了一款Agent应用——心响App,定位用户的智能生活助理,目前已在安卓上线,苹果iOS系统正在审核中,也将于近期上线。为了降低使用门槛,也为了激发用户对新应用的使用灵感,心响App特意预置了十大应用场景,包括例行任务、城市旅游、AI相亲、AI绘本、摸鱼游戏、深度研究、法律咨询、健康咨询、智慧图表和试题讲解等。
以AI绘本为例,用户只需要输入一个简单的主题,比如“狐狸的电话亭”,心响App就可主动连线百度文库AI小助手,按照用户对角色设定、配音、风格的偏好,完成绘本大纲,直至最终生成绘本视频。操作非常简便。据透露,心响App目前支持超过200种任务类型,未来计划扩展到10万+的应用场景。
*图源心响
与上述两家不同,微软与字节更希望通过B端办公需求切入。微软将Copilot植入Office、Teams等产品矩阵,试图把智能体变成企业工作流的“隐形中枢”。据统计,截至今年4月,超10万家企业使用Copilot Studio,日均处理任务超1亿次。微软预测,2025年Agent业务收入将占其AI总营收的35%。
*图源扣子空间
“和Agent一起开始你的工作”“扣子空间是你和AI Agent协同办公的最佳场所”,这是字节对扣子空间的产品定位,与微软一样试图将通用Agent概念嵌入工作流,帮助用户处理文件检索、表格制作、报告生成等任务。字节旗下协同办公应用——飞书的多维表格、飞书文档等服务也可接入,更强化了扣子空间作为数字员工的工作能力。
阿里则一边不断加强C端产品夸克的能力,一边在B端的钉钉上重点搭建AI Agent应用平台。目前钉钉AI助理已经聚合了AI客服、HR、AI销小帮、行政搭子、代码优化大师等众多工具,构建全链路企业服务矩阵。
目前来看,面向C端的Agent,除非像ChatGPT一样拥有庞大的用户基础,不然挑战很大。最大的问题是,普通用户对Agent还没多少概念,缺乏明确的使用目的,很多只是为了尝鲜玩玩。如果使用体验不够极致,无法给用户带来惊喜,其用户黏性就很难保持。Manus一直没有移动端,百度心响App无疑有身先士卒的勇气。但作为全新的一款应用,心响App完全没有用户积累,需要从0做起,势必需要百度投入巨大的资源。
而面向B端,因企业降本刚需明确、场景垂直,且由于一般企业都可能建立自己的知识库,办公类Agent执行任务更有针对性,交付效果无疑也会更好。另外,在商业化方面,微软Copilot、钉钉和飞书也都已经具备现成的营收手段,比C端的会员收费也更自然得多,预计发展会相对顺畅。
「生态与标准暗战」
除了智能体,当下AI领域最炙手可热的概念,莫过于MCP。而MCP与智能体之间又存在着紧密的联系。
“MCP让AI更懂外部世界,更容易获得信息,更自由地调用工具,是AI发展的一大步。”李彦宏在Create 2025百度AI开发者大会上多次强调MCP的重要性,“现在基于MCP开发智能体,就像2010年开发移动APP。”
大模型性能再好也不是万能的,Agent要处理复杂的、多环节的任务,就需要与外部的工具或服务进行交互。但在MCP出现之前,交互缺乏统一标准。做个形象的比喻,就好比秘书联系不同部门,都需要切换不同的通讯方式,比如电话、邮件、微信、钉钉、飞书等,自然毫无效率可言。
去年11月,Anthropic提出并开源了MCP,即模型上下文协议,旨在提供统一标准,可以理解为AI世界的USB-C,使Agent可像搭积木般调用航班查询、地图导航等服务。比如,在旅游规划测试中,接入MCP的Agent能依次调用航班、酒店、地图接口,任务完成效率比传统API对接提升5倍。
在Anthropic的推动下,尤其是在OpenAI和Google等巨头相继明确表态支持后,MCP正从一个有潜力的提议,加速成为被广泛接受的标准。据MCP社区PulseMCP统计,全球已经有超过4000个MCP服务器上线,而这一数字还在迅速增长。
国内AI厂商近期积极支持MCP。4月25日,百度宣布公司各产品全面拥抱MCP,既包括百度搜索、百度文库、百度网盘等应用,也包括文心基础大模型和百度智能云千帆平台;字节扣子空间也集成了飞书云文档、多维表格和高德地图等MCP扩展;阿里在支付宝等产品中集成了MCP协议,其最新发布的Qwen3系列模型也原生支持MCP。
MCP的普及,为Agent生态的构建和运转提供了重要通路。国内外AI厂商们基本都推出了自家的MCP平台,邀请更多的开发者、应用服务商进驻。例如,360旗下的纳米AI最近上线“万能工具箱”,已有超100个自研和优选MCP工具,并且更多第三方MCP工具正在进驻中。
当MCP打破工具调用壁垒,智能体开发正进入"乐高积木"时代。这场战役的胜负关键已从技术突破转向生态构建能力。正如移动互联网催生APP经济,AI Agent正在开启智能体经济的黄金十年。