大厂围猎AI智能体

大模型的征战还未结束，一场关于AI Agent（智能体）的围猎之战又轰然开启。

被称为“全球首款真正意义通用AI Agent”的Manus，据报道近日完成一轮7500万美元的融资，融资后估值达5亿美元，比之前增长了约五倍。这距离其3月初上线只过去了个把月。

而这可能仅仅是大战序幕。近日，字节跳动悄然上线内测“扣子空间”；百度在开发者大会推出“心响”App；阿里云则以Qwen3开源模型引爆技术圈；OpenAI豪赌编程Agent；MCP 协议成为行业“通用插座”……大厂们在Agent赛道上正展开一场决定未来十年话语权的生态暗战。

AI Agent是什么，与人们日常使用的大模型有何不同？为什么这么火？大厂们在这场角逐中又各自抢得了怎样的竞争身位？

「不敢错失的战场」

3月6日，Manus一夜之间名声大噪，它生动诠释了AI Agent的概念：通过大模型的感知推理能力，它能自主拆解任务链，调用知识库、联网搜索、软件工具等资源，执行复杂任务，完成闭环操作。

以筛选简历为例，Manus不仅能解压文件、浏览简历，还能给出排名建议和评估标准，最终以电子表格形式呈现结果，俨然一名负责招聘的实习生。

当前，人们主要通过Chatbot（聊天机器人）与大模型交互，Chatbot属于能说会道，但不干实事儿。Agent则可以自主调用工具，能实际执行一些人们生活和工作中的常见任务，也就是能真正干活儿了。

这种从对话响应到任务执行的跨越，开启了远超Chatbot的商业想象空间。

Anthropic CEO Dario Amodei曾断言，未来2~3年内，AI可能在几乎所有任务上超越人类，五年内智能体将渗透90%的企业工作流。而据Markets & Markets测算，2024年全球AI Agent市场规模约为51亿美金，2030年有望增长至471亿美元，年复合增长率达44.8%。

面对AI Agent的巨大潜力，国内外AI厂商纷纷加快布局。

4月17日，OpenAI推出了具备更强Agent能力的推理模型o3和o4-mini，并预测至2029年，AI Agent及其他新产品的销售额将超越ChatGPT，推高总营收至1250亿美元，2030年总营收有望达到1740亿美元。

字节跳动则在Manus出圈后，调动多个团队开发不同的Agent产品，并于近日内测上线了“扣子空间”，提供多项技能的AI通用实习生。

*图源百度

“Agent是我们最看好的AI应用发展方向。”百度李彦宏曾如此表示。4月25日，在Create2025百度AI开发者大会上，百度发布文心大模型4.5 Turbo和深度思考模型X1 Turbo两款新模型之外，还发布了多款AI应用产品，其中就包括官方定位为通用超级智能体的心响App。

4月29日，阿里云开源了Qwen3系列模型，并在评估模型Agent能力的BFCL评测中，创下70.8分的新高，超越Gemini2.5-Pro、OpenAI-o1等顶尖模型，这将大幅降低Agent调用工具的门槛，为即将到来的智能体和大模型应用爆发提供更好的支持。

「个人版“贾维斯”VS数字化员工」

各大厂商对Agent的探索方向已现分野——有的走通用路线，有的走专业垂直路线；有的选择To C突围，扮演钢铁侠的“贾维斯”，争夺个人助理入口；有的则选择To B 深耕，嵌入企业工作流，打造数字化员工。

百度和OpenAI目前走的是To C路线。OpenAI的ChatGPT是常年霸榜的头部应用，月活跃用户已达5亿。拥有这个超级入口，OpenAI自然希望通过ChatGPT构建可适应任意场景的认知引擎。

另外，OpenAI还着重押注编程Agent。此前发布的“Operator”能让智能体接管用户电脑操作，例如自动编写代码并调试运行。前些天，OpenAI又发布了一个叫Codex CLI的开源轻量化编程Agent，可以使用OpenAI的模型，接管本地计算机终端命令行界面，直接进行代码编写。OpenAI还表示，未来将发布一系列编程工具，重新定义AI时代的编程。

百度则是专门研发了一款Agent应用——心响App，定位用户的智能生活助理，目前已在安卓上线，苹果iOS系统正在审核中，也将于近期上线。为了降低使用门槛，也为了激发用户对新应用的使用灵感，心响App特意预置了十大应用场景，包括例行任务、城市旅游、AI相亲、AI绘本、摸鱼游戏、深度研究、法律咨询、健康咨询、智慧图表和试题讲解等。

以AI绘本为例，用户只需要输入一个简单的主题，比如“狐狸的电话亭”，心响App就可主动连线百度文库AI小助手，按照用户对角色设定、配音、风格的偏好，完成绘本大纲，直至最终生成绘本视频。操作非常简便。据透露，心响App目前支持超过200种任务类型，未来计划扩展到10万+的应用场景。

*图源心响

与上述两家不同，微软与字节更希望通过B端办公需求切入。微软将Copilot植入Office、Teams等产品矩阵，试图把智能体变成企业工作流的“隐形中枢”。据统计，截至今年4月，超10万家企业使用Copilot Studio，日均处理任务超1亿次。微软预测，2025年Agent业务收入将占其AI总营收的35%。

*图源扣子空间

“和Agent一起开始你的工作”“扣子空间是你和AI Agent协同办公的最佳场所”，这是字节对扣子空间的产品定位，与微软一样试图将通用Agent概念嵌入工作流，帮助用户处理文件检索、表格制作、报告生成等任务。字节旗下协同办公应用——飞书的多维表格、飞书文档等服务也可接入，更强化了扣子空间作为数字员工的工作能力。

阿里则一边不断加强C端产品夸克的能力，一边在B端的钉钉上重点搭建AI Agent应用平台。目前钉钉AI助理已经聚合了AI客服、HR、AI销小帮、行政搭子、代码优化大师等众多工具，构建全链路企业服务矩阵。

目前来看，面向C端的Agent，除非像ChatGPT一样拥有庞大的用户基础，不然挑战很大。最大的问题是，普通用户对Agent还没多少概念，缺乏明确的使用目的，很多只是为了尝鲜玩玩。如果使用体验不够极致，无法给用户带来惊喜，其用户黏性就很难保持。Manus一直没有移动端，百度心响App无疑有身先士卒的勇气。但作为全新的一款应用，心响App完全没有用户积累，需要从0做起，势必需要百度投入巨大的资源。

而面向B端，因企业降本刚需明确、场景垂直，且由于一般企业都可能建立自己的知识库，办公类Agent执行任务更有针对性，交付效果无疑也会更好。另外，在商业化方面，微软Copilot、钉钉和飞书也都已经具备现成的营收手段，比C端的会员收费也更自然得多，预计发展会相对顺畅。

「生态与标准暗战」

除了智能体，当下AI领域最炙手可热的概念，莫过于MCP。而MCP与智能体之间又存在着紧密的联系。

“MCP让AI更懂外部世界，更容易获得信息，更自由地调用工具，是AI发展的一大步。”李彦宏在Create 2025百度AI开发者大会上多次强调MCP的重要性，“现在基于MCP开发智能体，就像2010年开发移动APP。”

大模型性能再好也不是万能的，Agent要处理复杂的、多环节的任务，就需要与外部的工具或服务进行交互。但在MCP出现之前，交互缺乏统一标准。做个形象的比喻，就好比秘书联系不同部门，都需要切换不同的通讯方式，比如电话、邮件、微信、钉钉、飞书等，自然毫无效率可言。

去年11月，Anthropic提出并开源了MCP，即模型上下文协议，旨在提供统一标准，可以理解为AI世界的USB-C，使Agent可像搭积木般调用航班查询、地图导航等服务。比如，在旅游规划测试中，接入MCP的Agent能依次调用航班、酒店、地图接口，任务完成效率比传统API对接提升5倍。

在Anthropic的推动下，尤其是在OpenAI和Google等巨头相继明确表态支持后，MCP正从一个有潜力的提议，加速成为被广泛接受的标准。据MCP社区PulseMCP统计，全球已经有超过4000个MCP服务器上线，而这一数字还在迅速增长。

国内AI厂商近期积极支持MCP。4月25日，百度宣布公司各产品全面拥抱MCP，既包括百度搜索、百度文库、百度网盘等应用，也包括文心基础大模型和百度智能云千帆平台；字节扣子空间也集成了飞书云文档、多维表格和高德地图等MCP扩展；阿里在支付宝等产品中集成了MCP协议，其最新发布的Qwen3系列模型也原生支持MCP。

MCP的普及，为Agent生态的构建和运转提供了重要通路。国内外AI厂商们基本都推出了自家的MCP平台，邀请更多的开发者、应用服务商进驻。例如，360旗下的纳米AI最近上线“万能工具箱”，已有超100个自研和优选MCP工具，并且更多第三方MCP工具正在进驻中。

当MCP打破工具调用壁垒，智能体开发正进入"乐高积木"时代。这场战役的胜负关键已从技术突破转向生态构建能力。正如移动互联网催生APP经济，AI Agent正在开启智能体经济的黄金十年。