WPS,WPS Office,WPS官网,WPS下载,金山文档,在线编辑文档,协同办公,云文档,云表格,在线表格,远程办公,远程会议,云办公解决方案,在线办公,多人协同云文档,协同办公平台,流程图软件
2025年,被称为“智能体元年”。这是AI发展路径上的一次范式突变:从“我说AI答”到“我说AI做”,从对话生成跃迁到自动执行,智能体正成为最重要的商业化锚点和下一代人机交互范式。
但越接近落地,风险也越有实感。越能干的智能体,越可能越权、越界,甚至失控。
结合调查问卷和行业访谈,本次《智能体体检报告》从最新发展状况、合规认知度、合规实际案例三个角度,试图回答清楚一个关键问题:智能体狂奔之时,安全合规是否就绪了?
复杂的“竞合”关系。科技巨头、创业团队、终端厂商等玩家们,在产业链各环节互相交叉渗透。创业团队既接受大厂的投资,又与其展开竞争。
地图扩张中。从AI手机到AI浏览器,智能体正在接管日常入口。控制硬件(手机、PC、智能眼镜、智能音箱等)成为通往个人AI时代的新战略高地。
作为市场最火热的概念,今年资本市场及公司动态几乎都与智能体挂钩。但不少讨论中的智能体定义混乱,以至于一千个人眼中有一千个智能体。
OpenAI将AI发展阶段分为L1到L5五个阶段。L3阶段即为智能体 (Agent),能够自主规划和执行复杂任务,同时具备了对话能力、推理能力、长记忆、工具调用这四项能力。其中,工具调用是最核心的区分要素,只有对线阶段的聊天机器人(Chatbot),只有对线阶段的推理者(Reasoner)。
智能体强大能力的自主性、规划能力以及与外部世界交互的能力,带来了一个核心的矛盾:效用与风险共生。我们认为应当从“容错性”、“自主性”两个维度划定坐标轴,建立智能体的价值生态。在这一全景坐标下,讨论智能体安全合规问题,能带给隶属不同象限的智能体产品更适配的安全风险准则。
我们将智能体划分为通用型智能体和垂直型智能体,这两者在技术栈、优化目标和应用范围上存在显著差异。
通用智能体能够跨多个领域,提供基本认知能力,泛化能力强,能实现多模态交互和生态协同。比如助推了智能体概念的Manus,其定位是“首个通用智能体”,核心能力在于任务拆解与工具调用,通过提示完成复杂的分析项目。
垂直智能体专注于特定领域,深度融合专业知识和行业数据,通过定制优化使行业数据更精准,训练效果更稳定。2024年以来,垂直智能体在办公软件(WPS、钉钉、飞书)、金融(支付宝、微信风控)、法律(通义法睿、金山晓法)等领域开始落地。
总的来说,通用智能体在挑战“上限”和“广度”,而垂直智能体则夯实“下限”和“深度”。通用和垂直方向各有价值。
目前来看,垂直型智能体凭借其深度领域知识和定制化能力,或许更容易找到精准用户并形成可持续的商业模式。比如,从数据隐私与合规性角度看,在金融、法律等高度敏感和受监管的行业,市场更倾向于选择了解并能满足特定数据安全和合规要求的垂直解决方案提供商。
红杉在AI峰会上提到,“企业级市场中,真正先跑出来的入口是垂直领域智能体,因为它们能听懂行业语言,理解真实需求。”而智能体最先落地的行业和场景可能是知识工作,尤其是代码编程。根据Anthropic在2025年3月发布的论文,Claude AI的使用主要集中在软件开发和写作任务,这两者合计占了近一半的总使用量。Cursor 仅用了大约12个月的时间,成为最短时间内突破 1 亿美元年经常性收入(ARR)的软件产品,截至2025年6月已突破5亿美元。
智能体市场从技术架构角度可以划分为基础层、平台层和应用层,由此搭建起智能体产业链的上中下游。
科技大厂巨头、创业团队、终端厂商等市场上的玩家们,在产业链各环节互相交叉渗透。
科技巨头的打法普遍以大模型为底座,一边持续迭代,一边布局智能体平台和生态,吸引开发者到平台上搭建各类智能体应用,并将智能体集成到现有的产品和业务中。凭借在资金、数据、算力、庞大的生态系统和云基础设施,构建全面的“智能体工厂”。毕竟谁拥有了最强大的开发平台和最活跃的开发者生态,谁就掌握了AI时代的“入口”与“分发权”。
头部创业团队在核心智能体能力(如推理、执行动作)方面做颠覆性创新,形成与科技巨头之间“竞合”的动态关系——它们既接受巨头的投资,又与其展开竞争。比如智谱其股东阵容多元,美团、腾讯、阿里、蚂蚁都位列持股名单,Manus在今年3月份宣布与阿里通义千问团队达成战略合作。
终端厂商依靠设备入口、强大的供应链、生态链,在速度和个性化上进行差异化竞争。比如小米通过搭载自研或第三方AI芯片,在其众多设备端执行大部分AI任务,当遇到复杂任务时,通过金山云等云端服务调用更强算力。
基础模型是智能体的大脑,科技巨头们都推出了自己的大模型,如百度文心、阿里通义千问、腾讯混元、字节豆包等。目前,大模型厂商都在加快推进多模态大模型进展,以快速提升通用基础大模型的理解、推理、规划和学习能力,多模态大模型的技术进步让智能体的能力也随之提升。有机构研报测算,强大的多模态基础模型(能理解视觉信息如屏幕内容)和成熟的强化学习训练方法(能训练Agent与环境交互),目前已经发展到相对成熟的阶段。
基础设施为模型训练和推理提供必要的计算资源,比如阿里云、华为云、等云计算平台;寒武纪等芯片企业;以及数据采集与标注企业等。随着智能体向端侧发展,对独立、低延时、安全等要求增强,华为、小米等终端厂商都在边缘计算领域大量投入。
框架、工具、平台是连接基础模型和应用场景的桥梁,能够帮助开发者高效构建和部署智能体,提供从模型调用、任务规划到工具集成的全流程支持,比如的文心千帆、字节跳动的Coze、华为的鸿蒙智能体框架等。为了进一步降低开发门槛,厂商还推出了可视化的智能体开发工具,让用户能够通过简单的拖拽操作创建自己的智能体。
协议上,尤其是MCP协议的普及在推动智能体行业互联互通。在MCP出现之前,智能体想利用外部工具或数据源会面临着巨大困难,比如接口各异、定制开发成本高、生态割裂等。MCP通过提供一个开放、统一的通信标准,降低了集成门槛,增强不同模型和工具间的互操作性,最终赋能更强大的智能体应用。
除了上文提到的,智能体广泛应用于各垂直领域,硬件也是智能体应用的一个重要载体,控制硬件(手机、PC、智能眼镜、智能音箱等)是通往个人AI时代的新战略高地。
几乎所有手机厂商都在为AI智能体秣马厉兵:2024年9月,荣耀率先宣布用大模型“全面升级”手机助手,随后小米、华为、vivo、OPPO等厂商都升级了自家的手机助手,摇身变成。此外,小米智能体小爱同学还覆盖了平板、电视、音箱、汽车等核心品类设备,华为亦把小艺智能体部署在华为终端的硬件生态和操作系统里。
不同于早期的语音助手,智能体的目标是深入终端操作流程,成为全能管家。比如开发者们宣称,只需要一句话,用户无需逐个打开App,手机智能体就能像真人一样在多个App之间操作,完成订票、点餐、取消续费等复杂任务。
虽然成功率低、响应不稳定、耗时长,仍是目前手机智能体普遍存在的问题,但2025-2026年预计会保持高速渗透的趋势。Canalys预计,2025年渗透率将达到34%,端侧模型的精简以及芯片算力的升级将进一步助推AI手机向中端价位段渗透。
值得一提的是,除了AI手机,AI浏览器也在试水。浏览器是PC端的超级流量入口,它不仅仅是用智能体代替浏览器插件(比如网页总结、操作网页、推荐相似网页),而且将对话智能体的交互方式完全植入进搜索页面,实时唤起、多轮对话。QQ浏览器、Genspark、Fellou、Perplexity是目前的演进产品代表。
科技与市场之间的关系错综复杂,如果仅停留在单一角度分类智能体是非常片面的,为了更全景地认知理解智能体,我们对从业者进行了广泛的调研采访。综合各方观点和认知,我们认为可以从“容错性”、“自主性”两个维度划定坐标轴,建立智能体的价值生态。
X轴是“容错性”,这是智能体未来发展的核心竞争指标。容错性低,通常意味着出现错误后果严重,其使用场景需要更准确的信息捕捉、归纳、整合能力,更少的幻觉和错误决策,更稳定的执行任务能力,比如医疗;而容错性高的领域,错误后果轻微且可控,人类能方便地介入调整,比如写作创意。
Y轴是“自主性”,是在不同场景中智能体的行动边界。自主性衡量的是智能体在没有直接人类干预的情况下,自主做出决策和执行动作的能力。更高的自主性通常意味着更高的工作效率和处理复杂任务的能力,但同时也显著放大了错误或滥用行为可能造成的后果。
围绕智能体的容错性和自主性建立模型,任何智能体都能在坐标空间里找到属于自己的位置。这是我们衡量智能体的方法论。基于不同象限的智能体产品需适配与之对应的安全风险准则。