Spring AI Alibaba 1.x 系列【27】Nacos AI Agent 管理平台与 Skill Registry 发布详解
文章目录1. Nacos AI 能力1.1 Agent 注册中心1.2 MCP 管理1.2.1 手动注册和导入1.2.2 自动注册与发现1.2.3 存量 API 转换 MCP1.2.4 MCP Router1.2.5 Dify 发现 Nacos MCP 服务1.3 Skill 管理1.4 Prompt 管理1.5 AgentSpec 管理1.6 Copilot AI2. Nacos Skill Registry 发布说明2.1 背景与前言2.2 企业落地 Skill 面临的核心挑战2.3 企业级 AI 资源治理平台2.4 快速开始2.4.1 Skill 安全审核流水线2.4.2 多版本管理与灰度分发2.4.3 权限模型与多层隔离2.4.4 全链路审计与追溯2.4.5 多途径 Skill 接入与分发2.5 开放架构插件化企业定制扩展2.6 多Agent协作生态构建企业私有 AI 管理平台2.7 迈向多 Agent 架构网络的协作中枢2.8 后续版本规划2.9 结语1. Nacos AI 能力官方文档Nacos自3.0版本起定位升级为一个易于构建AI Agent应用的动态服务发现、配置管理和AI智能体管理平台为企业级AI应用提供统一的资源注册、发现与治理能力。1.1 Agent 注册中心Agent2Agent (A2A) 协议是由Google开发并捐赠给Linux基金会的一项开放标准旨在实现AI Agent之间的无缝通信与协作从而解决multi-agent数量增加时导致的运维、管理、部署成本过高的问题实现像使用微服务一样使用multi-agent。为了管理这些AgentNacos从3.1.0版本开始提供了Agent注册中心A2A Registry实现Agent的注册、发现、命名空间隔离、版本管理等功能。创建Agent管理页面1.2 MCP 管理1.2.1 手动注册和导入支持在控制台手动注册、市场导入MCP Server服务1.2.2 自动注册与发现支持通过使用Spring AI Alibaba框架或Nacos MCP Wrapper Python开发MCP Server。MCP Server启动后可动态注册至Nacos并纳入统一管理具备以下能力MCP Server服务动态管理通过MCP服务列表对服务信息进行增删改查描述动态生效工具描述、参数定义等元信息支持运行时热更新无需重启服务MCP Server Tools动态开关支持对MCP Server下的Tools在运行时动态开启/关闭无需重启服务全链路集成服务注册信息自动同步至Nacos配置中心与服务发现模块适配AI Agent调用需求注册到Nacos MCP Registry中的服务可通过Spring AI Alibaba框架或Nacos MCP Router实现发现与调用也可对接Higress网关完成全链路集成。1.2.3 存量 API 转换 MCPNacos能够通过与Higress等 AI 网关结合在0 代码改动的前提下将存量 API 转换为MCP服务。本文档将说明如何在Nacos上将已注册的存量 API 声明为MCP服务并通过Higress的协议转换能力实现MCP Tools调用。1.2.4 MCP RouterNacos MCP Router是一个基于MCP官方SDK开发的标准MCP Server为MCP Client提供MCP Server的智能搜索、安装、代理等功能极大简化了MCP服务的使用流程。同时Nacos MCP Router与Nacos MCP Registry相结合可实现MCP Server治理能力例如MCP Server及工具的可见性控制、版本管理等。1.2.5 Dify 发现 Nacos MCP 服务Nacos MCP 插件支持将Nacos中注册的SSE/Streamable Http类型MCP Server服务转化为Dify中的工具调用。通过Nacos MCP插件Dify应用可以动态发现Nacos中的SSE/Streamable Http类型MCP Server服务。Nacos MCP插件还可协助模型按需挑选并路由MCP服务有效降低模型调用的Token消耗。1.3 Skill 管理Skill Registry是Nacos提供的Skill管理中心作为团队与组织的私有Skill仓库。它将Skill的存储、版本管理、安全审核与分发集中在同一平台方便团队成员便捷地发现、安装与共享Skill。Nacos从3.2.0版本开始提供Skill管理中心Skill Registry支持Skill的创建、版本管理、安全审核、发布及分发等能力。1.4 Prompt 管理Nacos提供了Prompt全生命周期的统一管理能力集中存储所有Prompt资源统一托管通过控制台即可查看全貌环境隔离通过命名空间实现开发、测试、生产环境的完全隔离防止误操作影响生产环境权限管控细粒度的权限控制确保只有授权人员可以修改关键配置快速检索支持按名称模糊搜索和标签筛选在大量Prompt中也能快速定位目标当企业存在多个AI应用场景涉及客服、营销、运营等多个部门时集中管理可以显著提升配置检索效率大大降低配置错乱风险。1.5 AgentSpec 管理Nacos AgentSpec管理是Nacos面向AI Agent规模化治理提供的智能体标准规范统一管控能力用于对Agent的定义、元信息、能力边界、调用协议、依赖资源等进行标准化配置与集中管理是Nacos构建企业级AI控制平面的核心模块之一。通过Nacos AgentSpec管理企业可实现跨团队、跨场景AI Agent定义标准化、配置可追溯、权限可管控解决Agent混乱、版本不一致、调用不可控等问题支撑企业级Agent规模化落地与统一治理。1.6 Copilot AINacos Copilot是Nacos从3.2.0版本开始推出的内置AI辅助能力模块基于agentscope-java接入大模型将大模型能力深度集成到Nacos控制台中为AI应用开发提供Prompt与Skill全生命周期AI辅助。2. Nacos Skill Registry 发布说明本内容来源于 Nacos 官方博客2.1 背景与前言过去一年团队内部围绕AI应用开发范式展开了持续讨论核心聚焦于低代码平台与高代码框架的选型权衡低代码平台以Dify为典型代表核心优势是门槛低、业务流程确定性高可快速搭建基础AI应用但灵活度受限难以适配复杂、多变的业务场景高代码框架核心基于ReAct结构以LLMPromptTool为核心由大模型自主决策执行任务灵活度极强能充分发挥AI的泛化推理能力但存在幻觉问题突出、Prompt调试成本高、落地难度大等痛点。这一选型困境随着Anthropic推出Skill得到有效破解——Skill成为低代码与高代码之间的关键平衡点既保留了高代码框架的灵活度又通过能力封装与边界约束大幅提升Agent在特定任务上的执行确定性与可复用性迅速被各企业用户广泛采纳。而年前OpenClaw的快速出圈进一步推动了Skill生态的爆发ClawHub、SkillHub等公开Skill市场如雨后春笋般涌现目前公开Skill规模已达数万级生态仍在高速扩张。然而公开Skill市场的繁荣背后隐藏着不容忽视的安全隐患。根据Snyk对ClawHub中 3984 个Skill的采样报告显示存在安全缺陷的Skill占比高达 36.82%其中CRITICAL级别安全问题占比 13.4%凭证Secret泄漏、Prompt注入等高危问题频发。这些安全隐患不仅可能导致企业数据泄露、业务中断更成为企业内部规模化落地Agent应用的重大阻碍也凸显了Skill全生命周期安全管控的必要性。2.2 企业落地 Skill 面临的核心挑战结合内部团队交流及外部企业实践反馈梳理出企业在内部落地Skill技能时核心面临四大相互耦合的挑战无法通过单点能力解决需依托平台化治理体系统筹应对安全挑战Skill落地过程中恶意代码、已知漏洞、敏感信息外泄等风险持续存在且缺乏完善的准入管控机制无法在Skill接入初期有效排查安全隐患易引发数据泄露、系统被攻击等问题。权限挑战Skill相关的权限边界模糊谁可见、谁可用、谁可修改、谁可发布的职责划分不清晰越权访问、违规操作的风险难以防范无法实现精细化权限管控。稳定性挑战Skill版本管理混乱存在版本冲突、升级不可控等问题且出现异常时难以快速回滚易影响业务连续性无法保障Agent调用Skill时的稳定性。治理挑战缺乏完整的审计日志Skill全生命周期的操作无法追溯追溯链条断裂缺少合规所需的证据链难以通过监管审查不符合企业合规运营要求。上述四类挑战相互关联、彼此耦合并非单一环节的问题无法依靠单点优化解决必须搭建全面的平台化治理体系实现Skill从准入、权限、版本到审计的全流程管控才能突破企业落地Skill的核心瓶颈。2.3 企业级 AI 资源治理平台Nacos 3.2推出的私有化Skill Registry面向企业生产场景在Agent与Skill之间构建「验证后信任」的治理层将Skill的审核、管理、分发与追溯统一纳管形成完整的企业级AI资源控制闭环。2.4 快速开始MacOS/Linuxcurl-fsSLhttps://nacos.io/nacos-installer.sh|bashWindows(PowerShell)iwr-UseBasicParsing https://nacos.io/nacos-installer.ps1|iex脚本运行后会自动打开Nacos控制台终端执行nacos-setup —help及nacos-cli —help查看更多功能。2.4.1 Skill 安全审核流水线Nacos 3.2内置开箱即用的安全审核插件覆盖 10 项常用风险扫描同时提供标准接口支持插件化扩展满足企业定制化安全策略需求。审核流程遵循「未通过不发布」的准入原则将安全要求从「文档规范」升级为「系统强约束」彻底消除人为绕过风险。Skill入库前必须经过可编排、可审计、可升级的审核流程实现多维扫描、风险分级、审核决策的全流程管控。2.4.2 多版本管理与灰度分发版本生命周期管理支持草稿DRAFT、审核中、灰度GRAY、正式FORMAL、下线等完整生命周期每个阶段状态明确版本不可变。标签灰度放量通过dev/lastest/stable等标签绑定版本精准控制分发范围支持逐步放量降低新版本上线风险。异常快速回滚灰度阶段发现问题切换标签映射即可实现秒级回滚无需重新发版保障业务稳定性。2.4.3 权限模型与多层隔离Nacos 3.2采用三层边界设计实现细粒度的权限管控RBAC角色权限定义发布者、审核员、只读用户等角色明确职责边界。命名空间隔离隔离不同团队、环境与租户防止越权访问。Skill维度可见性支持单Skill级别的公开、私有、指定范围开放配置谁能看、谁能用、谁能改、谁能发都有明确策略与责任归属。2.4.4 全链路审计与追溯Nacos 3.2 提供完整的审计能力覆盖Skill全生命周期上传记录谁在何时上传了哪个版本来源可追溯审核日志谁审核、审核结论、审核时间全程留存发布记录谁发布、发布到哪些Agent、发布策略存档调用追溯哪些Agent调用了哪个版本问题定位有据可查只有审计闭环打通运维、合规、治理才能真正形成体系满足监管要求。2.4.5 多途径 Skill 接入与分发Nacos 3.2提供多种灵活的Skill接入方式满足不同场景下的获取和安装需求Agent自主发现CLI一键安装Shell脚本批量拉取Nacos提供引导SkillAgent可通过以下命令自动发现可用能力curl-shttps://download.nacos.io/SKILL.md执行后将展示Skill安装指南及列表查询方法帮助Agent快速定位和获取所需能力。通过nacos-cli工具实现Skill的快速下载与安装支持从Registry直接拉取并本地部署。# 列出所有可用 Skillsnacos-cli skill-list# 按名称过滤查询nacos-cli skill-list--namemysql-query--page1--size20# 下载指定 Skill 到本地nacos-cli skill-get mysql-query-o~/.skills详细指令参考Nacos CLI文档。支持通过skills.sh脚本链接Nacos Registry批量获取Skills适用于自动化部署和CI/CD场景。# 配置 Nacos Registry 地址exportSKILLS_API_URLhttp://${nacos.host}:9080# 使用 npx 执行 skill 命令安装npx skillsaddmysql-query redis-query2.5 开放架构插件化企业定制扩展2.6 多Agent协作生态构建企业私有 AI 管理平台Nacos 3.2作为底层基础设施与HiClawAgent执行层、HiMarket私有化市场层形成完整的企业私有AI管理平台生态HiClawAgent运行时消费Skill、Prompt、AgentSpec资源HiMarket基于Nacos定制的私有化Skill市场 Worker市场Nacos统一AI资源管理Prompt、Skill、MCP、AgentCard、治理与插件化扩展去年9月份我们畅想了配置驱动的Agent网络架构如今Nacos HiMarket HiClaw已将这一架构畅想变为现实。2.7 迈向多 Agent 架构网络的协作中枢Nacos 3.2是一个起点完成了全面拥抱AI时代的第一步。我们期望未来Nacos成为企业AI时代的资源治理基础设施一部分成为多Agent架构网络的协作中枢统一资源控制平面整合四大注册中心统一身份、权限、版本与分发策略形成企业级一致入口。治理能力持续深化增强审核、灰度、审计与回滚能力让每次资源变更可验证、可追溯、可止损。场景化智能推荐基于场景做AI资源推荐支持AgentSpec自动化组装降低Agent构建门槛。多Agent协作中枢在AgentSpec之上构建Agent Team Spec形成基础AI资源单Agent组装编排多Agent协作网络构建体系基于OT协议集成Agent运行时数据升级Nacos Copilot实现智能数据分析实现多Agent协作安全可控地自我进化。2.8 后续版本规划为实现上述目标Nacos结合社区反馈与路线图规划AI Registry将在后续版本中持续演进AI资源生命周期管理引入活跃度检测机制实现热数据启动加载、冷数据按需延迟加载及自动下线优化资源占用。数据智能层基于OT协议集成Tracing数据构建无本地存储的Copilot智能分析能力实现AI资源运行态可观测。全链路审计追溯补齐AI资源操作的完整审计日志与全链路追溯能力满足企业合规要求。语义智能检索基于向量数据库与大模型实现自然语言搜索、AgentSpec自动化组装与智能路由。多协议适配与开放生态除适配A2A Protocol 1.0.0版本外还将探索ACP、Matrix等主流Agent通信协议的对接支持AgentCard字段规范演进与跨平台Agent互操作构建开放的Agent协作生态。Coding Agent插件分阶段演进Coding Agent能力从Markdown指令到MCP协议支持最终提供原生远程MCP端点实现在Claude Code、Cursor等工具中直接操作Nacos资源。2.9 结语Nacos在过去8年中成为微服务时代的基础设施之一收获了开源社区开发者的广泛支持。我们希望Nacos在AI时代也能与大家结伴同行、共同成长。