系列AI 编程工具生态挖掘 字数约 2800 字 预计阅读7 分钟前面几篇都在 Claude Code 生态里打转。但 Codex 这边有一个 Claude Code 不具备的能力——原生子代理Sub-Agent并行编排。Codex 支持在.codex/agents/下定义专用 Agent每个有独立的系统提示、工具权限和模型。Codex 可以同时启动多个 Agent 并行执行不同任务然后汇总结果。社区做了大量封装——136 预定义子代理、50 可复用工作流、跨 LLM 编排。这篇文章不列清单做一个实战对比同一个需求串行做 vs 并行做差距到底多大。Codex 子代理工作原理——.toml 定义主 session 调用在.codex/agents/下定义一个 Agent 文件# .codex/agents/test-writer.toml name test-writer description Writes pytest tests for Python functions tools [read, write, bash] model gpt-5.1 system_prompt You are a test engineer. Given a Python source file, write comprehensive pytest tests. Focus on edge cases, boundary values, and error conditions. Use parametrize for combinatorial coverage. Output ONLY the test file content — no explanations. 然后在主 Codex session 里调用用户: 用 test-writer 给 src/utils/date_utils.py 写测试 同时用 code-reviewer 审查 src/utils/date_utils.py 的代码质量 然后我去泡杯咖啡Codex 会同时启动 test-writer 和 code-reviewer 两个 Agent并行运行。Agent 之间没有上下文共享——各干各的。串行 vs 并行实测——同一需求两种跑法差多少任务给一个中等复杂度的 Python 工具模块date_utils.py180 行12 个函数做三个操作——写测试、代码审查、生成文档。串行模式一个接一个来。先让 Codex 写测试完了再审查完了再生成文档。Step 1: Write tests → 4 min 12 sec Step 2: Code review → 3 min 48 sec Step 3: Generate docs → 2 min 05 sec Total: 10 min 05 sec测试覆盖了 12 个函数中的 11 个漏了一个私有 helper审查发现了 3 个问题2 个类型标注缺失、1 个潜在的时区 bug文档准确描述了 12 个函数的参数和返回值。并行模式三个 Agent 同时启动Agent 1 (test-writer): → Writing tests... → 4 min 52 sec Agent 2 (code-reviewer): → Reviewing code... → 4 min 18 sec Agent 3 (doc-writer): → Generating docs... → 2 min 35 sec All agents completed. Total: 4 min 52 sec (wall clock)并行模式墙钟时间约 5 分钟比串行快了接近一半。但有两个代价test-writer 慢了 40 秒Agent 并发竞争资源模型推理排队test-writer 没看到 code-reviewer 发现的问题——审查发现的时区 bug测试里刚好也漏了并行什么时候划算划算的场景多个任务操作不同文件互不依赖代码审查 测试编写——这两个天然独立大型重构——拆成多个子模块每个 Agent 处理一个多语言项目——一个 Agent 改前端一个 Agent 改后端不划算的场景任务之间有顺序依赖——Agent A 的输出是 Agent B 的输入并行等于乱序操作同一个文件——两个 Agent 同时改同一个文件会产生冲突需要全局视角的任务——并行 Agent 各自为政看不到其他人的分析值得装的 6 个子代理从 VoltAgent 的 136 子代理里挑了几个最实用的Agent用途一句话code-reviewer代码审查按漏洞、风格、性能逐项审查test-writer测试生成自动 parametrize 组合覆盖率doc-writer文档生成读函数签名和 docstring输出 Markdownsecurity-scanner安全扫描OWASP Top 10 检查硬编码密钥检测refactor-agent大型重构拆解重构计划分步执行每步验证dependency-checker依赖审计检查过时的包、已知漏洞、许可证冲突安装单个 Agentnpx skillslatestaddVoltAgent/awesome-codex-subagents然后在 Codex session 里通过/agent test-writer调用。Agent 之间的通信——别指望他们会聊天并行 Agent 最大的陷阱你不会自动得到综合报告。三个 Agent 各自输出了结果——测试代码、审查报告、文档。但它们不会互相沟通。你得做汇总的人用户: 汇总 test-writer、code-reviewer 和 doc-writer 的输出 合并成一个完整的 PR 准备报告或者用社区工具——agent-sh/agentsys提供了一个编排层定义了 Agent 间的输入/输出协议自动汇总。但它还在 preview 阶段文档不全。目前的建议并行 Agent 用来生成人用来汇总。不要指望 Agent 之间自动协调。Codex 子代理 vs Claude Code 并行——调度方式和隔离程度不同Codex 子代理Claude Code 并行调度方式原生支持.toml配置通过 SubAgent tool内置支持Agent 隔离独立上下文独立执行共享上下文子 Agent 可传结果适用场景完全独立的任务并行需要主 Agent 汇总的并行配置复杂度需要定义每个 Agent 的系统提示自动继承 CLAUDE.md 规则Codex 的子代理更适合不同视角的并行——安全 Agent 看安全、测试 Agent 看测试、文档 Agent 看文档。Claude Code 的子代理更适合分块处理的并行——主 Agent 拆任务子 Agent 各领一块。技能超市1400 个技能里的质量筛选GitHub 上 1400 个 Codex/Claude Code 技能社区测试了 100 个70% 不合格。几个筛选标准过滤掉用最佳实践类——空泛没具体行为约束只做一件事但描述不清的——装完不知道什么时候触发跟其他已有技能功能重复的留住的有明确的触发条件“当 X 时做 Y”有具体的输出格式要求有已知的限制说明“不适用于 Z 场景”两个网站帮你找claudeskills.info— 151 技能支持中文兼容 14 平台skillsmp.com— 多平台技能市场下一篇并行多 Agent 能提效但也扩大了攻击面——多个 Agent 同时跑安全风险被放大了。下一篇同时测 AgentShield安全扫描和 cozempictoken 成本优化看看防守端和成本端社区做了什么。