Codex CLI

把 Codex CLI 从工具箱变成生产力系统。

这一页专门讲 Codex CLI 的功能全景和实践方法:什么时候用、为什么用、怎么验收,以及哪些地方必须由人类兜底。

建议的上手顺序

1. 先完成登录与基本交互
2. 练会 review / web search / images
3. 再学 subagents、approval modes、MCP
4. 最后串起测试、CI 和发布

Feature Explorer

按场景筛选功能,而不是死记命令

你真正需要掌握的是功能组合方式:研究、编码、审查、并发、审批和自动化如何衔接。

Codex CLI

按场景选能力,而不是背命令

先想清楚你在做什么,再决定该用 review、subagents 还是 approval modes。

安装与登录

基础入门
codex login

第一次在本机启用 Codex CLI,确认账号、环境和工作目录。

如果登录态、工作目录和项目上下文不清楚,后续所有命令都可能在错误前提下运行。

  • 先确认当前目录是不是目标仓库。
  • 不要在未准备好的环境里直接执行高风险命令。
  • 记录项目常用脚本,方便后续把验证交给 CLI。
官方资料:Codex CLI

代码审查 /review

验证进阶
/review

在提交前检查风险点、回归面、缺失测试和风格不一致问题。

AI 不仅能写代码,更能帮你做高频 review,把隐含风险提前暴露出来。

  • review 结论必须结合真实 diff 与测试结果理解。
  • 不要把审查意见当作自动真理,仍要人工做最终判断。
  • 对高风险改动要补充手动验证说明。
官方资料:Codex CLI Features

子代理并发

协作高阶
使用 subagents 拆分独立子任务

当任务可以拆成独立的调研、实现、测试或文案工作时并发推进。

大型任务最怕一个代理上下文过载。子代理能把复杂问题拆散,再由主代理统一收口。

  • 只在边界清晰时并发,避免多个代理改同一批文件。
  • 主代理必须保留集成和最终验证职责。
  • 不要把阻塞主路径的关键决策完全外包。
官方资料:Codex Subagents

Web Search

研究进阶
在需要外部资料时启用 Web 搜索

查当前文档、版本差异、官方说明和近期变更,尤其适合高时效信息。

很多技术和平台信息都会变,外部搜索能减少凭记忆回答带来的过时风险。

  • 优先使用官方来源,并保留链接。
  • 新闻、价格、平台能力等时效信息必须核对日期。
  • 不要把搜索结果摘要当成无需验证的事实。
官方资料:Codex CLI Features

Approval Modes 与安全边界

验证高阶
按任务风险设置 approval modes

控制是否允许自动运行命令、写文件、访问外部系统和执行高风险操作。

AI 越能执行真实动作,越需要清晰审批边界。审批模式决定了速度和安全之间的平衡。

  • 依赖安装、外部发布、删除或重置类动作要特别谨慎。
  • 高风险任务必须明确哪些情况要停下来请求人工确认。
  • 审批策略应该和团队发布规范一致。
官方资料:Agent Approvals & Security

图像输入辅助排查

研究进阶
把截图作为上下文输入 Codex

排查 UI 视觉问题、布局异常、设计差异或错误截图中的关键信息。

很多前端问题光靠文字难以描述,截图能让模型快速理解页面状态和异常位置。

  • 截图只是补充,仍要提供相关组件或样式文件范围。
  • 涉及敏感信息的图像要先脱敏。
  • 视觉建议最终仍需回到代码和实际渲染验证。
官方资料:Codex CLI Features

MCP 工具扩展

自动化高阶
通过 MCP 接入外部文档、系统和能力

给 Codex 提供受控的额外工具能力,例如文档源、内部系统或特定服务接口。

MCP 能把通用 AI 助手变成了解你工具链和资料源的工程代理,提高上下文质量与行动能力。

  • 先定义工具的安全边界,再开放给代理使用。
  • 只接入真正能稳定提升效率的工具,不要让工具噪声压过主线。
  • 高价值资料源应优先接官方或可信内部源。
官方资料:Codex CLI Features

Skills 与可复用工作流

自动化高阶
把高频流程沉淀为 skills

把项目规范、常用部署流程、固定代码模式和工具集成整理成可复用技能。

高手和新手的差距往往不在一次回答,而在是否能沉淀成稳定模板,下次继续复用。

  • skills 应该聚焦高频、清晰、可复用的流程。
  • 不要把过度依赖个人记忆的隐性知识硬编码进去。
  • 随着项目演进要定期更新 skill 内容。
官方资料:Codex CLI Features

自动化与 CI

自动化高阶
把 Codex 工作流接进脚本与 CI

在 PR 检查、日常脚本、发布流程和批量维护任务中复用 Codex 能力。

当工作流走向团队协作时,真正的效率来自自动化,而不是每次从零描述任务。

  • CI 中的 AI 步骤必须有清晰边界和可审计输出。
  • 自动化不是放弃 review,而是把 review 前置和标准化。
  • 部署链路中的凭据与权限必须单独管理。
官方资料:Codex CLI

Playbooks

知道功能还不够,你还要会组合打法

下面这些是最值得反复练的 Codex CLI 作战模板。每一条都对应真实工程场景,而不是抽象定义。

接管陌生仓库

先收敛上下文,再决定要不要写代码,避免一上来就在错误目录或错误假设下动手。

适用场景

你第一次进入一个项目,需要理解结构、脚本、测试、部署方式和风险边界。

命令策略

先让 Codex 探索仓库与关键脚本,再总结结构,最后才进入具体功能任务。

人工检查点

  • 确认当前目录、分支和未提交改动状态。
  • 让输出先回答“这个项目怎么跑、怎么测、怎么发”。
  • 在真正编码前明确可修改范围与不可破坏行为。

常见失败方式

  • 直接让 AI 写功能,但它并没有理解仓库结构。
  • 忽略已有脚本和约定,重复造轮子。
  • 没有先看 dirty worktree,导致误覆盖他人改动。

新增一条完整功能切片

把需求拆成 UI、状态、接口、测试、文档五个面,而不是一句“帮我做完”。

适用场景

你需要加一个真实功能,而且它横跨前端、后端或多个模块。

命令策略

先定义切片目标和验收标准,再把实现与验证拆给不同代理并行推进。

人工检查点

  • 需求里必须写出用户价值、接口边界、输出位置和测试要求。
  • 并发前确认不同代理不会改同一块核心状态逻辑。
  • 主代理最终要统一看 diff、跑构建和做冒烟验证。

常见失败方式

  • 一口气让 AI 改整个模块,最后很难 review。
  • 没有把测试和文档纳入功能定义。
  • 多个代理同时改同一批文件造成冲突。

提交前审查与加固

把 `/review`、构建、测试和人工检查连成一个固定动作,而不是凭感觉决定是否可发。

适用场景

功能基本完成,需要判断风险、补边界和准备上线。

命令策略

让 Codex 先做 review,再围绕 review 结论补测试、补文档、补手动验证清单。

人工检查点

  • 先看高风险文件和行为变更,再看风格类问题。
  • review 结论要配合真实测试输出理解。
  • 对用户可见改动要补手动验收步骤。

常见失败方式

  • review 没看 diff 就直接接受结论。
  • 只做风格清理,不处理真正的回归面。
  • 没有把上线后的监控和回滚点写出来。

结合截图排查前端问题

让图像输入和代码上下文互相补位,减少光靠文字描述 UI 问题的损耗。

适用场景

页面布局错位、交互不对、视觉与设计稿不一致,文字很难说清楚。

命令策略

给截图、组件路径、目标行为和当前异常,再要求输出定位思路与修改范围。

人工检查点

  • 截图前先脱敏敏感信息。
  • 必须补充相关组件、样式或页面文件范围。
  • 修完后仍要回到浏览器实际验证,而不是只看代码。

常见失败方式

  • 只有图片,没有代码范围。
  • 把视觉建议直接合并,没有实际渲染验证。
  • 忽略响应式和移动端表现。

把高频流程沉淀成自动化

当你多次重复同类任务时,应该把 prompt、校验和发布动作固化成脚本或 skill。

适用场景

团队已经形成稳定节奏,希望把 review、起草、补文档、发版说明等动作自动化。

命令策略

先抽象出固定输入输出,再把 Codex 放进脚本或 CI,而不是让每个人临场发挥。

人工检查点

  • 自动化步骤必须可审计,能追溯输入、输出和责任边界。
  • 凭据、审批和外部发布要与脚本本身分离管理。
  • 先固化高频流程,再考虑扩展到更多场景。

常见失败方式

  • 把不稳定流程过早自动化。
  • 自动化脚本没有审批边界和失败回滚策略。
  • 依赖单个高手脑内 prompt,没有沉淀成团队资产。

Multi-Agent

大型任务要会拆,会并发,会收口

子代理不是为了炫技,而是为了把读代码、写代码、验证和资料检索分层并行,让主代理守住关键路径。

推荐组合顺序

1. 先收敛任务和边界
2. 再决定是否需要 web search / images
3. 能拆开的部分交给 subagents
4. 主代理负责集成、review、approval
5. 最后才是发布与持续化

并行执行

子代理协作模拟板

把主路径留给统筹,把不互相覆盖的工作交给不同代理。

主代理统筹中

设计一条 Codex CLI 执行主线

  • 先定义要让主代理负责什么,再定义子代理可以并发处理哪些独立部分。
  • 安排验证
研究代理并行采集

查官方文档、列风险、补充资料链接

  • 明确需要人工审批的点,例如依赖安装、外部发布和破坏性操作。
  • 风险备注
实现代理编码中

在互不冲突的文件边界内落功能

  • 最后列出最小验证动作:类型检查、构建、手动冒烟和部署预览。
  • 补细节
验证代理待集成

跑检查、看 diff、确认边界条件

  • 测试验证
  • 回归检查