Stage 4

Codex CLI 全面实战

把命令行变成你与 AI 协作的主工作台。

这一阶段会系统覆盖 Codex CLI 的主能力：安装与登录、在仓库内工作、代码审查、子代理并发、Web 搜索、审批模式和自动化集成。

进阶 12-14 小时

学习进度

让学习路线变成可追踪的训练节奏

0%0/8 阶段完成

本周目标4次深度练习

下一步进入生成式 AI 基础认知

Outcomes

学完这一阶段，你应该能做到什么

不要求一次到位，但你至少应该把这几个判断和动作练熟。

能在真实仓库里稳定使用 Codex CLI 进行开发与审查。
理解何时该开子代理、何时该保守、何时必须人工批准。
知道如何把 CLI 能力接到日常自动化和 CI 流程里。

Lessons

核心课时

每节课都为一个工程动作服务，而不是只堆定义。

55 分钟

安装、登录与基础会话

认识工作目录、登录方式和模型能力边界，确保 CLI 在正确项目里运行。

阅读正式课程

70 分钟

让 Codex 在仓库里读、改、审查代码

理解当前工作区、上下文收集、补丁应用与代码 review 的节奏。

阅读正式课程

75 分钟

子代理、Web 搜索与图像输入

把研究、排查、实现拆开并行，提升复杂任务的处理速度。

阅读正式课程

80 分钟

Approval Modes、MCP、skills 与自动化

让 CLI 能接入更大的工程体系，同时保持安全边界和可审计性。

阅读正式课程

Course Content

正式课程内容

下面这部分才是这个阶段真正要读、要练、要做的正文。建议先顺序读，再回头做 mission 和 quiz。

这一阶段开始，你会把 AI 从“聊天对象”升级成“终端中的工作伙伴”。Codex CLI 的真正价值，不在于它会回答问题，而在于它能在仓库上下文中读代码、组织任务、做 review，并接入你已有的开发流程。

你要学的不只是命令本身，而是命令背后的组织方式：什么任务适合一个代理，什么任务适合并发，什么步骤必须人工审批，什么输出必须通过构建和测试验证。

安装、登录与基础会话

先确认身份、目录和会话边界，再开始让 Codex 真正进入工作流。

这一课要掌握什么

知道为什么当前工作目录非常重要。
理解登录态和项目上下文的关系。
建立启动前先确认环境的习惯。

正式讲解

Codex CLI 能力再强，也必须在正确目录和正确身份下工作。你在错误目录里启动，它读到的就是错误项目；你在没有确认上下文的情况下直接执行任务，后续所有结论都会偏离。

所以基础会话的第一步不是“直接让它写代码”，而是先确认当前在哪个仓库、这个仓库怎么跑、有没有未提交改动、你是否已经准备好让 AI 开始工作。

登录则是另一个前提。只有身份与权限明确，CLI 才能稳定地使用模型能力和相关工具链。你可以把这一步理解成“进入工作区前的环境自检”。

Practice

练习：写一份 Codex CLI 启动前清单

列出启动前你需要确认的 5 件事。
至少覆盖目录、分支、未提交改动、脚本和任务目标。
把这份清单写成你以后固定会做的启动动作。

Homework

课后作业：安装、登录与基础会话

把这节课的方法应用到你自己的开发环境或仓库中。
写下你当前环境里最容易出错的一个点，并给出规避方法。
把本课内容整理成一份你以后会重复使用的操作清单。

交付一份“可执行环境说明”或“操作清单”，而不是纯概念总结。

Test

离开这节课的原例子后，你还能稳定完成相关操作吗？

你应该能回答

请描述这节课解决的核心问题是什么。
请举出一个常见错误场景，并说明如何排查。
请说明你会用什么检查动作证明自己已经掌握。

通过标准

能独立完成相关操作，不依赖原文一步步照抄。
知道常见错误会出现在哪。
能用脚本、日志、检查项来验证结果。

Evaluation

优秀

你已经能把这节课的方法纳入自己的工程习惯，并能指导别人避坑。

达标

你能独立完成这节课要求的最小闭环。

还需加强

你知道概念，但真正操作时仍然经常迷路或跳步。

学完自检

我知道为什么目录检查很重要。
我不会一上来就让 Codex 动代码。
我先确认环境，再开始会话。

让 Codex 在仓库里读、改、审查代码

核心不是“自动改代码”，而是让读代码、改代码、review 和验证形成闭环。

这一课要掌握什么

理解 Codex 在仓库中的基本工作模式。
知道为什么上下文收集和 patch 审查要分开看。
学会把改动和验证连在一起。

正式讲解

当 Codex 进入仓库后，它最强的地方不是立即写代码，而是先读结构、定位相关文件、理解现有实现，再给出改动路径。你越愿意让它先收集上下文，后面的改动越稳定。

真正成熟的使用方式通常是一个循环：先探索，再提出修改方案，再落补丁，再 review，再跑检查。每一步都能把错误尽量往前暴露，而不是把希望压在最后一次运行上。

你要把 Codex 看成一位需要被管理的高效率工程师，而不是黑盒魔法。管理方式就是：限定范围、要求解释、要求验证。

Practice

练习：设计一条最小改动闭环

选一个小功能或小 bug。
写出探索、修改、review、验证四个步骤。
明确每一步你期望 Codex 输出什么。

Homework

课后作业：让 Codex 在仓库里读、改、审查代码

把这节课的方法应用到你自己的开发环境或仓库中。
写下你当前环境里最容易出错的一个点，并给出规避方法。
把本课内容整理成一份你以后会重复使用的操作清单。

交付一份“可执行环境说明”或“操作清单”，而不是纯概念总结。

Test

离开这节课的原例子后，你还能稳定完成相关操作吗？

你应该能回答

请描述这节课解决的核心问题是什么。
请举出一个常见错误场景，并说明如何排查。
请说明你会用什么检查动作证明自己已经掌握。

通过标准

能独立完成相关操作，不依赖原文一步步照抄。
知道常见错误会出现在哪。
能用脚本、日志、检查项来验证结果。

Evaluation

优秀

你已经能把这节课的方法纳入自己的工程习惯，并能指导别人避坑。

达标

你能独立完成这节课要求的最小闭环。

还需加强

你知道概念，但真正操作时仍然经常迷路或跳步。

学完自检

我会先让 Codex 探索而不是直接改。
我会把 review 和验证写进任务里。
我知道 patch 只是过程，不是终点。

子代理、Web 搜索与图像输入

复杂任务不要单代理硬扛，把研究、实现和验证拆开，效率会高很多。

这一课要掌握什么

理解子代理适用场景。
知道外部搜索和图像输入什么时候最有价值。
学会避免无边界并发。

正式讲解

子代理的意义不是让系统看起来很高级，而是把互不冲突的工作并行化。比如一个代理研究资料，一个代理实现组件，一个代理准备测试，这种拆法通常能明显提高复杂任务推进速度。

Web 搜索适合解决时效信息问题，例如最新官方文档、版本差异、部署步骤。图像输入则适合处理 UI 错位、视觉异常、设计稿差异这类难以用纯文字表达的问题。

但这些能力都要基于边界清晰。多个代理同时改同一块核心逻辑，或者在没有明确来源要求的情况下大量搜索，都会让系统更乱，而不是更快。

Practice

练习：为一个复杂任务设计并发方案

选一个需要调研、实现、测试三类工作的任务。
把它拆成三个互不冲突的子任务。
标记哪部分需要搜索、哪部分需要截图、哪部分必须由主代理收口。

Homework

课后作业：子代理、Web 搜索与图像输入

把这节课的方法应用到你自己的开发环境或仓库中。
写下你当前环境里最容易出错的一个点，并给出规避方法。
把本课内容整理成一份你以后会重复使用的操作清单。

交付一份“可执行环境说明”或“操作清单”，而不是纯概念总结。

Test

离开这节课的原例子后，你还能稳定完成相关操作吗？

你应该能回答

请描述这节课解决的核心问题是什么。
请举出一个常见错误场景，并说明如何排查。
请说明你会用什么检查动作证明自己已经掌握。

通过标准

能独立完成相关操作，不依赖原文一步步照抄。
知道常见错误会出现在哪。
能用脚本、日志、检查项来验证结果。

Evaluation

优秀

你已经能把这节课的方法纳入自己的工程习惯，并能指导别人避坑。

达标

你能独立完成这节课要求的最小闭环。

还需加强

你知道概念，但真正操作时仍然经常迷路或跳步。

学完自检

我知道什么时候适合开子代理。
我会用搜索解决时效问题。
我知道截图只是上下文补充，不是完整需求。

Approval Modes、MCP、skills 与自动化

当 Codex 真正进入工程流时，安全边界和可复用工作流会比单次回答更重要。

这一课要掌握什么

理解为什么审批模式必须和自动化一起考虑。
知道 MCP 和 skills 的作用。
建立把高频流程沉淀成资产的意识。

正式讲解

一旦 Codex 能执行真实命令、访问外部系统或参与发布，审批边界就变得非常关键。高风险动作，例如依赖安装、删除文件、外部部署，不应该在没有明确批准规则的情况下自动进行。

MCP 让 Codex 接入额外工具和资料源，skills 则让你把高频工作流沉淀下来。前者扩展能力，后者稳定复用。两者结合，才会让系统从“会回答”变成“会按你的规则工作”。

真正成熟的工程团队最终追求的不是某一次 prompt 很神，而是把成功经验变成持续可复用的模板、脚本和技能说明。

Practice

练习：为一个自动化流程设计安全边界

选一个你想自动化的流程，比如部署前检查。
写出哪些步骤可以自动执行，哪些必须人工审批。
再写出哪些内容适合沉淀成 skill。

Homework

课后作业：Approval Modes、MCP、skills 与自动化

把这节课的方法应用到你自己的开发环境或仓库中。
写下你当前环境里最容易出错的一个点，并给出规避方法。
把本课内容整理成一份你以后会重复使用的操作清单。

交付一份“可执行环境说明”或“操作清单”，而不是纯概念总结。

Test

离开这节课的原例子后，你还能稳定完成相关操作吗？

你应该能回答

请描述这节课解决的核心问题是什么。
请举出一个常见错误场景，并说明如何排查。
请说明你会用什么检查动作证明自己已经掌握。

通过标准

能独立完成相关操作，不依赖原文一步步照抄。
知道常见错误会出现在哪。
能用脚本、日志、检查项来验证结果。

Evaluation

优秀

你已经能把这节课的方法纳入自己的工程习惯，并能指导别人避坑。

达标

你能独立完成这节课要求的最小闭环。

还需加强

你知道概念，但真正操作时仍然经常迷路或跳步。

学完自检

我知道审批模式为什么重要。
我能解释 MCP 和 skill 的差别。
我开始把重复流程写成可复用资产。

Deep Dive

这一阶段真正要建立的工程习惯

读完下面这些部分，再去做练习和复盘，学习效率会高很多。

为什么 Codex CLI 值得学

图形界面聊天适合探索，而 CLI 更适合把 AI 真正塞进日常工程流。它可以在你当前仓库上下文里读代码、改代码、运行检查、做 review，并与已有终端工具链整合。

这意味着你不再是在“和模型聊天”，而是在“让模型参与开发流水线”。

主线能力应该怎么理解

安装与登录只是起点，真正重要的是工作方式：先明确当前目录与目标，再让 Codex 读取上下文、提出方案、修改代码、跑验证、输出结论。

当任务复杂到一个代理很难同时兼顾探索、实现和验证时，就应该考虑子代理并发，把边界切清楚。

安全与自动化必须一起学

Codex 越强，越不能省略审批与审查。Approval modes 决定了哪些动作可以自动执行，哪些必须经过人类确认。

而 MCP、skills 和自动化脚本的价值，在于把可重复动作产品化，让高质量工作流能够复制到团队里。

Mission

设计一条 Codex CLI 执行主线

围绕“新增一个课程进度组件”设计完整流程：探索现有代码、实现组件、补测试、做 review、准备部署。

先定义要让主代理负责什么，再定义子代理可以并发处理哪些独立部分。
明确需要人工审批的点，例如依赖安装、外部发布和破坏性操作。
最后列出最小验证动作：类型检查、构建、手动冒烟和部署预览。

Checklist

提交前检查

别让阶段任务只停留在“看懂了”，要明确如何判断自己真的学会了。

知道 Codex CLI 应该在什么目录和什么上下文里启动。
理解 `/review`、子代理、Web 搜索和审批模式的价值差异。
知道如何把 CLI 的输出接入本地检查与自动化流程。

Pitfalls

这一阶段最容易踩的坑

小白最容易在这里形成坏习惯，所以这些坑要刻意练习避开。

用一个代理同时处理探索、实现、验证和部署，导致上下文过载。
审批模式过于宽松，把高风险动作自动化。
把外部搜索结果当作结论，而不是要求来源和交叉验证。

Codex CLI 测验

什么时候最应该考虑启用子代理？

先选一个选项，再看解析。

References

继续往下学前，先把这些资料放进书签

知识主线在本站，动态能力更新交给官方文档。

Codex CLI
官方 CLI 入口，覆盖安装、登录和基本使用方法。
Codex CLI Features
官方功能总览，可对照 review、Web 搜索、图像输入、技能等能力。
Codex Subagents
官方子代理文档，适合设计并发任务边界和协作模式。
Agent Approvals & Security
官方审批与安全文档，用于设计高风险动作的安全边界。

FAQ

这个阶段最常见的疑问

如果你在这一阶段卡住，先看这里，很多典型误区都集中在这些问题上。

是不是会几个命令就算掌握 Codex CLI 了？

不是。真正的能力在于你能不能把探索、实现、review、验证和审批组织成稳定流程。

子代理是不是开得越多越好？

不是。只有边界清晰且互不冲突时并发才有收益，否则会加重集成成本。

Next Step

学完这一阶段，马上进入下一块，不要在“看懂了”里停太久。

返回开发环境前往编码实战

推荐练习节奏

先读阶段重点
-> 完成 mission
-> 做 quiz
-> 看官方资料
-> 进入下一阶段