Stage 4

Codex CLI 全面实战

把命令行变成你与 AI 协作的主工作台。

这一阶段会系统覆盖 Codex CLI 的主能力:安装与登录、在仓库内工作、代码审查、子代理并发、Web 搜索、审批模式和自动化集成。

进阶 12-14 小时

学习进度

让学习路线变成可追踪的训练节奏

0%0/8 阶段完成
本周目标4次深度练习
下一步进入 生成式 AI 基础认知

Outcomes

学完这一阶段,你应该能做到什么

不要求一次到位,但你至少应该把这几个判断和动作练熟。

  • 能在真实仓库里稳定使用 Codex CLI 进行开发与审查。
  • 理解何时该开子代理、何时该保守、何时必须人工批准。
  • 知道如何把 CLI 能力接到日常自动化和 CI 流程里。

Lessons

核心课时

每节课都为一个工程动作服务,而不是只堆定义。

55 分钟

安装、登录与基础会话

认识工作目录、登录方式和模型能力边界,确保 CLI 在正确项目里运行。

阅读正式课程

70 分钟

让 Codex 在仓库里读、改、审查代码

理解当前工作区、上下文收集、补丁应用与代码 review 的节奏。

阅读正式课程

75 分钟

子代理、Web 搜索与图像输入

把研究、排查、实现拆开并行,提升复杂任务的处理速度。

阅读正式课程

80 分钟

Approval Modes、MCP、skills 与自动化

让 CLI 能接入更大的工程体系,同时保持安全边界和可审计性。

阅读正式课程

Course Content

正式课程内容

下面这部分才是这个阶段真正要读、要练、要做的正文。建议先顺序读,再回头做 mission 和 quiz。

这一阶段开始,你会把 AI 从“聊天对象”升级成“终端中的工作伙伴”。Codex CLI 的真正价值,不在于它会回答问题,而在于它能在仓库上下文中读代码、组织任务、做 review,并接入你已有的开发流程。

你要学的不只是命令本身,而是命令背后的组织方式:什么任务适合一个代理,什么任务适合并发,什么步骤必须人工审批,什么输出必须通过构建和测试验证。

安装、登录与基础会话

先确认身份、目录和会话边界,再开始让 Codex 真正进入工作流。

这一课要掌握什么

  • 知道为什么当前工作目录非常重要。
  • 理解登录态和项目上下文的关系。
  • 建立启动前先确认环境的习惯。

正式讲解

Codex CLI 能力再强,也必须在正确目录和正确身份下工作。你在错误目录里启动,它读到的就是错误项目;你在没有确认上下文的情况下直接执行任务,后续所有结论都会偏离。

所以基础会话的第一步不是“直接让它写代码”,而是先确认当前在哪个仓库、这个仓库怎么跑、有没有未提交改动、你是否已经准备好让 AI 开始工作。

登录则是另一个前提。只有身份与权限明确,CLI 才能稳定地使用模型能力和相关工具链。你可以把这一步理解成“进入工作区前的环境自检”。

Practice

练习:写一份 Codex CLI 启动前清单

  1. 列出启动前你需要确认的 5 件事。
  2. 至少覆盖目录、分支、未提交改动、脚本和任务目标。
  3. 把这份清单写成你以后固定会做的启动动作。

Homework

课后作业:安装、登录与基础会话

  • 把这节课的方法应用到你自己的开发环境或仓库中。
  • 写下你当前环境里最容易出错的一个点,并给出规避方法。
  • 把本课内容整理成一份你以后会重复使用的操作清单。

交付一份“可执行环境说明”或“操作清单”,而不是纯概念总结。

Test

离开这节课的原例子后,你还能稳定完成相关操作吗?

你应该能回答

  • 请描述这节课解决的核心问题是什么。
  • 请举出一个常见错误场景,并说明如何排查。
  • 请说明你会用什么检查动作证明自己已经掌握。

通过标准

  • 能独立完成相关操作,不依赖原文一步步照抄。
  • 知道常见错误会出现在哪。
  • 能用脚本、日志、检查项来验证结果。

Evaluation

优秀

你已经能把这节课的方法纳入自己的工程习惯,并能指导别人避坑。

达标

你能独立完成这节课要求的最小闭环。

还需加强

你知道概念,但真正操作时仍然经常迷路或跳步。

学完自检

  • 我知道为什么目录检查很重要。
  • 我不会一上来就让 Codex 动代码。
  • 我先确认环境,再开始会话。

让 Codex 在仓库里读、改、审查代码

核心不是“自动改代码”,而是让读代码、改代码、review 和验证形成闭环。

这一课要掌握什么

  • 理解 Codex 在仓库中的基本工作模式。
  • 知道为什么上下文收集和 patch 审查要分开看。
  • 学会把改动和验证连在一起。

正式讲解

当 Codex 进入仓库后,它最强的地方不是立即写代码,而是先读结构、定位相关文件、理解现有实现,再给出改动路径。你越愿意让它先收集上下文,后面的改动越稳定。

真正成熟的使用方式通常是一个循环:先探索,再提出修改方案,再落补丁,再 review,再跑检查。每一步都能把错误尽量往前暴露,而不是把希望压在最后一次运行上。

你要把 Codex 看成一位需要被管理的高效率工程师,而不是黑盒魔法。管理方式就是:限定范围、要求解释、要求验证。

Practice

练习:设计一条最小改动闭环

  1. 选一个小功能或小 bug。
  2. 写出探索、修改、review、验证四个步骤。
  3. 明确每一步你期望 Codex 输出什么。

Homework

课后作业:让 Codex 在仓库里读、改、审查代码

  • 把这节课的方法应用到你自己的开发环境或仓库中。
  • 写下你当前环境里最容易出错的一个点,并给出规避方法。
  • 把本课内容整理成一份你以后会重复使用的操作清单。

交付一份“可执行环境说明”或“操作清单”,而不是纯概念总结。

Test

离开这节课的原例子后,你还能稳定完成相关操作吗?

你应该能回答

  • 请描述这节课解决的核心问题是什么。
  • 请举出一个常见错误场景,并说明如何排查。
  • 请说明你会用什么检查动作证明自己已经掌握。

通过标准

  • 能独立完成相关操作,不依赖原文一步步照抄。
  • 知道常见错误会出现在哪。
  • 能用脚本、日志、检查项来验证结果。

Evaluation

优秀

你已经能把这节课的方法纳入自己的工程习惯,并能指导别人避坑。

达标

你能独立完成这节课要求的最小闭环。

还需加强

你知道概念,但真正操作时仍然经常迷路或跳步。

学完自检

  • 我会先让 Codex 探索而不是直接改。
  • 我会把 review 和验证写进任务里。
  • 我知道 patch 只是过程,不是终点。

子代理、Web 搜索与图像输入

复杂任务不要单代理硬扛,把研究、实现和验证拆开,效率会高很多。

这一课要掌握什么

  • 理解子代理适用场景。
  • 知道外部搜索和图像输入什么时候最有价值。
  • 学会避免无边界并发。

正式讲解

子代理的意义不是让系统看起来很高级,而是把互不冲突的工作并行化。比如一个代理研究资料,一个代理实现组件,一个代理准备测试,这种拆法通常能明显提高复杂任务推进速度。

Web 搜索适合解决时效信息问题,例如最新官方文档、版本差异、部署步骤。图像输入则适合处理 UI 错位、视觉异常、设计稿差异这类难以用纯文字表达的问题。

但这些能力都要基于边界清晰。多个代理同时改同一块核心逻辑,或者在没有明确来源要求的情况下大量搜索,都会让系统更乱,而不是更快。

Practice

练习:为一个复杂任务设计并发方案

  1. 选一个需要调研、实现、测试三类工作的任务。
  2. 把它拆成三个互不冲突的子任务。
  3. 标记哪部分需要搜索、哪部分需要截图、哪部分必须由主代理收口。

Homework

课后作业:子代理、Web 搜索与图像输入

  • 把这节课的方法应用到你自己的开发环境或仓库中。
  • 写下你当前环境里最容易出错的一个点,并给出规避方法。
  • 把本课内容整理成一份你以后会重复使用的操作清单。

交付一份“可执行环境说明”或“操作清单”,而不是纯概念总结。

Test

离开这节课的原例子后,你还能稳定完成相关操作吗?

你应该能回答

  • 请描述这节课解决的核心问题是什么。
  • 请举出一个常见错误场景,并说明如何排查。
  • 请说明你会用什么检查动作证明自己已经掌握。

通过标准

  • 能独立完成相关操作,不依赖原文一步步照抄。
  • 知道常见错误会出现在哪。
  • 能用脚本、日志、检查项来验证结果。

Evaluation

优秀

你已经能把这节课的方法纳入自己的工程习惯,并能指导别人避坑。

达标

你能独立完成这节课要求的最小闭环。

还需加强

你知道概念,但真正操作时仍然经常迷路或跳步。

学完自检

  • 我知道什么时候适合开子代理。
  • 我会用搜索解决时效问题。
  • 我知道截图只是上下文补充,不是完整需求。

Approval Modes、MCP、skills 与自动化

当 Codex 真正进入工程流时,安全边界和可复用工作流会比单次回答更重要。

这一课要掌握什么

  • 理解为什么审批模式必须和自动化一起考虑。
  • 知道 MCP 和 skills 的作用。
  • 建立把高频流程沉淀成资产的意识。

正式讲解

一旦 Codex 能执行真实命令、访问外部系统或参与发布,审批边界就变得非常关键。高风险动作,例如依赖安装、删除文件、外部部署,不应该在没有明确批准规则的情况下自动进行。

MCP 让 Codex 接入额外工具和资料源,skills 则让你把高频工作流沉淀下来。前者扩展能力,后者稳定复用。两者结合,才会让系统从“会回答”变成“会按你的规则工作”。

真正成熟的工程团队最终追求的不是某一次 prompt 很神,而是把成功经验变成持续可复用的模板、脚本和技能说明。

Practice

练习:为一个自动化流程设计安全边界

  1. 选一个你想自动化的流程,比如部署前检查。
  2. 写出哪些步骤可以自动执行,哪些必须人工审批。
  3. 再写出哪些内容适合沉淀成 skill。

Homework

课后作业:Approval Modes、MCP、skills 与自动化

  • 把这节课的方法应用到你自己的开发环境或仓库中。
  • 写下你当前环境里最容易出错的一个点,并给出规避方法。
  • 把本课内容整理成一份你以后会重复使用的操作清单。

交付一份“可执行环境说明”或“操作清单”,而不是纯概念总结。

Test

离开这节课的原例子后,你还能稳定完成相关操作吗?

你应该能回答

  • 请描述这节课解决的核心问题是什么。
  • 请举出一个常见错误场景,并说明如何排查。
  • 请说明你会用什么检查动作证明自己已经掌握。

通过标准

  • 能独立完成相关操作,不依赖原文一步步照抄。
  • 知道常见错误会出现在哪。
  • 能用脚本、日志、检查项来验证结果。

Evaluation

优秀

你已经能把这节课的方法纳入自己的工程习惯,并能指导别人避坑。

达标

你能独立完成这节课要求的最小闭环。

还需加强

你知道概念,但真正操作时仍然经常迷路或跳步。

学完自检

  • 我知道审批模式为什么重要。
  • 我能解释 MCP 和 skill 的差别。
  • 我开始把重复流程写成可复用资产。

Deep Dive

这一阶段真正要建立的工程习惯

读完下面这些部分,再去做练习和复盘,学习效率会高很多。

为什么 Codex CLI 值得学

图形界面聊天适合探索,而 CLI 更适合把 AI 真正塞进日常工程流。它可以在你当前仓库上下文里读代码、改代码、运行检查、做 review,并与已有终端工具链整合。

这意味着你不再是在“和模型聊天”,而是在“让模型参与开发流水线”。

主线能力应该怎么理解

安装与登录只是起点,真正重要的是工作方式:先明确当前目录与目标,再让 Codex 读取上下文、提出方案、修改代码、跑验证、输出结论。

当任务复杂到一个代理很难同时兼顾探索、实现和验证时,就应该考虑子代理并发,把边界切清楚。

安全与自动化必须一起学

Codex 越强,越不能省略审批与审查。Approval modes 决定了哪些动作可以自动执行,哪些必须经过人类确认。

而 MCP、skills 和自动化脚本的价值,在于把可重复动作产品化,让高质量工作流能够复制到团队里。

Mission

设计一条 Codex CLI 执行主线

围绕“新增一个课程进度组件”设计完整流程:探索现有代码、实现组件、补测试、做 review、准备部署。

  1. 先定义要让主代理负责什么,再定义子代理可以并发处理哪些独立部分。
  2. 明确需要人工审批的点,例如依赖安装、外部发布和破坏性操作。
  3. 最后列出最小验证动作:类型检查、构建、手动冒烟和部署预览。

Next Step

学完这一阶段,马上进入下一块,不要在“看懂了”里停太久。

推荐练习节奏

先读阶段重点
-> 完成 mission
-> 做 quiz
-> 看官方资料
-> 进入下一阶段