Stage 1

生成式 AI 基础认知

先建立概念地图，再开始让模型参与编码。

理解模型如何工作、为什么会错、什么时候值得相信、什么时候必须人工兜底，是后续 AI 辅助编程的前提。

入门 10-12 小时

学习进度

让学习路线变成可追踪的训练节奏

0%0/8 阶段完成

本周目标4次深度练习

下一步进入生成式 AI 基础认知

Outcomes

学完这一阶段，你应该能做到什么

不要求一次到位，但你至少应该把这几个判断和动作练熟。

弄清 token、上下文窗口、采样、工具调用和成本之间的关系。
知道模型最常见的失败模式，并学会把验证写进流程。
建立“模型擅长生成，开发者负责判断”的基本心智。

Lessons

核心课时

每节课都为一个工程动作服务，而不是只堆定义。

45 分钟

Token、上下文与成本

理解模型为什么不是“知道一切”，以及长上下文为什么仍然需要你做结构化输入。

阅读正式课程

50 分钟

提示词不是咒语

把目标、边界、输入、输出格式、验收标准写清楚，比追求玄学 prompt 更重要。

阅读正式课程

55 分钟

工具、RAG 与 Agent 的区别

知道什么时候该让模型调用外部系统，什么时候只做文本生成。

阅读正式课程

45 分钟

幻觉、偏差与风险控制

建立最小可信流程：引用来源、要求测试、人工复核关键决策。

阅读正式课程

Course Content

正式课程内容

下面这部分才是这个阶段真正要读、要练、要做的正文。建议先顺序读，再回头做 mission 和 quiz。

这一阶段不是为了背定义，而是为了建立一套能长期使用的判断框架。很多人一开始就急着学 prompt 技巧，结果到了真实开发场景里，既不知道模型为什么会错，也不知道自己应该对什么负责。

你真正要掌握的是三件事：模型怎么处理上下文、为什么会出现看似合理但事实错误的输出，以及怎样把验证写进日常工作流。只要这三件事立住，后面的 AI 辅助编程才不会变成盲猜。

Token、上下文与成本

理解模型输入输出的基本计量方式，以及为什么“塞更多内容”不等于“理解更完整”。

这一课要掌握什么

知道 token 是什么，以及它为什么影响成本和上下文长度。
理解上下文窗口是有限资源，而不是无限记忆。
学会判断什么时候该精简输入，什么时候该补充示例。

正式讲解

把模型想成一个正在阅读你提供材料的助手。它每次只能看到一个有限的上下文窗口，而 token 就是这份材料的大致计量单位。你给进去的背景、要求、示例和历史对话，都会一起占用这个窗口。

这意味着两个很重要的后果。第一，输入越长，成本通常越高；第二，输入越乱，模型越难抓住真正重要的信息。很多新手以为“我把所有资料都贴进去最保险”，结果恰恰是把关键约束埋在噪声里。

更好的做法是把上下文分层：先给任务目标，再给当前代码或业务背景，再给不能破坏的边界，最后给输出格式和验收标准。这样模型不是知道得更多，而是更容易知道什么最重要。

Practice

练习：压缩任务上下文

选一个你最近做过的小任务，用 5 句话描述原始背景。
把它压缩成 3 层：目标、边界、验收标准。
比较两种写法，判断哪一种更适合直接交给 AI 执行。

Homework

课后作业：Token、上下文与成本

用你自己的话重写这一课的核心观点，不要照抄正文。
围绕“Token、上下文与成本”设计一个你所在项目或练习场景中的应用例子。
把这节课的内容整理成一份可以直接交给 AI 或同伴执行的小任务单。

交付一份包含概念解释、场景示例和执行清单的学习笔记。

Test

如果你真的理解了“Token、上下文与成本”，你能不能在一个新场景里复用它？

你应该能回答

请不用原文措辞，解释这节课最重要的一条判断。
请给出一个容易做错的反例，并说明为什么错。
请描述你会如何在真实任务里验证自己已经学会这节课。

通过标准

能准确复述核心概念，而不是只会摘抄名词。
能举出至少一个真实工作流中的应用方式。
能说清怎样验证自己不是“看懂了但做不出来”。

Evaluation

优秀

你能把这节课的方法迁移到新问题中，并主动指出常见误区与验证方法。

达标

你能解释核心概念，并在给定场景里按步骤使用它。

还需加强

你还停留在记定义阶段，遇到真实问题时不知道该如何落地。

学完自检

我能解释 token 会影响什么。
我知道上下文越多不一定越好。
我开始用“目标-边界-验收”来整理输入。

提示词不是咒语

提示词的本质不是技巧炫耀，而是把任务定义清楚。

这一课要掌握什么

理解高质量 prompt 的核心组成。
区分模糊要求和可执行任务。
学会用结构化方式描述输出。

正式讲解

很多人把 prompt 理解成一套神秘咒语，仿佛只要写得足够像高手，模型就会自动给出正确答案。真实情况正好相反：模型最需要的不是华丽措辞，而是清晰任务。

一个真正有用的 prompt，至少要回答这几个问题：你要解决什么问题、当前背景是什么、哪些东西不能动、输出应该落成什么形式、怎样算完成。缺任何一项，模型都可能靠猜补空白。

尤其在代码场景里，提示词最好像一张任务单，而不是一句聊天请求。你越像在给同事分配工作，AI 的结果越稳定。

Practice

练习：把一句模糊请求改写成任务单

写一句你常见的模糊请求，比如“帮我把页面优化一下”。
补齐目标、文件范围、不能破坏的行为和完成标准。
确认改写后的版本是否已经足够让别人独立执行。

Homework

课后作业：提示词不是咒语

用你自己的话重写这一课的核心观点，不要照抄正文。
围绕“提示词不是咒语”设计一个你所在项目或练习场景中的应用例子。
把这节课的内容整理成一份可以直接交给 AI 或同伴执行的小任务单。

交付一份包含概念解释、场景示例和执行清单的学习笔记。

Test

如果你真的理解了“提示词不是咒语”，你能不能在一个新场景里复用它？

你应该能回答

请不用原文措辞，解释这节课最重要的一条判断。
请给出一个容易做错的反例，并说明为什么错。
请描述你会如何在真实任务里验证自己已经学会这节课。

通过标准

能准确复述核心概念，而不是只会摘抄名词。
能举出至少一个真实工作流中的应用方式。
能说清怎样验证自己不是“看懂了但做不出来”。

Evaluation

优秀

你能把这节课的方法迁移到新问题中，并主动指出常见误区与验证方法。

达标

你能解释核心概念，并在给定场景里按步骤使用它。

还需加强

你还停留在记定义阶段，遇到真实问题时不知道该如何落地。

学完自检

我的 prompt 里有明确目标。
我补了边界和输出格式。
我能把 AI 请求写得像工程任务。

工具、RAG 与 Agent 的区别

理解模型纯生成、检索增强和工具调用之间的边界，避免把不同能力混在一起。

这一课要掌握什么

知道纯文本生成、RAG 和 agent 工作流的差别。
理解什么时候需要外部资料，什么时候只靠模型就够。
建立“是否需要联网/工具”的判断习惯。

正式讲解

如果问题只是整理已有信息，模型往往可以直接完成；如果问题依赖最新文档、私有知识或真实系统状态，就需要额外能力。RAG 的核心是先检索，再把检索结果交给模型；agent 的核心是模型不只回答，还会调用工具、读写上下文并分步推进任务。

这三个层次的区别很重要，因为它决定了你如何设计工作流。如果问题本质上是“查最新资料再整理”，那你就不该只靠模型记忆。如果问题本质上是“读仓库、改代码、跑检查”，那你需要的是 agent 化工作流，而不是普通聊天。

你可以把它们理解成能力递进：纯生成适合总结与草拟，RAG 适合事实增强，agent 适合真正进入工程流程。不要一上来就把所有问题都扔给最高复杂度的方案。

Practice

练习：判断问题该用哪种模式

列出 3 个问题：一个纯总结、一个依赖最新文档、一个需要动代码。
分别判断它适合纯生成、RAG 还是 agent 工作流。
写下你的判断理由。

Homework

课后作业：工具、RAG 与 Agent 的区别

用你自己的话重写这一课的核心观点，不要照抄正文。
围绕“工具、RAG 与 Agent 的区别”设计一个你所在项目或练习场景中的应用例子。
把这节课的内容整理成一份可以直接交给 AI 或同伴执行的小任务单。

交付一份包含概念解释、场景示例和执行清单的学习笔记。

Test

如果你真的理解了“工具、RAG 与 Agent 的区别”，你能不能在一个新场景里复用它？

你应该能回答

请不用原文措辞，解释这节课最重要的一条判断。
请给出一个容易做错的反例，并说明为什么错。
请描述你会如何在真实任务里验证自己已经学会这节课。

通过标准

能准确复述核心概念，而不是只会摘抄名词。
能举出至少一个真实工作流中的应用方式。
能说清怎样验证自己不是“看懂了但做不出来”。

Evaluation

优秀

你能把这节课的方法迁移到新问题中，并主动指出常见误区与验证方法。

达标

你能解释核心概念，并在给定场景里按步骤使用它。

还需加强

你还停留在记定义阶段，遇到真实问题时不知道该如何落地。

学完自检

我能区分 RAG 和 agent。
我知道什么时候必须查外部资料。
我不会把所有任务都复杂化处理。

幻觉、偏差与风险控制

真正可靠的 AI 使用方式，不是避免错误，而是设计能暴露错误的流程。

这一课要掌握什么

理解模型为什么会产生幻觉。
知道哪些场景风险最高。
学会把验证、引用和人工复核嵌入流程。

正式讲解

模型会给出错误信息，并不总是因为“它很笨”，而是因为它的目标是生成最合理的下一段输出，而不是自动证明自己所有结论都正确。尤其当上下文不完整、问题有歧义、资料过时或要求过宽时，它很容易用看起来顺畅的方式补全未知部分。

风险高的场景通常包括事实判断、医疗法律金融建议、最新版本差异、部署步骤以及任何需要精确引用来源的内容。越是这些场景，你越不能只看语气像不像专家。

成熟的控制方式不是“希望它别错”，而是把错误更早暴露出来：要求引用来源、要求写测试、要求说明假设、要求区分已知与推测、关键结果必须人工二次判断。

Practice

练习：给一个高风险任务加防错栏杆

选一个高风险任务，比如“升级部署配置”。
给任务补上来源要求、验证方式和人工审批点。
检查是否还存在“模型说了算”的环节。

Homework

课后作业：幻觉、偏差与风险控制

用你自己的话重写这一课的核心观点，不要照抄正文。
围绕“幻觉、偏差与风险控制”设计一个你所在项目或练习场景中的应用例子。
把这节课的内容整理成一份可以直接交给 AI 或同伴执行的小任务单。

交付一份包含概念解释、场景示例和执行清单的学习笔记。

Test

如果你真的理解了“幻觉、偏差与风险控制”，你能不能在一个新场景里复用它？

你应该能回答

请不用原文措辞，解释这节课最重要的一条判断。
请给出一个容易做错的反例，并说明为什么错。
请描述你会如何在真实任务里验证自己已经学会这节课。

通过标准

能准确复述核心概念，而不是只会摘抄名词。
能举出至少一个真实工作流中的应用方式。
能说清怎样验证自己不是“看懂了但做不出来”。

Evaluation

优秀

你能把这节课的方法迁移到新问题中，并主动指出常见误区与验证方法。

达标

你能解释核心概念，并在给定场景里按步骤使用它。

还需加强

你还停留在记定义阶段，遇到真实问题时不知道该如何落地。

学完自检

我知道幻觉不会因为语气自信而减少。
高风险任务我会加来源和验证。
关键结论我保留人工复核。

Deep Dive

这一阶段真正要建立的工程习惯

读完下面这些部分，再去做练习和复盘，学习效率会高很多。

模型为什么会看起来聪明

生成式模型本质上是在已有上下文里预测下一个最可能出现的 token。它能表现出推理、总结、编写代码等能力，但这不代表它总能保持事实正确或逻辑完整。

当你理解模型靠上下文工作，就会自然接受一个重要事实：给模型更清晰的任务边界、示例和输出格式，通常比空泛地要求“帮我写得更好”更有效。

为什么 AI 辅助编程会失败

失败往往不是因为模型不会写代码，而是因为开发者没有给出验收标准。没有测试目标、没有文件范围、没有兼容性要求，模型就只能在模糊任务里猜。

真正成熟的 AI 编程流程，一定包含人类负责的部分：需求澄清、上下文筛选、结果审查、回归验证和发布判断。

进入下一阶段前要有的习惯

你需要开始把每个任务写成结构化问题：目标是什么、边界是什么、输出应该落到哪里、如何判定完成。

这是后面使用 Codex CLI 时最重要的能力，因为好的命令输入，本质上就是好的任务定义。

Mission

写出第一份可验证的 AI 任务说明

选择一个你熟悉的小功能，比如“待办列表的搜索栏”，用三段话写清楚目标、约束和验证方式。

先用一句话描述用户价值，而不是直接说要写什么代码。
补充文件范围、技术栈、不能破坏的行为和必须保留的接口。
再写出验收标准，例如要通过哪些测试、页面上应该出现什么结果。

Checklist

提交前检查

别让阶段任务只停留在“看懂了”，要明确如何判断自己真的学会了。

能解释 token、上下文和成本的基本关系。
知道什么叫做结构化任务输入。
知道为什么没有验证条件的 AI 请求通常质量不稳定。

Pitfalls

这一阶段最容易踩的坑

小白最容易在这里形成坏习惯，所以这些坑要刻意练习避开。

把模型输出当作事实，而不是候选答案。
以为提示词越长越好，忽略了信息是否有层次。
忽略风险信息，比如隐私、版权、错误引用和过时知识。

AI 基础测验

如果你想让 AI 改代码，下面哪项最能提升结果质量？

先选一个选项，再看解析。

References

继续往下学前，先把这些资料放进书签

知识主线在本站，动态能力更新交给官方文档。

OpenAI Developers
官方开发者入口，可用于理解模型、工具与平台能力边界。
OpenAI Platform Docs
补充平台层面的核心概念，帮助建立后续工程化学习背景。
任务定义模板
可从官方资源页找示例，把目标、约束和验收标准写成固定模板。

FAQ

这个阶段最常见的疑问

如果你在这一阶段卡住，先看这里，很多典型误区都集中在这些问题上。

是不是 prompt 写得越长越好？

不是。重点不是长度，而是结构。把目标、边界、验收写清楚，比无边界地堆背景更有效。

模型错了是不是就说明不能用？

不是。真正的问题不是它会不会错，而是你有没有设计让错误暴露出来的流程。

Next Step

学完这一阶段，马上进入下一块，不要在“看懂了”里停太久。

前往协作心法

推荐练习节奏

先读阶段重点
-> 完成 mission
-> 做 quiz
-> 看官方资料
-> 进入下一阶段