课程背景
研发团队对 Agent 开发理解薄弱,常⻅做法是将开发文档直接丢进提示词让 AI 自行生成,导致边界模糊、输出不稳定、无法调试迭代。
本课程以 Prompt Engineering → Context Engineering → Harness Engineering 三层工程模型为核心框架,结合 Agent 设计模式,帮助团队建正确的设计思维,学会判断何时需要 Agent、如何选择设计模式、如何设计高质量 Agent、如何测试 Agent。
课程目标
判断什么场景需要 Agent,什么场景不需要
掌握 Agent 设计模式的分类与选择
理解 Prompt、Context、Harness 三层⼯程的设计要点
理解 Agent 测试与传统测试的本质区别
能够从需求出发,选择合适的设计模式,设计⾼质量 Agent
课程基础
有一定编程基础的研发团队(Python 推荐)
了解 LLM 基本概念,有 API 调经验
正在或即将开展 Agent 开发,但缺乏系统化设计方法论
课程框架
Prompt Engineering — 你怎么跟 LLM 说话(指令、角色、结构)
Context Engineering — 你给 LLM 什么样的信息环境(知识、工具、记忆)
Harness Engineering — 你用什么基础设施包裹 Agent(测试、护栏、监控)
在这三层之上,Agent 设计模式决定 Agent 的"⻣架",三层工程是⻣架的"质量保障"。
课程大纲
上午
模块一:认知重建 — Agent 开发的正确打开⽅式(1h)
什么时候该⽤ Agent?
l Agent ≠ Chatbot,也 ≠ "加了个 LLM 的 API"
l 决策矩阵:固定映射⽤传统 API,语义理解单步骤用 LLM 调用,多步推理+动态决策+工具调人才需要 Agent
l Agent 开发的常见误区
l 把全量文档丢进 system prompt,让 AI "看着办"
l 什么都想用 Agent,过度工程化
l 一个 Agent 包打天下,不拆分职责、不用设计模式
l 把 Agent 当传统软件对待,不做评估体系
Agent 开发全景图
l Agent 设计模式:五大类模式(工作流、认知、知识、协作、工程)
l 三层工程:设计模式的"质量保障"
l 课程路线图:认知 → Prompt → 设计模式 → Context → Harness
模块⼆:Prompt Engineering — 指令设计(1h)
Prompt 的核⼼原则
l 清晰具体 > 模糊宽泛;指令优于约束;动词驱动
l 结构化 Prompt 设计
l 系统提示框架:角色设定 → 能用边界 → 人为规则 → 示例
l 对比演示:无结构提示词 vs 结构化提示词
l 示例驱动的指令技术
l 零样本 / 单样本 / 少样本提示
推理引导技术
l 思维链(CoT)、自我一致性、后退提示、ReAct
模块三:Agent 设计模式 — 从需求到模式(1.5h)
Agent 设计模式全景
模式类别 | 核心问题 | 代表模式 |
⼯作流模式 | 如何组织执⾏流程 | 路由、提示链、并⾏化、⼈机协同 |
认知模式 | 如何增强思维能⼒ | 推理技术(CoT/ToT/ReAct)、规划、反思 |
知识模式 | 如何获取和使⽤知识 | RAG、记忆管理 |
协作模式 | 如何多 Agent 协同 | 多智能体协作、智能体间通信 |
⼯程模式 | 如何保障系统质量 | 安全护栏、评估与监控 |
本模块聚焦⼯作流模式,其他类别在课程其他模块中展开。
路由模式(Routing) — 先分类再处理,不同请求走不同路径(如客服系统按意图分发)
提示链模式(Prompt Chaining) — 复杂任务分步执行,前一步输出作为后⼀步输⼊(如报告⽣成流⽔线)
并行化模式(Parallelization) — 无依赖的子任务并发执行,缩短总时间
人机协同模式(Human in the Loop) — AI 处理常规部分,关键节点由人类审批
模块四:Context Engineering — 上下⽂构建(1.25h)
什么是 Context Engineering?
l Prompt 是"你说什么",Context 是"AI 看到什么"
l LLM 收到的完整上下文:系统提示、对话历史、检索知识、工具定义、长期记忆、实时数据
知识上下文 — RAG 设计
l 三种 RAG 类型:传统 RAG(基础问答)、GraphRAG(复杂关联)、Agentic RAG(多步推理)
l 数据质量 > 检索算法 > 模型能力
⼯具上下⽂ — Tool Use 设计
l 工具设计原则:单一职责、清晰描述、合理粒度
l 从共具到技能:Tool → MCP → Skill 的架构演进
记忆上下⽂ — Memory 设计
l 短期记忆(对话历史管理)与长期记忆(用户画像、知识积累)
l 核心权衡:上下文窗⼝是稀缺资源
模块五:Harness Engineering — 基座工程(1.25h)
什么是 Harness Engineering?
l 包裹 Agent 的工程基础设施:测试、护栏、监控、编排、异常处理、成本控制
Agent 测试 — 与传统测试的本质区别
维度 | 传统应⽤测试 | Agent 测试 |
输出 | 确定性 | 概率性 |
断⾔ | 精确值匹配 | 语义/意图匹配 |
回归 | 固定⽤例 | 评估集 + LLM-as-Judge |
归因 | 代码逻辑 bug | Prompt / Context / 模型 / ⼯具 |
三个测试层次:组件测试 → ⼯作流测试 → 评估测试
安全护栏 — 输⼊过滤、输出验证、⾏为约束,独⽴于 Prompt 的⼯程层
监控与评估 — 实时监控、离线评估、A/B 测试
编排与调度 — 设计模式在 Harness 层的落地,任务队列与并发控制
异常处理与成本控制 — 重试/回退/⼈⼯介⼊,缓存、模型分层、Token 预算


