4006-998-758
3000+课程任你选择
AI/人工智能相关
研发学院 AI/人工智能相关
Tyler

Ø  阿里任职期间后负责阿里云多部门算法工作,操盘过多项国家级产业项目算法工作。曾在多家世界500强企业承担人工智能技术负责人工作,具备深厚的数据智能系统研究和架构经验,实战经验覆盖包括C端B端的用户和商业化产品;

Ø  负责团队内部的技术招聘和面试工作,累计面试千人。作为阿里云内部“布道师”参与多场内部培训

Ø  全国信息学联赛一等奖保送并毕业于哈尔滨工业大学(C9),已发表多篇国际顶会和期刊发表学术论文;申请并已公开的国家发明专利 18 项,国际专利1项;

Ø  中国计算机学会技术前线委员会数据科学特邀讲者;

Ø  中国计算机学会(CCF)技术前线委员会(TF)委员人工智能与模式识别会员会委员

Ø  中国信通院标准化技术专家编委,作为主要作者参与“生成式人工智能”以及“人工智能应用安全”相关行业标准制定,致力于持续提高所负责团队以及行业的工程伦理素养。

查看老师详情
课程内容

课程收益

  1. 工程确定性:掌握 Spec-Kit SDD,实现从模糊意图到可验证规格(Verifiable      Spec)的精准转化。

  2. 认知深度对齐:理解“元数据渐进式折叠”原理,解决大规模异构数据下的知识索引与推理冲突。

  3. 运行时调度:掌握上下文工程与 MCP,构建具备资源感知、容错与优先级调度的 Agent 运行时。

  4. 模型深度应用:掌握意图识别微调、参数提取优化及语料治理的全链路工程。

  5. 仿真评估体系:通过“客户建模智能体”实现      Sim2Real 迁移验证,打通离线评测与线上表现的鸿沟。

  6. 组织级治理:构建 AI-BOM 审计体系,建立可度量、可对齐、可审计的 AI 研发闭环。

课程目标

面向具备 LLM 开发经验的资深工程师、架构师及技术管理者。本课程深度聚焦 “架构确定性” 与 “工程可靠性”。以“规范驱动开发—上下文资源化—元数据深度对齐—Sim2Real 自动化评估”为核心方法论,攻克金融科技等高约束场景下智能体系统不可预测、难治理、难以规模化的工程难题。

课程大纲

第一部分:规范驱动开发与智能化基座(从效率工具到工程控制面)

目标:解决“开发过程随机性、需求一致性差、产出不可验证”的核心痛点,建立 AI 参与下的标准化研发流水线。

模块一:AI 研发提效与 SOP 资产化体系

    • 1.1 从对话到协议:构建“目标-约束-上下文-DoD”标准输入协议,将一次性对话转化为可复用的 SOP 资产。

    • 1.2 全链路高频场景:深挖文档自动生成、契约测试补齐、多语种代码评审、故障根因自动化分析。

    • 1.3 输出质量控制门禁:建立“语法-语义-业务逻辑-NFR(非功能性需求)”四层级联校验机制。

    • 1.4 团队知识沉淀:企业级提示词库(Prompt       Registry)、任务协议模板(TPM)与质量检查清单(QCL)建设。

模块二:Agentic 工作流与智能化开发插件(ClaudeCode/Copilot)

    • 2.1 仓库级感知架构:符号关系图谱、全局依赖分析、跨文件变更影响面评估原理。

    • 2.2 Agentic CLI 深度实践:基于 Analyze → Apply → Test → Evidence 的闭环工作流,实现小步提交与自动回滚。

    • 2.3 企业级安全网关:文件系统/命令执行的沙箱化、密钥过滤、最小权限原则(PoLP)在插件中的落地。

    • 2.4 CI/CD 集成闭环:AI 生成代码的自动化评审门禁、契约校验与发布联动。

模块三:AI 应用价值评估与需求规格化

    • 3.1 四维价值度量模型:业务增量、技术复杂度、合规风险、推理成本收益比(ROI)。

    • 3.2 场景对齐机制:建立业务专家、产品经理与研发团队对“意图达成率”的统一认知。

    • 3.3 需求规格化实战:将模糊业务诉求转化为原子化、可验证、无二义性的需求规格。

模块四:Spec-Kit SDD 规范驱动开发

    • 4.1 SDD 第一性原理:以 Spec 作为控制变量,通过规格约束抑制 LLM 生成的随机性与熵增。

    • 4.2 标准规格定义:涵盖目标、Non-Goals、边界条件、NFR 与风险控制的标准化文档体系。

    • 4.3 Spec-to-Code 一致性:利用 AI 自动检查代码实现是否偏离规格书,建立防漂移机制。

 

第二部分:知识工程与上下文运行时(构建高可靠认知中枢)

目标:实现“认知准、状态稳、资源可控”,构建生产级的智能体感知与执行框架。

模块五:高精度数据治理与索引策略

    • 5.1 语义化分块进阶:Semantic Chunking       与 Agentic Chunking 结合,保持文档逻辑完整性。

    • 5.2 领域嵌入优化:领域词汇适配、嵌入微调(Fine-tuning       Embedding)与 Matryoshka 表示学习。

    • 5.3 数据血缘与版本:语料质量分级管理、增量更新策略与索引重建回滚机制。

模块六:混合检索与上下文重塑

    • 6.1 查询增强闭环:HyDE、Step-Back Prompting 与多路径查询生成的工程化实现。

    • 6.2 混合检索调度:BM25 + 向量检索的权重自适应调优(Rerank 策略)。

    • 6.3 上下文降噪与压缩:解决 Lost in the       Middle 问题,实现上下文关键信息摘要与证据溯源。

模块七:异构知识融合与多模态执行

    • 6.1 智能路由层:基于意图的动态分流(RAG vs.       NL2SQL vs. GraphRAG)。

    • 6.2 实用 GraphRAG:知识图谱在多跳推理与复杂实体关联场景下的工程落地。

    • 6.3 安全工具调用:NL2SQL 的 Schema 权限隔离、复杂 JOIN 校验与防注入策略。

模块八:上下文工程与运行时调度(Agent Runtime)

    • 8.1 资源化调度管理:将上下文窗口视作系统资源,建立成本-延迟-准确性的权衡调度框架。

    • 8.2 故障模式诊断:针对上下文漂移、污染、冲突及工具执行错误的根因分析(RCA)。

    • 8.3 分层记忆模型:短程 Episodic 记忆与长程 Semantic 记忆的动态蒸馏与持久化。

第三部分:多代协作、训练迭代与企业级治理(实现规模化落地)

目标:解决复杂任务解耦、模型持续进化与组织级审计问题,确保 AI 系统长效运行。

模块九:高级多智能体协作与自适应架构

    • 9.1 协作模式选型:中心化(Manager-Worker)与去中心化(Mesh/Debate)模式的金融场景选型。

    • 9.2 主流框架深度对比:LangGraph(状态机)、AutoGen(对话驱动)、Agno(任务驱动)的底层逻辑。

    • 9.3 金融实战案例:构建自动化代码审计、智能合规报告生成的 Agent 群。

模块十:模型训练与元数据渐进式折叠(Metadata Alignment)

    • 10.1 微调实战:意图识别(多分类)、参数抽取(Slot       Filling)的 LoRA/QLoRA 高效微调。

    • 10.2 元数据渐进式折叠对齐(MPFA):从 Field 到 Scenario 的分层建模,通过一致性损失实现跨层对齐。

    • 10.3 对齐验证指标:建立元数据一致性率、时效对齐分与权限越界率等核心度量标准。

模块十一:端到端评估升级 —— Sim2Real 仿真体系

    • 11.1 客户建模智能体(Customer Twin):构建具备不同风格、风险偏好与异常行为模式的仿真用户。

    • 11.2 仿真环境构建:基于历史数据回放与极端场景生成的端到端评测沙箱。

    • 11.3 Sim2Real 映射治理:监测仿真环境指标到线上指标的分布偏移,实现失效预警。

模块十二:可观测性、AI-BOM 与组织化推广

    • 12.1 全链路可观测性:推理路径可视化、工具调用热图、延迟瓶颈分析。

    • 12.2 AI-BOM 审计体系:记录模型、Prompt、Spec、Skill 及工具版本的全量资产清单。

    • 12.3 治理与推广:生命周期管理(审批/发布/回滚)、共享资产库建设与人才认证体系。

 



返回上一级