4006-998-758
3000+课程任你选择
生成式AI在金融行业中的应用
研发学院 生成式AI
Tyler

Ø  阿里任职期间后负责阿里云多部门算法工作,操盘过多项国家级产业项目算法工作。曾在多家世界500强企业承担人工智能技术负责人工作,具备深厚的数据智能系统研究和架构经验,实战经验覆盖包括C端B端的用户和商业化产品;

Ø  负责团队内部的技术招聘和面试工作,累计面试千人。作为阿里云内部“布道师”参与多场内部培训

Ø  全国信息学联赛一等奖保送并毕业于哈尔滨工业大学(C9),已发表多篇国际顶会和期刊发表学术论文;申请并已公开的国家发明专利 18 项,国际专利1项;

Ø  中国计算机学会技术前线委员会数据科学特邀讲者;

Ø  中国计算机学会(CCF)技术前线委员会(TF)委员人工智能与模式识别会员会委员

Ø  中国信通院标准化技术专家编委,作为主要作者参与“生成式人工智能”以及“人工智能应用安全”相关行业标准制定,致力于持续提高所负责团队以及行业的工程伦理素养。

查看老师详情
课程内容


课程大纲


模块一:战略篇:AI时代的研发新范式与技术架构

目标:从顶层设计出发,理解大模型驱动的研发模式变革,并掌握进行技术选型与架构设计的战略性考量。

  1. 技术范式:从理论到架构的权衡

    • 核心架构的演进与影响:MoE(成本vs性能)、长上下文(能力vs开销)、多模态(信息维度vs复杂性)的架构选型决策。

    • 技术趋势背后的驱动力:是什么在驱动模型架构的迭代?这对企业自建/选择模型意味着什么?

  2. DeepSeek 内核:作为生产力工具的深度解构

    • “代码感”的来源:剖析其在代码数据处理、指令遵循和逻辑推理上的特有优化。

    • 能力边界与适用场景:何时选择通用模型?何时选择专有代码模型?如何进行成本效益分析?

  3. 生态与战略:构建企业的“模型即服务”(MaaS)平台

    • 开源 vs. 闭源 vs. 自研:不同路径的战略优劣、风险与投入分析。

    • 企业内部平台化思路:如何构建统一的模型网关、服务路由与成本控制中心,避免重复建设。

  4. 【深度研讨】

    • 在企业现有技术栈下,引入大模型的最小可行性路径是什么?

    • 如何设计一个能够平滑演进的大模型基础设施,以适应未来3-5年的技术变化?

 

模块二:战术篇(一):提示词工程:从技艺到科学的系统化方法

目标:将提示词工程从个人“炼丹”的艺术,提升为团队可复用、可度量、可优化的工程学科。

  1. 复杂推理链的设计与优化

    • 思维链(CoT)的深化:从单链到树状/图状思维链(Tree/Graph of Thoughts),应对多分支决策问题。

    • 规划与执行框架:ReAct, Self-Ask 等Agentic模式的原理与实现,及其在复杂任务中的应用。

  2. “提示即代码”(Prompt as Code)

    • 版本化与测试:如何像管理代码一样,使用Git对提示词进行版本控制,并为其编写单元测试和集成测试。

    • 动态与模板化:使用 LangChain Expression Language (LCEL) 等工具,构建模块化、可组合的提示链。

  3. 提示词的自动化评估与优化

    • 建立评估基准(Benchmark):如何量化一个“好”的提示?(准确率、鲁棒性、成本)

    • 自动化优化框架:DSPy等新兴框架介绍,如何通过少量示例编译出高效的提示。

  4. 【深度研讨】

    • 如何在团队内建立一套高质量提示词的共享与沉淀机制?

    • 当提示词工程达到瓶颈时,应该转向模型微调(Fine-tuning)还是更复杂的Agent设计?决策依据是什么?

 

模块三:战术篇(二):生产级检索增强(RAG)系统

目标:超越基础RAG,掌握构建高相关性、低延迟、可维护的生产级RAG系统的核心技术与策略。

  1. 检索质量的深度优化

    • 分块策略(Chunking):针对代码、长文档、表格等不同数据类型的最优分块方法与实验对比。

    • 嵌入与排序(Embedding & Re-ranking):从单一向量检索到混合搜索(Hybrid Search),并引入重排序模型提升最终上下文的相关性。

    • 应对“大海捞针”问题:探讨长上下文窗口下的“Lost in the Middle”现象及其缓解策略。

  2. RAG流水线(Pipeline)的健壮性与可维护性

    • 数据同步与ETL:如何设计高效、准实时的数据同步机制,确保知识库“鲜活”。

    • 查询重构(Query Rewriting):在检索前,使用LLM对用户原始问题进行重写或扩展,提升检索命中率。

    • 循环与自适应RAG(Self-Corrective/Adaptive RAG):让系统能判断检索结果的优劣,并决定是否需要重新检索或补充信息。

  3. 【深度研讨】

    • RAG系统的评估体系如何建立?(端到端评估 vs. 各模块独立评估)

    • 面对数千万甚至上亿级别的文档/代码库,如何设计可扩展、高可用的RAG架构?

 

模块四:融合篇:迈向AI原生的软件开发生命周期(SDLC)

目标:探讨大模型如何从“辅助工具”转变为驱动SDLC各阶段的“核心引擎”,引发研发流程与文化的深刻变革。

  1. 需求与设计:从“被动实现”到“主动洞察”

    • 将LLM作为领域专家,通过对话探索业务边界,生成领域模型与用户旅程图。

    • 架构决策的“副驾驶”:让AI分析不同架构方案的优劣势、技术债与演进潜力。

  2. 编码与调试:人机协同的新范式

    • AI“结对编程”:从代码补全到实时代码审查、重构建议与最佳实践提醒。

    • 生成式调试:AI自动分析错误堆栈、日志,并推测根本原因,甚至生成修复补丁。

  3. 测试与质量:从“事后验证”到“生成式保障”

    • AI驱动的测试设计:自动生成符合业务逻辑的测试策略与高覆盖率的测试用例。

    • 模拟与模糊测试:利用LLM生成各种边缘、异常的输入数据,探索系统的未知缺陷。

  4. 【深度研讨】

    • 在AI原生SDLC中,研发工程师的核心竞争力将从“编码能力”转向什么?

    • 如何重构团队协作模式以最大化人机协同的效能?

 

模块五:治理篇:系统性AI治理与“负责任的AI”

目标:建立全面的、主动的、贯穿AI生命周期的治理框架,确保技术创新在可控、可信、合规的轨道上进行。

  1. 构建多层次体系

    • 超越基础防护:从Prompt注入到更隐蔽的模型后门、数据污染的识别与防御策略。

    • AI资产清单(AIBOM):建立企业内模型、数据、提示词的清单与依赖关系图,用于风险溯源。

  2. 主动式合规与隐私保护设计

    • 隐私增强技术(PETs):在模型交互中应用差分隐私、联邦学习等技术。

    • 合规即代码:将合规规则(如GDPR、DSMM)转化为可自动执行的策略,嵌入到AI工作流中。

  3. 建立AI伦理与审查委员会(AI Review Board)

    • 组织与章程:如何组建跨职能的ARB,其职责、工作流程与决策机制是什么?

    • 风险评估框架:对新的AI应用进行系统性的公平性、透明性、可解释性评估。

  4. 【深度研讨】

    • 当AI生成的代码或决策导致生产事故时,如何设计一套公平的责任归属与追溯机制?

    • 如何在“快速创新”和“严格治理”之间找到适合企业文化的平衡点?

 

模块六:度量篇:从工程效能到战略价值的量化洞察

目标:建立一套能够衡量AI引入后真实价值的新型度量体系,并以此驱动战略决策。

  1. 超越传统效能指标

    • 新一代研发指标:引入AI贡献率(AI-generated vs. human-written       code)、有效提示迭代周期、一次性正确率等。

    • 质量维度:如何量化评估AI生成代码的可维护性、可读性与架构符合度?

  2. 衡量业务与战略价值

    • 从“节省工时”到“加速创新”:如何衡量AI在缩短产品上市时间(Time-to-Market)、提升创新实验频率等方面的贡献?

    • 建立价值驱动的A/B测试平台,科学验证AI应用对业务核心指标(如用户转化率、客户满意度)的真实影响。

  3. 【深度研讨】

    • 如何向CFO和CEO清晰地阐述AI研发投入的投资回报率(ROI)?

    • 这套新的度量体系,将如何反向重塑我们的研发管理、绩效考核与资源分配?

 

模块七:实战篇:端到端构建“对话式决策智能(CDI)”平台

目标:在高度仿真的企业场景中,综合运用前序模块的所有战略、战术与治理思想,完成一个高复杂度、高价值的AI系统设计。

  1. 战略定位:从“BI”到“决策智能(DI)”

    • 价值升维:为何我们的目标不是简单的“报表机器人”,而是能够进行归因分析、预测模拟、策略建议的“决策伙伴”?

  2. 架构决策:复杂系统中的权衡艺术

    • Agentic vs.       Chain-based:针对不同复杂度的查询,系统应如何动态选择不同的执行路径?

    • 模型路由:如何根据任务类型(对话、SQL生成、Python生成),智能地将请求路由到最合适(性价比最高)的模型?

    • 状态管理:在多轮、复杂的分析对话中,如何有效管理上下文、中间结果和用户状态?

  3. 实现中的“魔鬼细节”

    • 处理复杂SQL:如何让模型理解多表Join、窗口函数、子查询等复杂逻辑?

    • RAG与DB的同步:如何优雅地处理数据库Schema变更(Schema Drift)问题?

    • 幻觉与容错:当模型生成错误代码或“一本正经地胡说八道”时,系统的检测、纠正与兜底机制是什么?

  4. 【深度研讨】

    • 该系统上线后,其持续运营和迭代的最大挑战是什么?(数据、模型、用户行为)

    • 这个案例的设计思想,如何泛化应用到企业内其他的业务场景中(如智能运维、智能营销)?


返回上一级