生成式AI

生成式AI在金融行业中的应用

研发学院生成式AI

Tyler

Ø 阿里任职期间，先后负责阿里云多部门算法工作，操盘过多项国家级产业项目算法工作。曾在多家世界500强企业承担人工智能技术负责人工作，具备深厚的数据智能系统研究和架构经验，实战经验覆盖包括C端B端的用户和商业化产品；

Ø 负责团队内部的技术招聘和面试工作，累计面试千人。作为阿里云的内部“布道师”参与多场内部培训。

Ø 全国信息学联赛一等奖保送并毕业于哈尔滨工业大学（C9），已发表多篇国际顶会和期刊发表学术论文；申请并已公开的国家发明专利 18 项，国际专利1项；

Ø 中国计算机学会技术前线委员会数据科学特邀讲者；

Ø 中国计算机学会（CCF）技术前线委员会（TF）委员，人工智能与模式识别会员会委员；

Ø 中国信通院标准化技术专家编委，作为主要作者参与“生成式人工智能”以及“人工智能应用安全”相关行业标准制定，致力于持续提高所负责团队以及行业的工程伦理素养。

查看老师详情

课程内容

课程大纲

模块一：战略篇：AI时代的研发新范式与技术架构

目标：从顶层设计出发，理解大模型驱动的研发模式变革，并掌握进行技术选型与架构设计的战略性考量。

技术范式：从理论到架构的权衡

核心架构的演进与影响：MoE（成本vs性能）、长上下文（能力vs开销）、多模态（信息维度vs复杂性）的架构选型决策。
技术趋势背后的驱动力：是什么在驱动模型架构的迭代？这对企业自建/选择模型意味着什么？

DeepSeek 内核：作为生产力工具的深度解构

“代码感”的来源：剖析其在代码数据处理、指令遵循和逻辑推理上的特有优化。
能力边界与适用场景：何时选择通用模型？何时选择专有代码模型？如何进行成本效益分析？

生态与战略：构建企业的“模型即服务”（MaaS）平台

开源 vs. 闭源 vs. 自研：不同路径的战略优劣、风险与投入分析。
企业内部平台化思路：如何构建统一的模型网关、服务路由与成本控制中心，避免重复建设。

【深度研讨】

在企业现有技术栈下，引入大模型的最小可行性路径是什么？
如何设计一个能够平滑演进的大模型基础设施，以适应未来3-5年的技术变化？

模块二：战术篇（一）：提示词工程：从技艺到科学的系统化方法

目标：将提示词工程从个人“炼丹”的艺术，提升为团队可复用、可度量、可优化的工程学科。

复杂推理链的设计与优化

思维链（CoT）的深化：从单链到树状/图状思维链（Tree/Graph of Thoughts），应对多分支决策问题。
规划与执行框架：ReAct, Self-Ask 等Agentic模式的原理与实现，及其在复杂任务中的应用。

“提示即代码”（Prompt as Code）

版本化与测试：如何像管理代码一样，使用Git对提示词进行版本控制，并为其编写单元测试和集成测试。
动态与模板化：使用 LangChain Expression Language (LCEL) 等工具，构建模块化、可组合的提示链。

提示词的自动化评估与优化

建立评估基准（Benchmark）：如何量化一个“好”的提示？（准确率、鲁棒性、成本）
自动化优化框架：DSPy等新兴框架介绍，如何通过少量示例编译出高效的提示。

【深度研讨】

如何在团队内建立一套高质量提示词的共享与沉淀机制？
当提示词工程达到瓶颈时，应该转向模型微调（Fine-tuning）还是更复杂的Agent设计？决策依据是什么？

模块三：战术篇（二）：生产级检索增强（RAG）系统

目标：超越基础RAG，掌握构建高相关性、低延迟、可维护的生产级RAG系统的核心技术与策略。

检索质量的深度优化

分块策略（Chunking）：针对代码、长文档、表格等不同数据类型的最优分块方法与实验对比。
嵌入与排序（Embedding & Re-ranking）：从单一向量检索到混合搜索（Hybrid Search），并引入重排序模型提升最终上下文的相关性。
应对“大海捞针”问题：探讨长上下文窗口下的“Lost in the Middle”现象及其缓解策略。

RAG流水线（Pipeline）的健壮性与可维护性

数据同步与ETL：如何设计高效、准实时的数据同步机制，确保知识库“鲜活”。
查询重构（Query Rewriting）：在检索前，使用LLM对用户原始问题进行重写或扩展，提升检索命中率。
循环与自适应RAG（Self-Corrective/Adaptive RAG）：让系统能判断检索结果的优劣，并决定是否需要重新检索或补充信息。

【深度研讨】

RAG系统的评估体系如何建立？（端到端评估 vs. 各模块独立评估）
面对数千万甚至上亿级别的文档/代码库，如何设计可扩展、高可用的RAG架构？

模块四：融合篇：迈向AI原生的软件开发生命周期（SDLC）

目标：探讨大模型如何从“辅助工具”转变为驱动SDLC各阶段的“核心引擎”，引发研发流程与文化的深刻变革。

需求与设计：从“被动实现”到“主动洞察”

将LLM作为领域专家，通过对话探索业务边界，生成领域模型与用户旅程图。
架构决策的“副驾驶”：让AI分析不同架构方案的优劣势、技术债与演进潜力。

编码与调试：人机协同的新范式

AI“结对编程”：从代码补全到实时代码审查、重构建议与最佳实践提醒。
生成式调试：AI自动分析错误堆栈、日志，并推测根本原因，甚至生成修复补丁。

测试与质量：从“事后验证”到“生成式保障”

AI驱动的测试设计：自动生成符合业务逻辑的测试策略与高覆盖率的测试用例。
模拟与模糊测试：利用LLM生成各种边缘、异常的输入数据，探索系统的未知缺陷。

【深度研讨】

在AI原生SDLC中，研发工程师的核心竞争力将从“编码能力”转向什么？
如何重构团队协作模式以最大化人机协同的效能？

模块五：治理篇：系统性AI治理与“负责任的AI”

目标：建立全面的、主动的、贯穿AI生命周期的治理框架，确保技术创新在可控、可信、合规的轨道上进行。

构建多层次体系

超越基础防护：从Prompt注入到更隐蔽的模型后门、数据污染的识别与防御策略。
AI资产清单（AIBOM）：建立企业内模型、数据、提示词的清单与依赖关系图，用于风险溯源。

主动式合规与隐私保护设计

隐私增强技术（PETs）：在模型交互中应用差分隐私、联邦学习等技术。
合规即代码：将合规规则（如GDPR、DSMM）转化为可自动执行的策略，嵌入到AI工作流中。

建立AI伦理与审查委员会（AI Review Board）

组织与章程：如何组建跨职能的ARB，其职责、工作流程与决策机制是什么？
风险评估框架：对新的AI应用进行系统性的公平性、透明性、可解释性评估。

【深度研讨】

当AI生成的代码或决策导致生产事故时，如何设计一套公平的责任归属与追溯机制？
如何在“快速创新”和“严格治理”之间找到适合企业文化的平衡点？

模块六：度量篇：从工程效能到战略价值的量化洞察

目标：建立一套能够衡量AI引入后真实价值的新型度量体系，并以此驱动战略决策。

超越传统效能指标

新一代研发指标：引入AI贡献率（AI-generated vs. human-written code）、有效提示迭代周期、一次性正确率等。
质量维度：如何量化评估AI生成代码的可维护性、可读性与架构符合度？

衡量业务与战略价值

从“节省工时”到“加速创新”：如何衡量AI在缩短产品上市时间（Time-to-Market）、提升创新实验频率等方面的贡献？
建立价值驱动的A/B测试平台，科学验证AI应用对业务核心指标（如用户转化率、客户满意度）的真实影响。

【深度研讨】

如何向CFO和CEO清晰地阐述AI研发投入的投资回报率（ROI）？
这套新的度量体系，将如何反向重塑我们的研发管理、绩效考核与资源分配？

模块七：实战篇：端到端构建“对话式决策智能（CDI）”平台

目标：在高度仿真的企业场景中，综合运用前序模块的所有战略、战术与治理思想，完成一个高复杂度、高价值的AI系统设计。

战略定位：从“BI”到“决策智能（DI）”

价值升维：为何我们的目标不是简单的“报表机器人”，而是能够进行归因分析、预测模拟、策略建议的“决策伙伴”？

架构决策：复杂系统中的权衡艺术

Agentic vs. Chain-based：针对不同复杂度的查询，系统应如何动态选择不同的执行路径？
模型路由：如何根据任务类型（对话、SQL生成、Python生成），智能地将请求路由到最合适（性价比最高）的模型？
状态管理：在多轮、复杂的分析对话中，如何有效管理上下文、中间结果和用户状态？

实现中的“魔鬼细节”

处理复杂SQL：如何让模型理解多表Join、窗口函数、子查询等复杂逻辑？
RAG与DB的同步：如何优雅地处理数据库Schema变更（Schema Drift）问题？
幻觉与容错：当模型生成错误代码或“一本正经地胡说八道”时，系统的检测、纠正与兜底机制是什么？

【深度研讨】

该系统上线后，其持续运营和迭代的最大挑战是什么？（数据、模型、用户行为）
这个案例的设计思想，如何泛化应用到企业内其他的业务场景中（如智能运维、智能营销）？

返回上一级

课程时长

2天

课程排期

待定

我要报名我要分享

课程推荐

返回上一级