4006-998-758
新闻动态

企业 AI PoC 怎么设计,才不会变成演示工程?

2026-06-11

作者 / 来源:中智凯灵 / AiDD

21-260611155050938.png


—— AiDD 上海站到 FDE 方法论:PoC 的目标不是把AI 演出来,而是把不确定性测出来

过去一年,很多企业的 AI 项目都经历过同一个拐点。

Demo 阶段通常很顺:模型能读文档,Agent 能调工具,页面能生成报告,几分钟的演示足以让会议室里的人觉得方向可行。但到了下一步,问题很快冒出来:真实数据拿不到,业务口径不统一,用户反馈靠会议口头收集,评估标准说不清,系统权限不敢开放,流程也接不进现有工作方式。

项目没有马上失败,却也没有真正进入业务。它卡在一个尴尬位置:证明了AI 看起来能做事,却没有证明这项能力值得继续投入。

这就是企业 AI PoC 最容易掉进去的陷阱:PoC 被做成了演示工程。

在第 9  AI+研发数字峰会(AiDD 2026 上海站)的多场分享里,这个问题反复出现。AI 进入企业之后,瓶颈已经不只是模型能不能做,而是业务意图是否清楚、结果是否可验证、数据和知识是否可用、流程是否能嵌入、权限是否可控,以及上线后是否有人持续运营。

会后FDE 深度工作坊《AI 大模型时代的 FDE 转型实战》也把这个问题讲得很直接:大模型和智能体项目不是传统确定性软件项目,它会遇到需求涌现、输出概率性、技术快速变化、验收模糊等挑战。如果还用传统软件项目的方式来设计 AI PoC,就很容易得到一场顺滑演示,而不是一次真实验证。

21-260611155120G9.png

 1FDE 深度工作坊《AI 大模型时代的 FDE 转型实战》:AI 项目交付面临需求涌现、设计返工、技术更新快、验收无止尽四类挑战(PPT  4 页)

所以,企业设计 AI PoC 时,第一个问题不应该是这个智能体能不能做出来,而应该是:我们能不能用最低成本判断,它是否值得继续投入?


PoC 的任务,不是证明技术很强,而是找到真实问题

很多 AI PoC 一开始就把顺序放反了。

团队先看到模型能力,再倒推应用场景:模型能读文档,于是做知识库;模型能写代码,于是做开发助手;Agent 能调工具,于是做流程助手。这些方向未必不对,但如果起点只是技术能做什么PoC 很容易变成能力展示。

真正有价值的 PoC,应该先回到业务现场:谁在什么场景下被什么问题反复卡住?现在靠什么方式解决?成本在哪里?如果 AI 做得更好,哪个业务结果会发生变化?

AiDD 上海站关于 Spec Driven 和意图驱动交付的分享,也在提醒同一件事。兴云数科资深需求 AI教练郑涛在《意图驱动交付:Agent 时代从交付系统到交付价值的实践》中提出,需求正在从一次性的文字描述,转向可执行、可追踪的数字化资产。对 AI 项目来说,这意味着 PoC 的入口不能只是一句我们想做一个智能体,而要先把业务意图变成可验证的问题。

21-260611155149519.jpg

 2:郑涛《意图驱动交付:Agent 时代从交付系统到交付价值的实践》:需求重塑,意图成为可执行的数字化资产(PPT  20 页)

这也是 FDE 与普通驻场开发的区别。FDE 不是等需求写完以后再排期,也不是只负责写代码和调 Prompt,而是要进入业务现场,和业务方一起把模糊想法拆成可运行、可验证、可迭代的 AI 能力。

21-260611155244V4.png


 3FDE 深度工作坊《AI 大模型时代的 FDE 转型实战》:FDE 不是驻场开发的新名字,而是进入业务现场、转化业务意图、建立评估反馈闭环的复合型交付角色(PPT  7 页)

如果问题本身没有被定义清楚,后面的开发越快,偏差也可能来得越快。PoC的第一项产出,不该只是一个能点开的原型,而应该是一份足够清楚的业务场景说明:目标用户是谁,核心流程是什么,样本从哪里来,判断对错的标准是什么,哪些边界暂时不做,哪些风险必须提前暴露。



演示工程喜欢干净样本,真实PoC 要主动暴露脏问题


Demo 往往喜欢干净样本。

资料完整,字段规整,问题标准,答案唯一,流程没有异常。这样的样本适合展示能力,却不适合判断项目能不能落地。真实业务里通常相反:文档版本混乱,历史记录缺失,口径互相打架,用户提问模糊,系统权限复杂,异常场景比标准流程更能决定项目成败。

FDE 实践框架在场景探索与 PoC”阶段提出,PoC 不需要一开始覆盖全部场景,但必须聚焦核心逻辑,处理 1-2 个典型 case,并向用户、BA AIBP 获取 2-3 个真实样本数据,用来验证基本逻辑是否正确。

21-26061115531W35.png

 5FDE 深度工作坊《AI 大模型时代的 FDE 转型实战》:PoC 后进入周度迭代,用每周 Demo 和业务反馈推动智能体从 Alpha/Beta 走向可用版本(PPT  34 页)

这个机制的价值,不只是让团队更敏捷,而是让业务方持续参与判断。AI 输出具有概率性,业务方对好不好的判断也会在使用中变化。第一周觉得惊艳的能力,第二周可能暴露不稳定;第一次觉得没用的功能,换成真实数据后可能找到高价值切口。

小红书资深工程师林能源在《从跑分到护栏:AI Agent 可观测和质量保障体系》中也提到,Agent 落地的瓶颈正在从能不能跑转向能不能评估这句话放在 PoC 阶段尤其重要:没有评估集、质量维度和 Bad Case 回流,项目很容易停留在主观试用。

21-260611155435428.png


图 6:林能源《从跑分到护栏:AI Agent 可观测和质量保障体系》:Agent 时代需要新的 Ops 范式(PPT 第 10 页)

因此,PoC 方案里要提前写清楚:谁每周看结果,谁提供样本,谁判断答案对错,哪些 Bad Case 要回流,哪些反馈进入下一轮迭代。没有这些安排,PoC 很容易从技术项目变成汇报项目。



好的 PoC,也要允许项目停下来


不是每个 AI PoC 都应该导向上线。

这句话听起来有些反直觉,但它恰恰是 AI 项目管理里很重要的一点。AI 项目天然带有不确定性:有些场景业务价值不够,有些数据拿不到,有些合规风险过高,有些模型能力暂时不稳定,有些组织投入不匹配。如果没有决策关口,团队就会把不该继续的项目也拖进后续开发。

FDE 方法论把企业 IT 投资逻辑的变化讲得很直接:AI 项目需要从大项目制转向小步快跑,从确定性规划转向探索性投资,并设置 Fail Fast 决策关口。

21-2606111555051W.png


 7FDE 深度工作坊《AI 大模型时代的 FDE 转型实战》:AI 项目需要从大项目制转向小步快跑,并设置 Fail Fast 决策关口(PPT  39 页)

这意味着 PoC 结束时,不能只给一个演示成功的结论。它更应该回答几个接近经营决策的问题:技术是否可行?数据和知识是否可持续获取?业务接口人是否愿意持续投入?合规和权限风险是否可控?业务价值是否足以支持下一阶段投入?

如果答案不成立,及时暂停、换场景、缩小范围、补数据、补知识库、补评估体系,都可能是 PoC 的合理结果。一个好的 PoC 不一定证明项目一定能上线,它也可以帮助企业更早知道不该继续这样做

这类判断,比一次漂亮演示更有价值。



PoC 的终点,不是一个产品,而是一项可运营能力


企业做 AI PoC,最后真正要判断的,不是有没有做出一个智能体产品,而是有没有可能形成一项可以持续运行的 AI 能力。

产品可以有界面、有功能、有说明书;能力则还需要知识来源、业务规则、样本集、评估指标、权限边界、反馈机制、版本记录和运营负责人。产品上线后可能没人管,能力上线后必须有人持续看、持续改、持续沉淀。

FDE 把生产级智能体拆成四个阶段:场景探索与 PoC、迭代交付与用户试用、持续优化与可配置化、自主运营与持续监控。这个拆法很清楚地说明,PoC 不是终点,而只是第一阶段。

21-26061115553T58.png

 8FDE 深度工作坊《AI 大模型时代的 FDE 转型实战》:生产级智能体要经历场景探索、迭代交付、持续优化、自主运营四个阶段(PPT 32 页)

如果一个 PoC 从一开始就没有考虑运营,后面大概率会卡住:业务方不知道怎么提反馈,技术方不知道怎么判效果,管理层不知道怎么衡量投入,系统出了问题也不知道谁负责。

所以,PoC 设计里至少要提前回答三件事:上线后谁运营,哪些指标持续看,错误和反馈如何进入下一轮优化。没有运营设计的 PoC,最多只能证明做得出来;有运营设计的 PoC,才可能证明跑得下去



结语:PoC 的价值,是把不确定性变小


企业 AI 项目最怕的不是失败,而是不知道为什么失败。

一个被设计成演示工程的 PoC,会把不确定性藏起来:它避开脏数据,绕开真实流程,暂时不谈权限,也不建立评估和运营机制。短期看起来顺,长期反而会增加风险。

一个真正面向落地的 PoC,则会主动暴露不确定性:问题是不是真,样本够不够真,反馈能不能闭环,决策关口是否清楚,运营能力能不能接上。它不承诺每个项目都成功,但能让企业更早知道哪些项目值得继续,哪些项目应该调整,哪些能力需要先补。

这也是 FDE AI 时代重新被讨论的原因。FDE 不只是把模型接进业务系统的人,而是把业务意图、数据知识、智能体能力、工程实现、评估反馈和持续运营组织起来的人。好的 FDE 会把 PoC 做成一台筛选器:筛出真实问题,筛出可行路径,也筛出组织必须补上的能力。

主要参考资料

• 郑涛:《意图驱动交付:Agent 时代从交付系统到交付价值的实践》,AiDD 上海站:Spec-driven 研发与智能需求工程论坛,2026-05-23。
• 林能源:《从跑分到护栏:AI Agent 可观测和质量保障体系》,AiDD 上海站:Agent 评测和质量保障论坛,2026-05-22。
• 中智凯灵 FDE 深度工作坊:《AI 大模型时代的 FDE 转型实战》,2026-05-22 版。



下一站




AI 项目 PoC 的故事,上海站只是开篇。

当企业从试一试AI”进入 AI 放进真实业务,更需要讨论的就不只是模型能力,而是场景识别、PoC 设计、评估护栏、组织协同和持续运营。

2026  AiDD 北京站,将在上海站的基础上继续关注 AI 研发、Agent 工程化、企业智能体和组织级落地。 23-24 日的 FDE 专题实践,也会把这些问题带到更具体的业务场景里:如何识别场景,如何设计 PoC,如何搭建知识库和智能体,如何建立评估与反馈闭环,并把 AI 项目推向真实使用。

PoC 的目标不是让 AI 看起来能做事,而是让企业更清楚地知道:什么值得做,怎么做,以及谁来把它持续做下去。


21-26061116022U49.png



返回列表