4006-998-758
新闻动态

当AI生码率被抛弃,什么才是产研提效的真相?——来AiDD上海站找答案

2026-05-20


21-260520103910P6.jpg


当所有团队都在晒「AI生码率90%」时,为什么业务交付周期反而变长了?

2026年5月,阿里云CIO蒋林泉团队的一份实践复盘在技术圈引发热议:

「CIO正在抛弃AI生码率」

为什么?

因为「代码行数不加权就没有意义」,因为「代码一旦生产出来,首先是负债」,因为「真正的效能提升要看业务价值E2E,而非过程指标」。

这背后,不是技术路线的分歧,而是一场关于「什么才算真正提效」的认知革命。

当行业还在为「出码率从20%攀升到80%」欢呼时,一批头部企业的技术决策者已经开始悄悄抛弃这个指标。

因为,他们看清了三个正在发生的认知跃迁



01度量跃迁:从「生了多少代码」到「创造了多少业务价值」


先看一个反直觉的事实:

在完整的软件工程生命周期中,开发人员实际编写代码的时间仅占20%。大量时间消耗在需求对焦、跨团队沟通、上下游联调及返工等环节。

这意味着什么?

即使你把编码环节的AI渗透率从0%拉到90%,整体提效也不过18%-27%。更糟糕的是,如果生成的代码质量不可控,反而会放大后续环节的返工成本。

高德大模型应用平台团队在2025年云栖大会上分享过一组真实数据:出码率从53%提升到80%-90%,但项目交付周期没有明显缩短。编码快了,但Review慢了;出码多了,但返工也多了

蒋林泉在团队反复强调一个逻辑,细思极恐:

「代码能否转化为资产,即对业务客户产生正向价值,是不确定的。但任何代码进入生产环境后,要即刻引入维护成本、增加系统复杂度——所以,代码首先是负债。」

这个判断彻底颠覆了「多写代码=多产出」的朴素认知。

当AI让代码生产的边际成本趋近于零时,它同时也在加速放大流程中每一个错误决策的代价。生成的代码如果不能对业务产生正向价值,规模化地生产代码,本质上就是规模化地生产技术债务

真正的度量,必须穿透过程指标,直达价值闭环

阿里云的实践给出了答案:衡量标准必须从「过程指标」(出码率、调用次数、Token消耗)转向「结果指标」:

21-2605201039533O.png


指标变了,行为才会变

当团队不再为「今天用AI写了多少代码」焦虑,而是聚焦「这个需求是否真正解决了用户问题」,提效才真正开始。


02能力跃迁:从「技能通胀」到「品味通缩」——定义问题的能力比写代码的能力更稀缺



蒋林泉提出:「技能通胀,品味通缩」

八个字,浓缩了AI时代对组织和人才的价值迁移方向。

  • 技能通胀:随着工具的普及,编码、测试、文档编写等「硬技能」正在迅速失去稀缺性

  • 品味通缩:对业务价值的判断、对「好」的定义能力,成为稀缺资源

「品味,是对业务价值的判断,对一件事情好与不好的最终验收;AI只能做到average,但有品味的人,能定义什么是「好」。」

这意味着什么?

企业正在从为传统的技能付费,转向为判断和结果付费。

基础回归:语文 × 数学 = 超强理解和无损抽象

一个具启发性的观点:AI时代工程师的底层能力,正在回归最基础的「语文」与「数学」。

  • 语文能力:精准的阅读理解与表达——既能准确地将意图传递给AI,又能敏锐地理解AI的输出

  • 数学能力:「无损压缩」的抽象能力——如何将复杂的业务意图压缩为精确、可执行的结构

品味至上:定义问题 × 驾驭Agent

基础逻辑之上,更高一层是对Agent的驾驭:

  1. 驾驭Agent团队:开源社区和业界高手持续推高Agent工具的能力天花板,普通团队直接借力就能获得很高的水平

  2. 定义最左侧:左移定义问题的能力,也就是定义需求、数据结构,把需求精准抽象表达出来,以及如何验证结果

用蒋林泉给「品味」下的定义:

「本质上,品味是人类对复杂世界的经验、抽象能力和责任感的结晶。AI可以提升下限,但上限,永远靠人来定义。」



03组织跃迁:从「全栈幻想」到「Half-Stack现实」——PDFE+ABE重构岗位生产关系


近来,「一人公司」「AI Native型组织」兴起,全栈工程师的概念再次流行。

蒋林泉对这股热潮做了理性观察:

大部分硅谷的一人公司,要么是价值链极短的(比如自媒体创业)

业务高度复杂的企业系统,做不到极少数人;规模化的生产系统,也做不到极少数人。

Half-Stack:重构岗位新生产关系

不去妄想全栈,最大限度利用AI降低跨域门槛,重构新阶段的「Half-Stack」岗位。

阿里云CIO团队将核心岗位收拢为两个:

1. PDFE(AI产品设计前端工程师)

  • 前身:产品经理 + 交互设计师 + 前端工程师 三合一
  • 职责:从业务沟通到Demo确认,再到API对齐和前端开发
  • 效果:原来至少需要两周的对焦迭代周期,变成半天的协同确认

2. ABE(AI架构与后端工程师)

  • 前身:架构设计 + 后端开发 + AI Agent开发 融合
  • 职责:解决数据结构、状态机、API、高可用和高可靠的问题
  • 核心:后端不仅仅是写代码,还要解决架构的有效性和稳定性

表面上看是「岗位合并」,底层逻辑是对组织设计的重新思考:

过往技能深度是划分职能的主要依据——前端守前端,后端守后端,设计守设计。但这个逻辑在AI追平技能的情况下,开始松动。

最终,「Half-Stack」带来最直接的变化是:协同链被巨幅压缩——职能压缩、技能岗位压缩,沟通链路几何级数下降



04

来AiDD上海站:这些思考,正在被系统性验证

上述三个认知跃迁,不是孤立的理论推演,而是正在被行业头部实践系统性验证的思考。

这恰好与2026年5月22-23日在上海举办的AiDD峰会的演讲主题相合

 在「AI+研发效能10X提升」论坛:重新定义效能度量

出品人任晶磊(思码逸CEO、《软件研发效能度量规范》核心起草专家)将带来主题演讲《小时级Agent无干预编程实践与AI原生软件开发范式》。

核心观点直击要害:

「快速构建原型不是AI coding的全部意义。AI原生软件开发中,比编码速度更重要的能力,是agent在完全无人干预的情况下能持续多久产出有价值的工作。」

演讲将首次公开:

  • 小时级Agent无干预开发实例(耳听为虚,眼见为实)
  • 可靠性为先的Agentic Coding设计机制
  • Spec-driven开发的本质:如何实现规约层面的可组合性与可复用性

这不是炫技,而是下一代软件工程的底层逻辑

同场,京东科技资深效能专家鞠晓岩将系统拆解《从传统到智能:产研效能提升之路》,首次公开京东"基建-实践-度量"三层人机协同效能体系的构建方法论,以及从Prompt交互到基建化落地的三阶段演进路径。

「坑点1:Prompt质量不稳定→解决方案:沉淀行业化Prompt模板库」

「坑点2:工具数据孤岛→解决方案:搭建统一数据中台」

每一条,都是真金白银踩出来的经验。

 在「快手专场」:快手研发效能团队首次对外开设专场,分享万人团队的智能研发范式跃迁

当理论遇到超大规模组织的复杂场景,会碰撞出什么?

快手技术团队将首次系统性分享《AI × 研发效能:快手万人团队的智能研发范式跃迁》。

由快手研发效能负责人、AI生产力负责人沈浪担任出品人,三位核心实战专家首次系统性披露:在万人研发团队中,如何让AI真正落地、真正提效、真正产生业务价值。

核心干货:

  • L1-Copilot → L2-Agent → L3-Agentic:三级研发范式的演进逻辑与落地路径

  • 穿透"个体变快但组织没快"的转化困境:分层度量与归因体系的设计方法论

  • 从工具辅助到人机协同:生产级Coding Agent与AI-Native IDE的工程化实践

 李思:穿透"个体变快但组织没快"的转化困境

分享主题:《快手主站千人级团队AI DevOps研发范式升级实践》
分享人:快手主站AI DevOps项目负责人 李思

很多团队都有这样的困惑:

  • 工程师用Copilot写代码快了30%,但需求交付周期没变;
  • 单点工具渗透率很高,但跨团队协作依然卡顿;
  • AI生成的代码越来越多,但返工率、缺陷率也在上升。

问题出在哪

李思老师的分享,将首次公开快手在千人级研发体系中的"范式升级"方法论:

 L1-Copilot → L2-Agent → L3-Agentic:三级研发范式的演进逻辑与落地路径
 分层度量与归因体系:如何识别"伪提效",如何量化"真价值"
 从工具辅助到人机协同:生产级Coding Agent与AI-Native IDE的工程化实践
 组织协同的重构:当个体能力被放大,团队流程该如何适配?

「AI落地不是铺工具,而是重塑范式。」

这不仅是快手的经验,更是所有中大型企业迈向AI Native组织的必经之路。

 周鸿轩:从Copilot到Agent,AI Coding的产品逻辑重构

分享主题:《从Copilot到Agent:开发提效与范式跃迁》
分享人:快手AI Coding专家 周鸿轩

AI Coding这两年的演进速度之快,几乎超过所有人的预期:

  • 2023:代码补全、问答辅助,"写代码更快了"
  • 2024:上下文理解、多轮对话,"能帮我改个Bug了"
  • 2025:Agentic Engineering、Agent Teams,"能独立完成一个模块了"

但每一次跃迁背后,都需要一套新的产品逻辑和工程架构去承接。

周鸿轩老师作为快手AI Coding从0到1的核心建设者,将首次系统性拆解:

 产品演进的三层逻辑:从"辅助人"到"替代人"到"协同人"的能力边界与适用场景
 Agent嵌入协作网络的关键设计:如何让AI理解团队规范、业务上下文、历史决策?
 工程架构的四大支柱:上下文管理、任务编排、质量门禁、持续学习的系统化方案
 提效评估的三维模型:速度×质量×可维护性,如何平衡?

「Copilot解决的是'怎么写',Agent解决的是'写什么'和'为什么这么写'。」

这不仅是技术升级,更是对"开发"这件事本身的重新定义。

 苗星:智能测试,一场安静但深入的变革

分享主题:《智能UI用例生成与执行》
分享人:快手研发Agent负责人 苗星

编写成本高、维护困难、页面一改全崩——传统UI测试的痛点,相信在座很多工程师都深有体会。

而当大模型能力真正成熟,这个领域正在迎来一场安静但深入的变革

苗星老师带领的团队,在快手内部已经把这条路趟了出来。本次分享将首次公开:

✅ 智能用例生成的三层能力:从页面结构理解→业务逻辑推断→边界场景覆盖
✅ 执行闭环的关键技术:如何让AI生成的用例真正"跑得通""测得准""报得清"
✅ 端到端AI Tester的愿景路径:从"辅助测试"到"自主测试"的演进路线与能力边界
✅ 规模化落地的工程挑战:如何在千人团队中保证用例质量、降低维护成本、提升执行效率?

「测试的本质不是找Bug,而是验证价值。AI让验证的颗粒度更细、频率更高、成本更低。」

这不仅是测试范式的升级,更是质量保障体系的重构。

 三场分享,同一件事:体系重建,而非工具替换

  • 李思老师讲组织范式:如何在千人级团队中构建AI DevOps体系,穿透"个体变快但组织没快"的转化困境;
  • 周鸿轩老师讲产品演进:AI Coding如何从Copilot走向Agent,真正嵌入团队协作网络;
  • 苗星老师讲质量闭环:智能测试从生成到执行的完整路径,以及端到端AI Tester的愿景。

三场分享,是三个维度,也是同一件事

AI与研发的深度融合,不是工具替换,而是体系重建

这条路快手已经走了两年,前方还有更多未知。但今天分享的这些经验与思考,希望能给在座的各位提供一些参照:

  • 少走一些弯路
  • 多留一些时间思考真正重要的问题
  • 在"技能通胀"的时代,找到组织真正的竞争力锚点

 在「AI+代码生成与质量管理」论坛:严肃软件的底线思维

当行业热议「氛围编程」(Vibe Coding)时,中兴通讯资深架构师丁辉带来一记清醒剂:

「大模型推理时短路的特点,使得生成代码的隐患越发突出。语法层面故障很容易识别,但深层次的设计层面缺陷带来的可靠性故障很难发现——特别是针对高可靠性场景下的严肃软件。」

演讲《严肃软件中基于大模型代码设计范式质量门》首次公开:

  • 领域约束→设计范式→语言机制的三层思维链检查机制
  • 如何发现大模型生成代码中的深层次设计问题
  • 在「严肃软件」中落地大模型编程的实战经验

这不是反对AI编程,而是让AI编程真正可用、可信、可控

同场,货拉拉中间件架构师万深高将分享《货拉拉AI Coding规模化落地:从普及到Agentic的工程实践》,首次公开企业级AI代码占比度量方法、上下文工程建设核心方法、以及企业级工具风险防控与平替方案设计思路。

「3.2 AI代码占比度量方法与计算模型:货拉拉的度量体系设计与行业对比思考」「4.4 AI生成代码的安全与合规边界管控」

每一条,都是规模化落地必须面对的硬核问题。

 学术前沿:从「代码编写」到「需求编译」

上海交通大学副教授林云将带来《从"代码编写"到"需求编译":AI智能体驱动下的软件工程演进与前沿探索》。

核心洞察:

「在生成式AI以前所未有的速度重塑代码生成的今天,传统软件工程正面临从"代码编写"向"需求定义"与"质量约束"转移的深刻范式变革。」

演讲将首次公开:

  • 上海交大IEEE试点班的教学改革实践:如何引导学生从"代码工人"转型为"智能体架构师"
  • ARC(Agentic Requirement Compilation)需求编译框架:如何将包含50-200个场景的需求文档编译为可运行的Web系统
  • GUI测试通过率较主流基线平均提升50.6%的技术路径

这不是实验室玩具,而是下一代软件工程的学术奠基



052026,产研提效的三条铁律


基于头部企业的实战复盘与学界前沿探索,我们可以提炼出2026年产研提效的三条铁律:

铁律一:价值牵引优先于效率优化

「落到结果上,比代码倍增更重要的,一定是业务价值的倍增。」

AI是加速器,不是方向舵。如果没有价值牵引,等于在错误的方向上狂奔,AI生产再多也只是视同垃圾。

衡量标准必须从「过程指标」转向「结果指标」:端到端交付周期、业务需求一次性通过率、缺陷逃逸率、业务价值闭环达成率。

铁律二:规范驱动优先于氛围编程

「在"最左侧"是对的,后面的交付就会越来越容易。这是正确地定义问题。」

灵魂×骨架,定义清楚一个问题,这个问题可能就解决了95%。

  • 灵魂:业务价值,端到端的闭环验证
  • 骨架:核心概念与API建模,数据结构、状态机、契约定义

SDD(Specification-Driven Development)不是回归文档,而是让规范成为可执行、可验证、可演化的"唯一真实来源"。

铁律三:工程治理优先于单点提效

「未来的工程竞争力将不再取决于谁的Prompt写得更好,而是取决于谁的Harness设计得更精密、更可靠、更具可演化性。」

真正的提效需要:

  1. 全链路打通:从需求到部署形成闭环,而不是只在编码环节提效

  2. 质量门禁程序化:一切不可被机器验证的约束,在Agent执行中都是无效约束

  3. 流程一致性优先于流程效率:好的流程不应该给简单任务增加显著负担,但必须保证复杂任务的可控性



结语:致同行人

本篇复盘,是用真实的业务数据换来的真相。

当然,每家企业的业务形态、历史债务、组织惯性不尽相同。在AI时代的剧烈变革下,迷茫是常态,坦诚面对是同行的起点。

如果你也在思考

  • 如何设计"价值率"而非"生码率"的度量体系?
  • 如何在规模化组织中推动研发范式与协作范式的共同演进?
  • 如何让AI编程在严肃软件中真正可用、可信、可控?
  • 如何培养团队"定义问题"的品味,而非仅停留在"写代码"的技能?

那么,5月22-23日,欢迎来AiDD 2026上海站峰会现场

当生产力范式发生根本性迁移时,唯一不变的,是对业务价值的敬畏,和对工程本质的坚守。

2026,产研提效的竞赛,才刚刚进入深水区。

你,准备好了吗

本文观点基于阿里云CIO团队实战复盘、腾讯云开发者社区技术实践、中国信通院产业研究及行业头部企业调研,数据截至2026年5月。




下一站



欢迎来 AiDD ,一起成为这场范式重构的参与者与制定者,一起定义 AI 时代的技术领导力



上述三个认知跃迁,不是孤立的理论推演,而是正在被行业头部实践系统性验证的思考。

这恰好与2026年5月22-23日在上海举办的AiDD峰会的演讲主题相合


21-260520104251F1.jpg

返回列表