从 Copilot 到 Agentic:重构人×AI×流程的研发范式实践
一年前,行业还在追问'从 Copilot 到 Coding Agent,我们离 AI 自主开发还有多远'。一年后,基于万人研发组织的真实实践,一个冷静而有力的结论浮现出来:组织级提效的胜负手,从来不在 AI 是否'自主',而在人、AI、流程三者能否完成范式级重构。
当 AI 代码生成率突破 40%,需求交付周期却纹丝不动——这一反直觉现象戳破了'工具幻觉'的泡沫。破局之道并非等待 Agent 进化到完全自主,而是主动将 AI 从'嵌入流程的工具'升维为'重写流程的要素',通过 L1-L3 分级交付体系与端到端效能度量,让个人提效真正传导至组织效能。53% 的需求交付周期压缩、38% 的人均交付需求增长,这些来自生产环境的数据,为行业提供了一份稀缺的规模化落地参照。
研发效能演进路线总览
在大型组织中,仅推广各阶段的 AI 提效工具往往偏离核心目标,最终导致两个问题:
- 投入大但整体效率提升不明显:个人体感效率提升了,但无法传导到组织提效。
- 效能平台割裂:传统 DevOps 平台承担主流程却无法演进,新生的 AI 编程工具只取代 IDE 却无法协同。
为了解决这些问题,我们将研发效能演进分为三个阶段:
- 阶段 1(2023-2024):平台化、数字化、精益化。解决流程散乱、无标准、无数据的问题,建立效能模型识别瓶颈。
- 阶段 2(2024.6-2025.6):智能化 1.0。全流程建设 AI 能力并全员推广。主观效率提升明显,但客观上需求交付周期未缩短。
- 阶段 3(2025.7+):智能化 2.0。回归元问题:如何用 AI 提升需求端到端交付效率?提出'AI 研发范式',解决 AI x 效能实践、平台、度量三大问题。
阶段一:夯实基础,标准化先行
没有标准化的流程,AI 只是加速了混乱。我们以核心业务线为例,展示了从基建到提效的全过程。
依托工具推广,实现流程标准化
早期痛点是需求流和工程流不标准,开发人员工作分散,质量防护缺失。我们通过三端一站式研发平台,定义了标准流程。
实施难点在于兼容多样化的场景。服务端、客户端、前端的技术栈和习惯差异巨大,强行整合反而牺牲灵活性。因此我们采取'底层能力统一,上层应用分治'的策略:底层共享流水线、权限等能力,上层保留三套平台分别适配各自领域。
以用户满意为导向是关键。我们提供了完整的迁移配套服务,包括产品质量专项(日结 BUG)、用户体验专项(持续访谈优化),以及培训激励。短短 5 周内交付了 73 个功能与体验需求,大幅降低了迁移成本。
建设效能度量体系
有了标准流程,数据置信度才大幅提升。我们摒弃了单一指标,建立了多维度的指标体系:
- 北极星指标:人均交付产品需求数。
- 辅助指标:需求颗粒度(避免为了数量牺牲质量)、缺陷占比等。
这套体系不仅避免了依赖单一指标的偏差,还有效防范了数据被'刷'的风险,确保了效能数据的准确性。
效能问题分析与改进
依托数据,我们可以对业务线做系统性体检。例如,通过分析「研发活动在线化率」,我们发现某团队虽然在线化率高,但产品需求投入占比低,且缺陷占比高。下钻后发现是架构劣化导致新需求上手门槛高、耦合度高。解法是实施客户端架构升级和体验优化专项,随后该团队的产品需求投入占比提升至 64%。
经过一年系统化提效,人均交付产品需求数同比增长超过 80%。主要措施包括升级研发模式、降低协作成本、以及通过效能洞察持续识别瓶颈。
阶段二:智能化 1.0,AI 编码工具的普及与瓶颈
2024 年,我们开始探索大模型在研效领域的应用,核心决策是自研 AI Coding 工具 Kwaipilot。尽管业界有 Cursor 等优秀产品,但我们通过内部 AB 实验发现,自研更能贴合业务场景。
推广与实践
推广过程分为导入、优化、固化三个阶段:
- 导入期:鼓励默认使用 AI 工具,转变意识。出现了两极分化,部分同学深度使用,部分仍沿用旧法。
- 优化期:找到'AI 开发高手',提炼最佳实践。我们发现通用工具不懂业务和系统知识,只能做到函数级生成。要让 AI 成为'熟悉业务的工程师',必须升级工具并沉淀方法。


