从 Copilot 到 Agentic：重构人×AI×流程的研发范式实践

一年前，行业还在追问'从 Copilot 到 Coding Agent，我们离 AI 自主开发还有多远'。一年后，基于万人研发组织的真实实践，一个冷静而有力的结论浮现出来：组织级提效的胜负手，从来不在 AI 是否'自主'，而在人、AI、流程三者能否完成范式级重构。

当 AI 代码生成率突破 40%，需求交付周期却纹丝不动——这一反直觉现象戳破了'工具幻觉'的泡沫。破局之道并非等待 Agent 进化到完全自主，而是主动将 AI 从'嵌入流程的工具'升维为'重写流程的要素'，通过 L1-L3 分级交付体系与端到端效能度量，让个人提效真正传导至组织效能。53% 的需求交付周期压缩、38% 的人均交付需求增长，这些来自生产环境的数据，为行业提供了一份稀缺的规模化落地参照。

研发效能演进路线总览

在大型组织中，仅推广各阶段的 AI 提效工具往往偏离核心目标，最终导致两个问题：

投入大但整体效率提升不明显：个人体感效率提升了，但无法传导到组织提效。
效能平台割裂：传统 DevOps 平台承担主流程却无法演进，新生的 AI 编程工具只取代 IDE 却无法协同。

为了解决这些问题，我们将研发效能演进分为三个阶段：

阶段 1（2023-2024）：平台化、数字化、精益化。解决流程散乱、无标准、无数据的问题，建立效能模型识别瓶颈。
阶段 2（2024.6-2025.6）：智能化 1.0。全流程建设 AI 能力并全员推广。主观效率提升明显，但客观上需求交付周期未缩短。
阶段 3（2025.7+）：智能化 2.0。回归元问题：如何用 AI 提升需求端到端交付效率？提出'AI 研发范式'，解决 AI x 效能实践、平台、度量三大问题。

阶段一：夯实基础，标准化先行

没有标准化的流程，AI 只是加速了混乱。我们以核心业务线为例，展示了从基建到提效的全过程。

依托工具推广，实现流程标准化

早期痛点是需求流和工程流不标准，开发人员工作分散，质量防护缺失。我们通过三端一站式研发平台，定义了标准流程。

实施难点在于兼容多样化的场景。服务端、客户端、前端的技术栈和习惯差异巨大，强行整合反而牺牲灵活性。因此我们采取'底层能力统一，上层应用分治'的策略：底层共享流水线、权限等能力，上层保留三套平台分别适配各自领域。

以用户满意为导向是关键。我们提供了完整的迁移配套服务，包括产品质量专项（日结 BUG）、用户体验专项（持续访谈优化），以及培训激励。短短 5 周内交付了 73 个功能与体验需求，大幅降低了迁移成本。

建设效能度量体系

有了标准流程，数据置信度才大幅提升。我们摒弃了单一指标，建立了多维度的指标体系：

北极星指标：人均交付产品需求数。
辅助指标：需求颗粒度（避免为了数量牺牲质量）、缺陷占比等。

这套体系不仅避免了依赖单一指标的偏差，还有效防范了数据被'刷'的风险，确保了效能数据的准确性。

效能问题分析与改进

依托数据，我们可以对业务线做系统性体检。例如，通过分析「研发活动在线化率」，我们发现某团队虽然在线化率高，但产品需求投入占比低，且缺陷占比高。下钻后发现是架构劣化导致新需求上手门槛高、耦合度高。解法是实施客户端架构升级和体验优化专项，随后该团队的产品需求投入占比提升至 64%。

经过一年系统化提效，人均交付产品需求数同比增长超过 80%。主要措施包括升级研发模式、降低协作成本、以及通过效能洞察持续识别瓶颈。

阶段二：智能化 1.0，AI 编码工具的普及与瓶颈

2024 年，我们开始探索大模型在研效领域的应用，核心决策是自研 AI Coding 工具 Kwaipilot。尽管业界有 Cursor 等优秀产品，但我们通过内部 AB 实验发现，自研更能贴合业务场景。

推广与实践

推广过程分为导入、优化、固化三个阶段：

导入期：鼓励默认使用 AI 工具，转变意识。出现了两极分化，部分同学深度使用，部分仍沿用旧法。
优化期：找到'AI 开发高手'，提炼最佳实践。我们发现通用工具不懂业务和系统知识，只能做到函数级生成。要让 AI 成为'熟悉业务的工程师'，必须升级工具并沉淀方法。

从 Copilot 到 Agentic：重构人×AI×流程的研发范式实践