从 Copilot 到 Agentic：快手重构人 AI 流程研发铁三角实践

一年前，行业热衷于追问'从 Copilot 到 Coding Agent，我们离 AI 自主开发还有多远'；一年后，快手用万人研发组织的真实实践，给出了一个冷静而有力的回答：组织级提效的胜负手，从来不在 AI 是否'自主'，而在人、AI、流程三者能否完成范式级重构。

当 AI 代码生成率突破 40%，需求交付周期却纹丝不动——这一反直觉现象戳破了'工具幻觉'的泡沫。快手的破局之道，并非等待 Agent 进化到完全自主，而是主动将 AI 从'嵌入流程的工具'升维为'重写流程的要素'，通过 L1-L3 分级交付体系与端到端效能度量，让个人提效真正传导至组织效能。53% 的需求交付周期压缩、38% 的人均交付需求增长，这些来自生产环境的数据，为行业提供了一份稀缺的规模化落地参照。

这不仅是一次技术演进，更是一场组织能力的'压力测试'：AI 不会自动修复流程断点，它只会将隐性问题放大。真正的智能化转型，始于承认'人仍是流程的锚点'，终于实现'人×AI×流程'的乘数效应。

总览快手研发效能演进路线

在快手，我们发现仅推广研发各阶段的 AI 提效工具，已经偏离了企业研发效能提升的核心目标，最终必然会导致两个问题：

投入很大，但企业整体的研发效率提升不明显：虽然通过调研很容易能收到大量的个人效率提升反馈，但个人提效无法传导到组织提效。
效能平台开始割裂：传统 DevOps 平台仍承担研发主流程，每天被高频的使用，却无法演进到下一代 AI 研发平台（顶多扩展一些单点的 AI 功能）。新生的 AI 编程工具，只取代了传统 IDE，又无法与老平台协同演进。

为了解决上述问题，我们从 2025 年开始进行了更激进的探索和变革，称之为'AI 研发范式升级'。正逢 2025 年年末，我们将时间回溯到 3 年前，对快手研发效能的演进做一个系统性总结，有踩过的坑，也有做出的突破。

AI 研发提效陷阱：用 AI 开发工具 ≠ 个人提效 ≠ 组织提效

早在 2024 年，快手就建设了 AI 编程工具 Kwaipilot，并发布给公司内 10000+ 研发人员使用。经过持续的深度优化和推广，快手整体的 AI 代码生成率，在严格度量口径下（AI 生成并入库的代码行/新增代码行）从 1% 达到了 30%+，甚至部分业务线达到了 40%+。同时，在非编码环节，也衍生出了很多 AI 提效工具，比如智能 CR、智能测试用例生成、智能单元测试等等。

但经过大量的调研和数据分析，我们发现了一个不等式：

'用 AI 开发工具 ≠ 个人提效 ≠ 组织提效'

如果以企业的研发效能提升为目标，我们发现：

对研发工程师而言：深度使用 AI 开发工具，代码生成率很高，个人主观体感上编码效率提升了 20-40%，但并不代表真正的'个人提效'，因为在现实中，大部分工程师并没有接纳更多的需求，个人需求的交付数没有显著提升。
对大型组织而言：我们发现部分 AI 用的好的工程师，确实可以更快更多的完成开发任务，但组织整体的需求吞吐量没有明显提升，需求交付周期也没有明显缩短。

从《2025 年 DORA 报告：人工智能辅助软件开发现状调查报告》中能看到，这也是业界普遍存在的问题。在对 AI 提效的结果的预估上，各企业普遍对个人效能的提升有信心，而对团队效能的提升预估非常小。

快手有 10000+ 研发、8+ 业务线，研发效能的演进可以分为 3 个大阶段：

阶段 1：平台化、数字化、精益化（2023-2024 年）：通过建设三端一站式研发平台、需求流&工程流标准化，解决了研发交付流程散乱，既无标准也无数据的问题。再通过建立效能模型，识别交付瓶颈，提升需求交付效率。
阶段 2：智能化 1.0（2024 年 6 月 -2025 年 6 月）：在研发全流程中开始建设 AI 能力，包括 AI 编码、AI 单元测试、AI CR、AI 手工用例生成、AI OnCall 等等，并进行全员推广。经过 1 年多的实践，基本上完成了全员普及，在主观调研中，开发人员主观体感上效率提升 20-40%，在客观数据上，AI 代码生成率也在持续增长。但同时也发现了矛盾点：需求交付效率基本不变，即个人效率提升未能有效传导到组织效率提升。
阶段 3：智能化 2.0（2025 年 7 月+）：从'推广 AI 工具，让开发者使用'回归到了更本质的元问题：如何用 AI 提升需求端到端交付效率？经过半年多的探索，终于找到了新的路径，并得到了充分的数据验证。我们称这套解决方案为'AI 研发范式'，主要解决了 3 个问题：
- AI x 效能实践：如何用 AI 提升工程师的生产力，并将个人提效传导到组织提效。
- AI x 研发平台：支撑需求交付全流程（从分析到编码再到发布）的研发工具链，如何整体演进到智能化？即下一代的智能研发平台，应该是什么样的？而不仅仅是只推广 AI 编程工具或在原有工具链上增加一些散点的 AI 提效功能。