总览研发效能演进路线
在快手,我们发现仅推广研发各阶段的 AI 提效工具,已经偏离了企业研发效能提升的核心目标,最终必然会导致两个问题:
- 投入很大,但企业整体的研发效率提升不明显:虽然通过调研很容易能收到大量的个人效率提升反馈,但个人提效无法传导到组织提效。
- 效能平台开始割裂:传统 DevOps 平台仍承担研发主流程,每天被高频的使用,却无法演进到下一代 AI 研发平台(顶多扩展一些单点的 AI 功能)。新生的 AI 编程工具,只取代了传统 IDE,又无法与老平台协同演进。
为了解决上述问题,我们从 2025 年开始进行了更激进的探索和变革,称之为'AI 研发范式升级',最终找到了一条能借助 AI 能力平滑通往研发智能化的路径。正逢 2025 年年末,我们将时间回溯到 3 年前,对快手研发效能的演进做一个系统性总结,有踩过的坑,也有做出的突破,希望为更多企业提供经验和参考。
AI 研发提效陷阱:用 AI 开发工具 ≠ 个人提效 ≠ 组织提效
早在 2024 年,我们就建设了 AI 编程工具 Kwaipilot,并发布给公司内 10000+ 研发人员使用。经过持续的深度优化和推广,整体 AI 代码生成率在严格度量口径下从 1% 达到了 30%+,甚至部分业务线达到了 40%+。同时,在非编码环节,也衍生出了很多 AI 提效工具,比如智能 CR、智能测试用例生成等。但经过大量的调研和数据分析,我们发现了一个不等式:
'用 AI 开发工具 ≠ 个人提效 ≠ 组织提效'
如果以企业的研发效能提升为目标,我们发现:
- 对研发工程师而言:深度使用 AI 开发工具,代码生成率很高,个人主观体感上编码效率提升了 20-40%,但并不代表真正的'个人提效',因为在现实中,大部分工程师并没有接纳更多的需求,个人需求的交付数没有显著提升。
- 对大型组织而言:我们发现部分 AI 用的好的工程师,确实可以更快更多的完成开发任务,但组织整体的需求吞吐量没有明显提升,需求交付周期也没有明显缩短。
从《2025 年 DORA 报告:人工智能辅助软件开发现状调查报告》中能看到,这也是业界普遍存在的问题。如报告中所述,在对 AI 提效的结果的预估上,各企业普遍对个人效能的提升有信心,而对团队效能的提升预估非常小。

快手有 10000+ 研发、8+ 业务线,研发效能的演进可以分为 3 个大阶段:
- 阶段 1:平台化、数字化、精益化(2023-2024 年):通过建设三端一站式研发平台、需求流&工程流标准化,解决了研发交付流程散乱,既无标准也无数据的问题。再通过建立效能模型,识别交付瓶颈,提升需求交付效率。
- 阶段 2:智能化 1.0(2024 年 6 月 -2025 年 6 月):在研发全流程中开始建设 AI 能力,包括 AI 编码、AI 单元测试、AI CR、AI 手工用例生成、AI OnCall 等等,并进行全员推广。经过 1 年多的实践,基本上完成了全员普及,在主观调研中,开发人员主观体感上效率提升 20-40%,在客观数据上,AI 代码生成率也在持续增长。但同时也发现了矛盾点:需求交付效率基本不变,即个人效率提升未能有效传导到组织效率提升。
- 阶段 3:智能化 2.0(2025 年 7 月 +):从'推广 AI 工具,让开发者使用'回归到了更本质的元问题:如何用 AI 提升需求端到端交付效率?经过半年多的探索,终于找到了新的路径,并得到了充分的数据验证。我们称这套解决方案为'AI 研发范式',主要解决了 3 个问题:
- AI x 效能实践:如何用 AI 提升工程师的生产力,并将个人提效传导到组织提效。
- AI x 研发平台:支撑需求交付全流程(从分析到编码再到发布)的研发工具链,如何整体演进到智能化?即下一代的智能研发平台,应该是什么样的?而不仅仅是只推广 AI 编程工具或在原有工具链上增加一些散点的 AI 提效功能。
- AI x 效能度量:如何在效能度量指标的基础上,构建 AI 提效的指标体系,能清晰的量化过程和结果,为组织级的 AI 研发范式升级提供有效指引。
阶段一:平台化、数字化与精益化(2023-2024 年)
这个阶段的解决方案,业界相关的分享已经非常多了,但从实际情况看,在千人规模的技术团队中,能做好、做深、做透的实践非常稀有。因此,我们直接分享 1 个具体的案例,以便能更好的看清快手的研发效能从基础建设到效能提升的全过程,这也是我们之所以能更快跃迁到 AI 研发范式的重要基石。案例来源是快手最核心的技术团队之一——主站技术部,是快手 APP 的研发团队,开发人员规模千人以上。
背景:了解快手的研发效能基建
首先,主站技术部的实践依托一套公司级的研发效能基建,由横向团队「研发效能中心」提供,这是在 2023 年快手当时的研效基建,主要分为:


