AI 研发提效陷阱:用 AI 开发工具 ≠ 个人提效 ≠ 组织提效
早在 2024 年,快手就建设了 AI 编程工具 Kwaipilot,并发布给公司内 10000+ 研发人员使用。经过持续的深度优化和推广,快手整体的 AI 代码生成率,在严格度量口径下(AI 生成并入库的代码行/新增代码行)从 1% 达到了 30%+,甚至部分业务线达到了 40%+。同时,在非编码环节,也衍生出了很多 AI 提效工具,比如智能 CR、智能测试用例生成、智能单元测试等等,但经过大量的调研和数据分析,我们发现了这个不等式:
'用 AI 开发工具 ≠ 个人提效 ≠ 组织提效'
如果以企业的研发效能提升为目标,我们发现:
● **对研发工程师而言:**深度使用 AI 开发工具,代码生成率很高,个人主观体感上编码效率提升了 20-40%,但并不代表真正的'个人提效',因为在现实中,大部分工程师并没有接纳更多的需求,个人需求的交付数没有显著提升。
● **对大型组织而言:**我们发现部分 AI 用的好的工程师,确实可以更快更多的完成开发任务,但组织整体的需求吞吐量没有明显提升,需求交付周期也没有明显缩短。
从《2025 年 DORA 报告:人工智能辅助软件开发现状调查报告》中能看到,这也是业界普遍存在的问题。如报告中所述,在对 AI 提效的结果的预估上,各企业普遍对个人效能的提升有信心,而对团队效能的提升预估非常小。
快手有 10000+ 研发、8+ 业务线,研发效能的演进可以分为 3 个大阶段:
● 阶段 1:平台化、数字化、精益化(2023-2024 年):通过建设三端一站式研发平台、需求流&工程流标准化,解决了研发交付流程散乱,既无标准也无数据的问题。再通过建立效能模型,识别交付瓶颈,提升需求交付效率。
● 阶段 2:智能化 1.0(2024 年 6 月 -2025 年 6 月):在研发全流程中开始建设 AI 能力,包括 AI 编码、AI 单元测试、AI CR、AI 手工用例生成、AI OnCall 等等,并进行全员推广。经过 1 年多的实践,基本上完成了全员普及,在主观调研中,开发人员主观体感上效率提升 20-40%,在客观数据上,AI 代码生成率也在持续增长。但同时也发现了矛盾点:需求交付效率基本不变,即个人效率提升未能有效传导到组织效率提升。
● 阶段 3:智能化 2.0(2025 年 7 月+):从'推广 AI 工具,让开发者使用'回归到了更本质的元问题:如何用 AI 提升需求端到端交付效率?经过半年多的探索,终于找到了新的路径,并得到了充分的数据验证。我们称这套解决方案为'AI 研发范式',主要解决了 3 个问题:
○ **AI x 效能实践:**如何用 AI 提升工程师的生产力,并将个人提效传导到组织提效。
○ **AI x 研发平台:**支撑需求交付全流程(从分析到编码再到发布)的研发工具链,如何整体演进到智能化?即下一代的智能研发平台,应该是什么样的?而不仅仅是只推广 AI 编程工具或在原有工具链上增加一些散点的 AI 提效功能。
○ **AI x 效能度量:**如何在效能度量指标的基础上,构建 AI 提效的指标体系,能清晰的量化过程和结果,为组织级的 AI 研发范式升级提供有效指引。
阶段 1:平台化、数字化、精益化(2023-2024 年)
这个阶段的解决方案,业界相关的分享已经非常多了,但从实际情况看,在千人规模的技术团队中,能做好、做深、做透的实践非常稀有。
因此,我们直接分享 1 个具体的案例,以便能更好的看清快手的研发效能从基础建设到效能提升的全过程,这也是我们之所以能更快跃迁到 AI 研发范式的重要基石。案例来源是快手最核心的技术团队之一——主站技术部,是快手 APP 的研发团队,开发人员规模千人以上。
背景:了解快手的研发效能基建
首先,主站技术部的实践依托一套公司级的研发效能基建,由横向团队「研发效能中心」提供,这是在 2023 年快手当时的研效基建,主要分为:
● **效能平台:**项目管理平台(Team)、三端一站式研发平台(KDev(服务端)、KFC(前端)、Keep(客户端))、琅琊阁(效能度量)、质量平台(KTest 等)
● **效能实施:**效能 BP 专家(Business Partner),负责深入各业务线,提供专业支持。
了解快手的研效基建后,下面开始重点介绍主站技术部的实践过程。
Step1:依托工具推广,实现流程标准化
解决的问题
需求流和工程流均不标准,开发人员的工作分散在各处,日常开发体验差、学习成本高,又无法实施有效的质量防护措施,还不能沉淀准确的研发过程数据持续度量与改进。
达成的效果
通过推广三端一站式研发平台,定义需求、研发的标准流程,将研发全流程标准化。核心度量指标与结果如下:
人均交付产品需求数同比增长超过 80%。


