论文信息
- 原标题:Novice Developers Produce Larger Review Overhead for Project Maintainers while Vibe Coding
- 主要作者:Syed Ammar Asdaque、Imran Haider、Muhammad Umar Malik 等
- 研究机构:巴基斯坦拉合尔管理科学大学(Lahore University of Management Sciences)
- 发表会议:23rd International Conference on Mining Software Repositories (MSR '26)
- 发表时间:2026 年 4 月 13-14 日(巴西里约热内卢)

研究背景与核心问题
在 Software 3.0 时代,AI 编码工具被广泛使用,但现有研究对 AI 辅助编程的效果结论不一。项目管理者面临核心疑问:低经验的 AI 辅助编程者(Vibe Coder),能否替代资深开发者完成开发工作?本研究针对'AI 辅助编程中开发者经验的价值'展开实证分析。
概念界定:采用精准的 Vibe Coding 定义——人类开发者通过自然语言提示引导、监督 AI 代理,并验证其生成代码的工作流。
研究设计与数据来源
数据集
采用 AIDev 数据集(GitHub 开源项目的 AI 辅助 PR 合集),过滤掉机器人账户后,最终使用1719 名 Vibe 编码者的22953 个 PR,涵盖 Copilot、Claude Code 等主流 AI 编码工具的贡献。
经验划分方法
- 经验值计算:以 GitHub 总提交数/账户创建时长作为经验评分指标。
- 分组方式:将 1719 名开发者按经验评分分为四四分位,前两个四分位(859 人)为高经验组(Exp_High),后两个四分位(860 人)为低经验组(Exp_Low)。
核心分析指标
| 指标类型 | 具体指标 | 指标含义 |
|---|---|---|
| 贡献规模指标 | 单 PR 提交次数 | 每个 PR 的代码提交频次 |
| 贡献规模指标 | 单 PR 修改文件数 | 每个 PR 涉及的修改文件数量 |
| PR 合并难度指标 | PR 接受率 | 合并 PR 数/总提交 PR 数 |
| PR 合并难度指标 | PR 解决时间 | PR 创建到合并的耗时(天) |
| PR 合并难度指标 | PR 评审评论数 | 每个 PR 收到的评审反馈评论数 |
核心研究结果
研究通过曼 - 惠特尼 U 检验、卡方检验验证了两组开发者的指标差异均具有统计学显著性(p<0.05)。
-
RQ1:低经验组贡献规模显著更大
- Exp_Low 的单 PR 提交次数是 Exp_High 的2.15 倍,功能开发类 PR 差异最明显。
- Exp_Low 的单 PR 修改文件数是 Exp_High 的1.47 倍,样式类 PR 差异最明显。
-
RQ2:低经验组 PR 合并难度显著更高


