AI 辅助编程的边界探索：当 Copilot 学会写测试 | 极客日志

TypeScriptAI大前端

AI 辅助编程的边界探索：当 Copilot 学会写测试

综述由AI生成探讨了 AI 辅助编程工具（如 Copilot）在编写测试用例时的能力边界。通过 TypeScript 和 Jest 的实验，发现 AI 擅长生成 Happy Path 和基础 Mock 代码，但在理解业务意图、处理边界条件和复杂集成测试时存在幻觉和局限。文章指出 AI 目前应定位为高级助理，人类需负责深层逻辑校验，并提出通过明确 Prompt 和角色设定来提升 AI 写测试的效率。结论是 AI 降低了测试门槛，但测试质量仍取决于人类对业务的理解。

邪神洛基发布于 2026/4/6更新于 2026/5/2127 浏览

在这里插入图片描述

在过去的几年里，我们见证了人工智能辅助编程工具（如 GitHub Copilot、Cursor 等）从简单的代码补全插件，进化成为能够独立思考、生成复杂逻辑的'数字伙伴'。大多数开发者的使用场景停留在'帮我写个排序算法'或者'帮我补全这个 React 组件的样式'。然而，当 AI 开始染指软件工程中最繁琐、最需要逻辑严密性的领域——测试（Testing） 时，一切都变得有趣且充满挑战。

今天，我们就来深入探讨一下：当 Copilot 学会了写测试，它的边界在哪里？它能否取代人工编写测试用例的工作？它又会在哪里'翻车'？让我们通过一系列真实的代码实验来寻找答案。

1. 从'写代码'到'验代码'：AI 的新战场

传统的编程教学往往强调如何实现功能（Implementation），而软件工程的核心却有一半是维护。维护的核心不是加功能，而是保证加功能不破坏旧功能。这就使得测试变得至关重要。

对于 AI 来说，写一段计算斐波那契数列的代码是简单的，因为逻辑是收敛的。但是，写一段针对斐波那契数列的测试用例则是发散的：你要考虑输入 0、输入负数、输入超大数、溢出处理等等。AI 写测试的核心难点在于：它不知道产品的'意图'（Intent），它只能根据上下文进行'模仿'。

下面，我们构建一个典型的业务场景，来测试 Copilot 的能力边界。我们将使用 TypeScript 和 Jest 作为实验环境。

场景设定：一个简单的支付网关模拟器

我们需要一个看似简单但包含逻辑分支的函数。

// paymentService.ts
interface PaymentRequest {
  userId: string;
  amount: number;
  currency: 'USD' | 'CNY' | 'EUR';
}

interface PaymentResult {
  success: boolean;
  transactionId?: string;
  error?: string;
}

export const processPayment = (req: PaymentRequest): PaymentResult => {
  // 业务逻辑：金额必须大于 0
  if (req. <= ) {
     { : , :  };
  }
  
   (req..()) {
     { : , :  };
  }
  
   txId = ;
   { : , : txId };
};

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

// paymentService.test.ts
import { processPayment } from './paymentService';

describe('processPayment', () => {
  // 测试正常的正向流程
  it('should return success for valid payment', () => {
    const request = {
      userId: 'user_123',
      amount: 100,
      currency: 'USD',
    };
    const result = processPayment(request);
    expect(result.success).toBe(true);
    expect(result.transactionId).toBeDefined();
  });
  // 测试金额为 0 的情况
  it('should fail when amount is zero', () => {
    const request = {
      userId: 'user_123',
      amount: 0,
      currency: 'USD',
    };
    const result = processPayment(request);
    expect(result.success).toBe(false);
    expect(result.error).toBe('Invalid amount');
  });
});

// database.ts (模拟数据库)
export const saveTransaction = async (data: any) => {
  // 这里连接了真实的数据库
  return { id: 'db_123', ...data };
};

// orderService.ts
import { saveTransaction } from './database';

export const createOrder = async (items: string[], userId: string) => {
  if (!items.length) throw new Error('Cart is empty');
  const order = { items, userId, createdAt: new Date() };
  const saved = await saveTransaction(order);
  return saved;
};

// orderService.test.ts
import { createOrder } from './orderService';
import { saveTransaction } from './database';

// 关键步骤：Mocking
jest.mock('./database', () => ({
  saveTransaction: jest.fn(),
}));

describe('createOrder', () => {
  it('should save order to database', async () => {
    // Arrange
    const mockSave = saveTransaction as jest.Mock;
    mockSave.mockResolvedValue({ id: 'mock_id' });
    // Act
    const result = await createOrder(['item1'], 'user_1');
    // Assert
    expect(mockSave).toHaveBeenCalled();
    expect(result.id).toBe('mock_id');
  });
  it('should throw error if cart is empty', async () => {
    await expect(createOrder([], 'user_1')).rejects.toThrow('Cart is empty');
  });
});

// weirdLogic.ts
export const getStatus = (code: number) => {
  if (code > 100) return 'OK';
  return 'ERROR';
};

it('should return OK for code > 100', () => {
  expect(getStatus(101)).toBe('OK');
});

it('should contain only unique elements', () => {
  // 假设这里返回了 [1, 2, 3, 3]
  const result = getData();
  const unique = new Set(result);
  // AI 的幻觉：它假设 Set 后长度等于原始长度
  expect(unique.size).toBe(result.length);
});

graph TD
    A[AI: 自动生成基础测试桩] --> B{人工校验}
    B -- 通过 --> C[上线]
    B -- 不通过 --> D[修正逻辑]
    D --> B

AI 辅助编程的边界探索：当 Copilot 学会写测试

1. 从'写代码'到'验代码'：AI 的新战场

场景设定：一个简单的支付网关模拟器

更多推荐文章

相关免费在线工具

2. 初级实验：AI 能写出'Happy Path'吗？

3. 进阶实验：Mocking 与外部依赖

4. 陷阱与幻觉：AI 写测试时犯的那些错

案例 A：永远不会错的测试

案例 B：永远跑不通的断言

案例 C：复杂集成测试的无力

5. 人机协作：重新定义测试工作流

实践技巧：如何高效地让 AI 写测试？

6. 展望未来：AI 会取代测试工程师吗？

更多推荐文章

相关免费在线工具

AI 辅助编程的边界探索：当 Copilot 学会写测试

1. 从'写代码'到'验代码'：AI 的新战场

场景设定：一个简单的支付网关模拟器

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 初级实验：AI 能写出'Happy Path'吗？

3. 进阶实验：Mocking 与 外部依赖

4. 陷阱与幻觉：AI 写测试时犯的那些错

案例 A：永远不会错的测试

案例 B：永远跑不通的断言

案例 C：复杂集成测试的无力

5. 人机协作：重新定义测试工作流

实践技巧：如何高效地让 AI 写测试？

6. 展望未来：AI 会取代测试工程师吗？

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 进阶实验：Mocking 与外部依赖