面壁智能 ChatDev：AI 智能体协作开发平台技术解析

随着 OpenAI 发布自定义 GPT 等功能，低代码与 AI 辅助开发的门槛正在显著降低。国内大模型初创公司面壁智能近期推出的 ChatDev 产品，进一步重新定义了软件开发流程——通过让 AI 智能体协作来完成从需求到交付的全过程。

核心能力与演示案例

ChatDev 宣称仅需一句话描述需求，最快可在 3 分钟内完成软件原型开发，成本控制在极低水平。以开发一个'红包雨'点击小游戏为例，用户只需输入自然语言需求：

'红包雨'是一个点击小游戏，红包的外观是红色高瘦的圆角矩形，红包缓慢地从上方掉落，每个红包间距相等，没有重叠，鼠标点击任意一个红包，红包便随着互动点击而消失，同时显示一个吉利的数字，表示抢到这个红包得到了多少钱。

系统即可自动生成相应的交互逻辑与界面效果。在常规软件开发中，此类功能通常需要产品经理、设计师、程序员及测试人员协同工作 2-3 周，成本高达数千至上万美元。ChatDev 的出现实现了显著的降本增效。

AI 智能体协作开发流程演示

智能体协作架构详解

ChatDev 的核心在于其背后的智能体协作框架。在开发全流程中，包括产品经理、程序员、设计师和测试等角色均由 AI 智能体扮演。用户仅负责提出需求，其余环节由智能体自动讨论、交流甚至辩论，最终确定方案并执行。

1. ChatChain 交流链机制

ChatDev 采用了一套由群体智能串联起的 ChatChain（交流链）机制。这可以被视为由原子任务组成的'软件生产线'。通过专业角色的智能体进行对话式信息交互和决策，驱动其进行自动化全流程软件工程。

具体工作流程如下：

CTO（首席技术官）角色：接收客户需求，进行初步评估并拆解任务。例如，将'红包雨'需求拆解为 UI 设计、逻辑控制、交互反馈等子任务。
程序员角色：根据任务拆解，编写具体的代码实现。在 Python 环境下，智能体会生成包含游戏循环、事件监听及渲染逻辑的代码片段。
AI Counselor（顾问角色）：对生成的项目进行总结，检查逻辑完整性，并提供优化建议或结果说明。

这种分工模拟了传统软件工程的瀑布模型思想，将软件开发分为软件设计、系统开发、集成测试、文档编制四个主要环节，但全部由 AI 智能体自主完成。

ChatDev 内部智能体协作截图

2. 基座模型支撑：CPM-Cricket

应用的创新离不开基础模型能力的提升。面壁智能推出了 SaaS 版 ChatDev，并同步迭代了其自研的新一代千亿参数大模型——CPMCricket（Chinese Pretrained Model）。这是面壁智能的第三代模型，前两代分别为 CPM-Ant 和 CPM-Bee。

CPM-Cricket 在逻辑推理、代码生成、知识理解及指令遵循等方面有大幅提升。在经典的 LLM 评测集中，如 HumanEval（代码能力）、C-Eval（中文知识）、MMLU（多任务理解）、MBPP（编程基准）、CMMLU（中文数学与科学）、BBH（复杂推理）等，该模型均表现优异，全面超越 Llama 2 等开源基座模型。

此外，面壁智能在微调策略上也采用了先进方法：

课程学习（Curriculum Learning, CL）：模仿人类由易到难的学习过程，先在预训练中让模型学习底层推理规律，然后在对齐阶段学习人类的逐步推理思维。
思维链（Chain-of-thought, CoT）：对推理过程进行分解，使模型的推理路径更加清晰且具有可解释性。

这些技术确保了智能体在处理复杂开发任务时，能够保持较高的准确率和逻辑连贯性。

CPM-Cricket 模型评测数据展示

面壁智能 ChatDev：AI 智能体协作开发平台技术解析