Cursor 2.0 发布：自研 Composer 模型上线及多 Agent 实测

Cursor 2.0 推出自研 Composer 模型，基于强化学习训练，支持多 Agent 协同。实测显示其生成速度优于主流模型，代码质量与 Claude Sonnet 4.5 相当。新特性包含内置浏览器和语音模式，适合处理复杂逻辑与大型代码库。

月光旅人发布于 2026/2/23更新于 2026/7/2030 浏览

近期 Cursor 推送了 2.0 大版本升级，不仅更新了 UI 界面，还推出了首个自研商用闭源代码大模型 Composer1。

该模型的核心优势在于速度。官方数据显示其生成速度是同等智能体的 4 倍，通过覆盖整个代码库的语义搜索进行训练，在理解与处理大型代码库方面表现显著更强。此外，它专为低延迟代理式编码打造，大多数代码结果可在 30 秒内完成。

Cursor 研究科学家 Sasha Rush 介绍称，Composer 是一款经过强化学习（RL）训练的混合专家（MoE）模型，团队对模型与开发环境进行了协同设计，使其能在生产规模下高效运行。

本次 2.0 版本还升级了多代理功能。更新后，用户在选择模型时可以同时使用多个模型进行 Agent 编码，点击不同的模型代理即可查看不同生成结果，目前最大支持同时选择 8 个代理。

若需对比不同模型的效果，可以选中不同模型并调整右侧模型使用次数。例如选择 4x，则表示用同一个模型生成 4 次以便观察一致性。

生成速度对比

先进行速度测试，选取工程中的数据库设计及需要优化的逻辑进行同时生成。结果显示，Composer1 模型生成速度最快，从过程来看它很早就完成了全部生成，而其他模型仍在加载。综合对比，这几个模型的代码生成速度排序为：Composer1 > Claude Sonnet 4.5 > GPT-5 CodeX > Gemini 2.5 Pro。

这一轮 Composer1 胜出，生成速度明显优于其余模型。

生成效果对比

再看代码生成的质量。从四个模型的输出来看，GPT-5-CodeX 修改的代码量最少，但具体哪个模型质量最好仍需分析。

GPT-5 CodeX 模型

首先测试 GPT-5 CodeX。根据指令要求修改新增和编辑接口，该模型仅修改了新增部分，未处理编辑逻辑。相比之下，其他模型均完成了相应操作，说明其对复杂指令的识别能力稍逊一筹。

Gemini 2.5 Pro 模型

Gemini 2.5 Pro 生成的代码存在几个明显问题：未自动查找已有方法，且生成的代码包含空指针风险。虽然代码量最多，但质量有待商榷。

Claude Sonnet 4.5 模型

Claude Sonnet 4.5 的处理逻辑较为严谨。AI 先生成数据库删除操作，再进行数据校验；若校验异常则通过事务回滚 MySQL。

Cursor 自研的 Compose1 模型

Compose1 生成的代码与 Claude Sonnet 4.5 基本一致，主要区别在于删除和参数判断的顺序。

按常规编程逻辑，应先做逻辑判断再执行删除，因为通过异常回滚数据库会带来性能开销。不过，先删除也有其合理性：在极端并发场景下，如果两层 for 循环内的逻辑尚未处理完毕又有新线程进入，缺少 delete 操作可能导致组合重复。当然，这种情况极为罕见，通常逻辑判断在毫秒级内即可完成，正常开发中可忽略此类极端场景。

由此可见，Compose1 的代码风格更符合当前程序员的思维习惯，而 Claude Sonnet 4.5 在逻辑严谨性上考虑得更周全。两者在实际应用中可视为打平手。

质量对比总结

综合上述代码生成情况，最终质量排序为：Compose1 = Claude Sonnet 4.5 > Gemini 2.5 Pro > GPT-5 CodeX。

总结

经过一周的实际使用，Cursor 2.0 的 Composer1 模型在代码层面做了诸多优化。很多时候只需提供一小段代码，它便能自动读取整体设计逻辑并获取上下文，无需预先输入大量数据库设计及需求文档。这表明在代码生成领域，Claude Sonnet 4.5 和 GPT-5 CodeX 又将迎来强劲对手。

此外，Cursor 2.0 还带来了内置浏览器和语音模式两大新功能。内置浏览器允许用户直接在 IDE 内运行和测试代码，并将 DOM 信息反馈给模型，进一步提升了开发效率。