近期 Cursor 推送了 2.0 大版本升级,不仅更新了 UI 界面,还推出了首个自研商用闭源代码大模型 Composer1。
该模型的核心优势在于速度。官方数据显示其生成速度是同等智能体的 4 倍,通过覆盖整个代码库的语义搜索进行训练,在理解与处理大型代码库方面表现显著更强。此外,它专为低延迟代理式编码打造,大多数代码结果可在 30 秒内完成。
Cursor 研究科学家 Sasha Rush 介绍称,Composer 是一款经过强化学习(RL)训练的混合专家(MoE)模型,团队对模型与开发环境进行了协同设计,使其能在生产规模下高效运行。
本次 2.0 版本还升级了多代理功能。更新后,用户在选择模型时可以同时使用多个模型进行 Agent 编码,点击不同的模型代理即可查看不同生成结果,目前最大支持同时选择 8 个代理。
若需对比不同模型的效果,可以选中不同模型并调整右侧模型使用次数。例如选择 4x,则表示用同一个模型生成 4 次以便观察一致性。
生成速度对比
先进行速度测试,选取工程中的数据库设计及需要优化的逻辑进行同时生成。结果显示,Composer1 模型生成速度最快,从过程来看它很早就完成了全部生成,而其他模型仍在加载。综合对比,这几个模型的代码生成速度排序为:Composer1 > Claude Sonnet 4.5 > GPT-5 CodeX > Gemini 2.5 Pro。
这一轮 Composer1 胜出,生成速度明显优于其余模型。
生成效果对比
再看代码生成的质量。从四个模型的输出来看,GPT-5-CodeX 修改的代码量最少,但具体哪个模型质量最好仍需分析。
GPT-5 CodeX 模型
首先测试 GPT-5 CodeX。根据指令要求修改新增和编辑接口,该模型仅修改了新增部分,未处理编辑逻辑。相比之下,其他模型均完成了相应操作,说明其对复杂指令的识别能力稍逊一筹。
Gemini 2.5 Pro 模型
Gemini 2.5 Pro 生成的代码存在几个明显问题:未自动查找已有方法,且生成的代码包含空指针风险。虽然代码量最多,但质量有待商榷。
Claude Sonnet 4.5 模型
Claude Sonnet 4.5 的处理逻辑较为严谨。AI 先生成数据库删除操作,再进行数据校验;若校验异常则通过事务回滚 MySQL。
Cursor 自研的 Compose1 模型
Compose1 生成的代码与 Claude Sonnet 4.5 基本一致,主要区别在于删除和参数判断的顺序。
按常规编程逻辑,应先做逻辑判断再执行删除,因为通过异常回滚数据库会带来性能开销。不过,先删除也有其合理性:在极端并发场景下,如果两层 for 循环内的逻辑尚未处理完毕又有新线程进入,缺少 delete 操作可能导致组合重复。当然,这种情况极为罕见,通常逻辑判断在毫秒级内即可完成,正常开发中可忽略此类极端场景。
由此可见,Compose1 的代码风格更符合当前程序员的思维习惯,而 Claude Sonnet 4.5 在逻辑严谨性上考虑得更周全。两者在实际应用中可视为打平手。
质量对比总结
综合上述代码生成情况,最终质量排序为:Compose1 = Claude Sonnet 4.5 > Gemini 2.5 Pro > GPT-5 CodeX。
总结
经过一周的实际使用,Cursor 2.0 的 Composer1 模型在代码层面做了诸多优化。很多时候只需提供一小段代码,它便能自动读取整体设计逻辑并获取上下文,无需预先输入大量数据库设计及需求文档。这表明在代码生成领域,Claude Sonnet 4.5 和 GPT-5 CodeX 又将迎来强劲对手。
此外,Cursor 2.0 还带来了内置浏览器和语音模式两大新功能。内置浏览器允许用户直接在 IDE 内运行和测试代码,并将 DOM 信息反馈给模型,进一步提升了开发效率。


