Codex 现在运行更高效、性能更稳定,实时协作与独立任务处理能力显著提升,无论是在终端、IDE、网页,还是在手机上进行开发,均能随时使用。
2025 年 9 月 23 日更新:
GPT-5-Codex 现已向使用 API key 的 Codex 开发者开放(除了已通过 ChatGPT 订阅使用 Codex 的开发者)。GPT-5 Codex 的定价与 GPT-5 相同,并且仅在 Responses API 中提供。底层模型快照会定期更新。详见 Codex 开发者文档和更新日志。
今天发布 GPT-5-Codex —— 这是在 Codex 中针对自主式编程进一步优化的 GPT-5 版本。GPT-5-Codex 的训练重点是实际的软件工程工作;它既能快速应对短时互动,也能独立完成长期、复杂的任务。其代码审查能力能在上线前发现关键漏洞。无论在什么场景下使用 Codex,GPT-5-Codex 都可用——它是云端任务和代码审查的默认选择,开发者也可以通过 Codex CLI 和 IDE 插件将其用于本地任务。
自从我们在 4 月发布 Codex CLI,以及在 5 月发布 Codex 网页版以来,Codex 已逐步进化为更高效的编程伙伴。两周前,我们将 Codex 统一为一个基于 ChatGPT 账号的单一产品体验,让你能在本地环境和云端之间无缝切换工作,不会丢失上下文。Codex 已覆盖你的开发场景——无论是在终端或 IDE、网页、GitHub,甚至 ChatGPT iOS 应用中。Codex 包含在 Plus、Pro、Business、Edu 和 Enterprise 方案中。
Codex 接近目标——理解上下文、与你并肩工作、并能可靠分担团队任务的队友。
GPT‑5-Codex
GPT-5-Codex 是在 Codex 中针对自主式软件工程进一步优化的 GPT-5 版本。它的训练涵盖了复杂的实际工程任务,例如从零构建完整项目、添加功能和测试、调试、进行大规模重构以及代码审查。它更易于引导,能更好地遵循 AGENTS 的指令,输出更高质量的代码——你只需告诉它需求,而无需写冗长的风格或代码整洁度说明。
SWE-Bench 验证:在 GPT‑5 发布时及历史评估中,我们报告了 477 个 SWE-bench 验证任务的结果,因为有些任务无法在我们的基础设施中运行。已修复问题,现可报告全部 500 项任务的评估结果。

代码重构任务:我们的代码重构评估包含来自大型、成熟代码库的重构式任务,包括 Python、Go 甚至 OCaml 中的任务。一个示例任务是来自 Gitea 的以下拉取请求,它更改了 232 个文件和 3,541 行代码,以将 ctx 变量贯穿应用程序逻辑。

GPT-5-Codex 会根据任务复杂度动态调整思考时间。该模型结合了两项关键能力:一是与开发者在互动会话中协作,二是能够持久、独立地执行长期任务。也就是说,在小型、定义明确的请求或与用户对话时,Codex 响应会更快;而在处理复杂任务(如大规模重构)时,它会投入更长时间。在测试中,我们观察到 GPT-5-Codex 能连续自主工作 7 小时以上,期间不断改进实现、修复测试错误,最终交付完整的解决方案。
在 OpenAI 内部的员工使用数据中,我们看到在按模型生成 token 数量(包含隐藏推理和最终输出)排序的最低 10% 用户请求中,GPT-5-Codex 比 GPT-5 少用 93.7% 的 token。而在最高 10% 的请求中,GPT-5-Codex 会思考更多,花费两倍时间进行推理、编辑和测试代码,不断迭代。

GPT-5-Codex 专门训练用于代码审查,能发现关键漏洞。在审查时,它能在代码库中导航,推理依赖关系,并运行代码和测试来验证正确性。我们在热门开源库的最新提交上评估了其代码审查表现。每个提交的审查意见都由有经验的软件工程师评估其正确性和重要性。结果显示,GPT-5-Codex 的意见更少出现错误或无关内容,更能把用户注意力集中在关键问题上。



