开篇:为什么我们需要一个'大模型统一网关'?
在 2025-2026 年的 AI 浪潮中,开发者们面临的最大痛点不再是'有没有好模型',而是'怎么高效、低成本、安全地用好几十个模型'。
OpenAI 的 GPT-5 系列推理能力顶尖,但价格高昂且有速率限制;Anthropic 的 Claude 3.7 Sonnet 在长上下文和思考模式上无敌,却接口完全不同;Google Gemini 2.5 系列多模态强悍,价格亲民,但 API 格式又是另一套;国内的通义千问、DeepSeek、豆包、文心一言、混元……每个平台都有自己的 Base URL、鉴权方式、计费规则、限流策略。更别提 Midjourney 绘画、Suno 音乐生成、Rerank 重排序、Realtime 实时语音对话这些非标准接口。
手动为每个应用适配?维护几十份配置文件?每次新模型出来就要改代码?企业内部多用户、多部门、多预算怎么管控?个人公益站怎么实现充值、配额、计费闭环?
New API(https://github.com/QuantumNous/new-api)正是为解决这些痛点而生的'下一代 LLM 网关 + AI 资产管理系统'。
它不是简单的中转代理,而是统一入口 + 智能路由 + 格式转换 + 精细计费 + 多租户管理的完整平台。一把钥匙(一个 OpenAI 兼容的 API Key),调用全球 30+ 服务商、100+ 模型,还能自动把 Claude 请求转成 OpenAI 格式、Gemini 转 OpenAI、甚至支持 OpenAI Responses / Realtime / Claude Messages / Gemini 原生格式双向转换。
官网:https://www.newapi.ai
文档:https://docs.newapi.pro
Docker 镜像:calciumion/new-api:latest
一、项目背景与发展历程
2023 年,songquanpeng 推出 One API,开源界第一款真正意义上的'OpenAI 兼容大模型聚合中转',迅速成为自建 ChatGPT/Claude 替代方案的标配。但到 2025 年初,One API 停止维护,社区急需接棒者。
QuantumNous 团队在 2025 年 3 月左右接手 fork,命名为 New API,进行了大规模重构:
- 前端重写为现代 React/Next.js 风格 UI(原版是老式 Bootstrap)
- 增加 Claude Messages ↔ OpenAI 双向转换、Gemini 双向转换(文本)
- 支持 OpenAI 新一代 Responses API、Realtime API(含 Azure)
- 加入思考模式(reasoning_effort)、思考转内容(thinking-to-content)
- 支付系统(EPay、Stripe)、缓存计费、模型倍率灵活配置
- OAuth(Discord、Telegram、LinuxDO、OIDC)
- 多语言国际化(i18n)
- Pyroscope 性能剖析、Redis 缓存、RWMap 高并发优化
- 集成 Midjourney-Proxy、Suno-API、Dify ChatFlow
2025 年 8 月后,New API 成为主流替代,Linux.do、ZEEKLOG、知乎、B 站涌现大量部署教程。2026 年 2 月最新版 v0.10.9-alpha.6 修复了状态码映射、Token 搜索、Header 透传等问题,稳定性大幅提升。
许可证:AGPL-3.0(网络服务部署必须开源)。商业闭源授权请邮件 [email protected]。
免责声明:遵守各上游服务商条款(如 OpenAI 使用政策、中国《生成式人工智能服务管理暂行办法》),项目按'AS IS'提供,无任何保证。

