New API 详解：新一代开源大模型统一网关与 AI 资产管理系统

开篇：为什么我们需要一个'大模型统一网关'？

在 2025-2026 年的 AI 浪潮中，开发者们面临的最大痛点不再是'有没有好模型'，而是'怎么高效、低成本、安全地用好几十个模型'。

OpenAI 的 GPT-5 系列推理能力顶尖，但价格高昂且有速率限制；Anthropic 的 Claude 3.7 Sonnet 在长上下文和思考模式上无敌，却接口完全不同；Google Gemini 2.5 系列多模态强悍，价格亲民，但 API 格式又是另一套；国内的通义千问、DeepSeek、豆包、文心一言、混元……每个平台都有自己的 Base URL、鉴权方式、计费规则、限流策略。更别提 Midjourney 绘画、Suno 音乐生成、Rerank 重排序、Realtime 实时语音对话这些非标准接口。

手动为每个应用适配？维护几十份配置文件？每次新模型出来就要改代码？企业内部多用户、多部门、多预算怎么管控？个人公益站怎么实现充值、配额、计费闭环？

New API（https://github.com/QuantumNous/new-api）正是为解决这些痛点而生的'下一代 LLM 网关 + AI 资产管理系统'。

它不是简单的中转代理，而是统一入口 + 智能路由 + 格式转换 + 精细计费 + 多租户管理的完整平台。一把钥匙（一个 OpenAI 兼容的 API Key），调用全球 30+ 服务商、100+ 模型，还能自动把 Claude 请求转成 OpenAI 格式、Gemini 转 OpenAI、甚至支持 OpenAI Responses / Realtime / Claude Messages / Gemini 原生格式双向转换。

官网：https://www.newapi.ai 文档：https://docs.newapi.pro Docker 镜像：calciumion/new-api:latest

一、项目背景与发展历程

2023 年，songquanpeng 推出 One API，开源界第一款真正意义上的'OpenAI 兼容大模型聚合中转'，迅速成为自建 ChatGPT/Claude 替代方案的标配。但到 2025 年初，One API 停止维护，社区急需接棒者。

QuantumNous 团队在 2025 年 3 月左右接手 fork，命名为 New API，进行了大规模重构：

前端重写为现代 React/Next.js 风格 UI（原版是老式 Bootstrap）
增加 Claude Messages ↔ OpenAI 双向转换、Gemini 双向转换（文本）
支持 OpenAI 新一代 Responses API、Realtime API（含 Azure）
加入思考模式（reasoning_effort）、思考转内容（thinking-to-content）
支付系统（EPay、Stripe）、缓存计费、模型倍率灵活配置
OAuth（Discord、Telegram、OIDC）
多语言国际化（i18n）
Pyroscope 性能剖析、Redis 缓存、RWMap 高并发优化
集成 Midjourney-Proxy、Suno-API、Dify ChatFlow

2025 年 8 月后，New API 成为主流替代，Linux.do、知乎、B 站涌现大量部署教程。2026 年 2 月最新版 v0.10.9-alpha.6 修复了状态码映射、Token 搜索、Header 透传等问题，稳定性大幅提升。

许可证：AGPL-3.0（网络服务部署必须开源）。商业闭源授权请邮件 [email protected]。

免责声明：遵守各上游服务商条款（如 OpenAI 使用政策、中国《生成式人工智能服务管理暂行办法》），项目按'AS IS'提供，无任何保证。

New API 详解：新一代开源大模型统一网关与 AI 资产管理系统