Kimi 2.5 开源模型部署与性能评测指南 | 极客日志

PythonAI算法

Kimi 2.5 开源模型部署与性能评测指南

综述由AI生成Kimi 2.5 是 Moonshot AI 开源的多模态大模型，支持 Agent-Swarm 架构。文章汇总了该模型的基准测试成绩、架构原理、开源资源地址及本地 Docker 部署步骤。实测数据显示其在 OCR、代码生成等场景表现优异，成本约为 GPT-4.1 API 的 45%。部署需注意训练代码未开源及中文幻觉率等问题。

DevOpsTeam发布于 2026/3/21更新于 2026/5/69 浏览

开源 Kimi 2.5 全景手册（2026 年 1 月版）

Moonshot AI 于 2025-12 开源的「多模态 + Agent-Swarm」权重本文汇总已公开（✅）与仅 API（⚠️）信息，方便一键部署与落地

1. 江湖定位与榜单成绩

基准	分数	排名（开源）	备注
LiveBench 2025-12	76.4% Pass@1	🥇 第 1	打平 Claude-4.5-Sonnet，落后 GPT-4.1 约 2pp
Agent: BrowseComp	78.4	🥇 第 1	唯一公开「Agent-Swarm」权重
Code: SWE-Bench Verified	76.8	🥇 第 1	领先 DeepSeek-V3.2 约 9pp
OCR: OmniDocBench	88.8	🥇 第 1	百页 PDF 不截断

2. 架构原理（已开源 ✅）

类型：原生多模态 Transformer
总参 / 激活：1 T / 120 B（MoE，Top-8 路由）
预训练：15 T tokens（文本 + 图 + 视频帧 + 工具轨迹）
优化器：Muon + ZeRO-3 + 8-bit AdamW，显存↓35%
创新 1. Agent-Swarm
- Planner → 子任务 → 并行子 Agent（≤100）→ 结果聚合
- 训练：PARL（Parallel Agent RL）奖励 = 完成度 - 步数 - 冲突
创新 2. 视觉 - 文本联合 Attention
- 4K×4K 原图输入，不压 224×224，OCR/图表还原度高

3. 开源清单（GitHub & HuggingFace）

组件	大小	协议	地址
fp16 权重	240 GB	Apache-2.0	kimi-2.5-fp16
q4_k_m 权重	38 GB	Apache-2.0	kimi-2.5-q4km
推理代码	—	Apache-2.0	kimi-infer
VSCode 插件	—

docker pull kimiopensource/kimi-2.5:2401-cuda121

docker run --gpus all -p 8080:8080 -v /data/kimi-2.5-fp16:/model kimiopensource/kimi-2.5:2401-cuda121 kimi-infer server --model /model --swarm 100 --max-tools 1500

import openai
client = openai.OpenAI(base_url="http://localhost:8080/v1", api_key="none")
resp = client.chat.completions.create(
    model="kimi-2.5",
    messages=[{"role":"user","content":"把这份 40 页 PDF 总结成 3 段话"}],
    extra_body={"use_swarm":True,"max_parallel":50}
)
print(resp.choices[0].message.content)

场景	输入	输出	耗时	子 Agent 数
百页财报速读	120 页 PDF + 表格	1 页 Markdown + 3 图表	38 s	45
前端 0→1	手绘线框 PNG	可运行 React+Tailwind	22 s	38
多语言小票 OCR	17 国扫描图	JSON（金额 - 币种 - 日期）	15 s	1
竞品情报	'2026 人形机器人'	100 家公司表 + 来源	55 s	92