【AI】KIMI2.5---开源榜第一

开源 Kimi 2.5 全景手册(2026 年 1 月版)

Moonshot AI 于 2025-12 开源的「多模态 + Agent-Swarm」权重
本文汇总已公开(✅)与仅 API(⚠️)信息,方便一键部署与落地

1. 江湖定位与榜单成绩

基准分数排名(开源)备注
LiveBench 2025-1276.4% Pass@1🥇 第 1打平 Claude-4.5-Sonnet,落后 GPT-4.1 约 2pp
Agent: BrowseComp78.4🥇 第 1唯一公开「Agent-Swarm」权重
Code: SWE-Bench Verified76.8🥇 第 1领先 DeepSeek-V3.2 约 9pp
OCR: OmniDocBench88.8🥇 第 1百页 PDF 不截断

2. 架构原理(已开源 ✅)

  • 类型:原生多模态 Transformer
  • 总参 / 激活:1 T / 120 B(MoE,Top-8 路由)
  • 预训练:15 T tokens(文本+图+视频帧+工具轨迹)
  • 优化器:Muon + ZeRO-3 + 8-bit AdamW,显存↓35%
  • 创新 1. Agent-Swarm
    • Planner → 子任务 → 并行子 Agent(≤100)→ 结果聚合
    • 训练:PARL(Parallel Agent RL)奖励 = 完成度 - 步数 - 冲突
  • 创新 2. 视觉-文本联合 Attention
    • 4K×4K 原图输入,不压 224×224,OCR/图表还原度高

3. 开源清单(GitHub & HuggingFace)

组件大小协议地址
fp16 权重240 GBApache-2.0kimi-2.5-fp16
q4_k_m 权重38 GBApache-2.0kimi-2.5-q4km
推理代码Apache-2.0kimi-infer
VSCode 插件Apache-2.0Kimi-Code
Chrome 插件Apache-2.0Kimi-Browse

4. 本地部署步骤(Docker 一行启动)

① 硬件建议

精度最低配置速度
fp162×A100-80 GB25 tokens/s
q4_k_m1×A100-80 GB 或 2×RTX4090-24 GB12 tokens/s

② 拉镜像

docker pull kimiopensource/kimi-2.5:2401-cuda121 

③ 启动服务

docker run --gpus all -p 8080:8080 \ -v /data/kimi-2.5-fp16:/model \ kimiopensource/kimi-2.5:2401-cuda121 \ kimi-infer server --model /model --swarm 100 --max-tools 1500

④ 客户端调用(OpenAI-Compatible)

import openai client = openai.OpenAI(base_url="http://localhost:8080/v1", api_key="none") resp = client.chat.completions.create( model="kimi-2.5", messages=[{"role":"user","content":"把这份 40 页 PDF 总结成 3 段话"}], extra_body={"use_swarm":True,"max_parallel":50})print(resp.choices[0].message.content)

5. 典型用例与实测

场景输入输出耗时子 Agent 数
百页财报速读120 页 PDF + 表格1 页 Markdown + 3 图表38 s45
前端 0→1手绘线框 PNG可运行 React+Tailwind22 s38
多语言小票 OCR17 国扫描图JSON(金额-币种-日期)15 s1
竞品情报“2026 人形机器人”100 家公司表 + 来源55 s92

6. 性能 & 成本

项目数值备注
输入 1M tokens¥4(缓存命中 ¥0.7)官方 API 价
输出 1M tokens¥21≈ GPT-4.1 API 45 %
端侧 q4 速度12 tokens/sRTX 4090×2
首响延迟180 ms本地实测

7. 局限与注意事项

⚠️ 训练代码与数据集未开源,仅推理权重
⚠️ 中文幻觉率约 6 %,需插件事实核查
⚠️ 超长视频(>30 min)时间戳误差 ±3 s
⚠️ Agent-Swarm 对网络带宽敏感,建议 ≥1 Gbps 专线


8. 总结

Kimi 2.5 是目前唯一把 1 T MoE + 原生视觉 + 100 并行 Agent 一起开源的模型;
想在本地/私有云跑一个“全能员工”,它几乎是 2026 年初的最佳选择。

Read more

Flutter 组件 slug 的适配 鸿蒙Harmony 深度进阶 - 驾驭中英混合语义转码、实现鸿蒙端“拼音+Slug”组合路径与超大文件库冲突自愈方案

Flutter 组件 slug 的适配 鸿蒙Harmony 深度进阶 - 驾驭中英混合语义转码、实现鸿蒙端“拼音+Slug”组合路径与超大文件库冲突自愈方案

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 组件 slug 的适配 鸿蒙Harmony 深度进阶 - 驾驭中英混合语义转码、实现鸿蒙端“拼音+Slug”组合路径与超大文件库冲突自愈方案 前言 在前文中,我们利用 slug 实现了基础的文本规范化(如将“Hello World”转为“hello-world”)。但在真正的“国产化办公软件”、“包含上千万条中文动态的社区平台”或“分布式海量文件索引”场景中。简单的拉丁化转换完全无法应对中文(CJK)环境。面对标题为 鸿蒙 0307 批次:跨平台实战! 的内容。如果不加干预,slugify 的结果可能是一串意义不明的字符或者是空字符串。 如果我们直接使用百分比编码,长路径可能会超出文件系统的 255 字节限制。 本文将作为

By Ne0inhk

使用 Rufus 制作启动盘安装 Windows 与 Ubuntu 系统全流程教程(图文详解+避坑指南)

适用对象:电脑小白、系统维护人员、装机爱好者 适用系统:Windows 10/11、Ubuntu、Deepin、Kali Linux 等 作者:顶云爱好者 更新时间:2025 年 10 月 文章目录  一、前言:为什么选择 Rufus?  二、准备工作  三、下载与启动 Rufus  四、使用 Rufus 制作启动盘  1. 制作 Windows 安装启动盘 ① 选择镜像文件 ② 选择分区方案 ③ 文件系统 ④ 点击 “开始(Start)”  2. 制作 Ubuntu 启动盘 ① 下载镜像 ② 打开

By Ne0inhk
Flutter 三方库 mix_context 的鸿蒙化适配指南 - 实现极简上下文增强、支持非 Widget 作用域下的 BuildContext 访问与状态注入

Flutter 三方库 mix_context 的鸿蒙化适配指南 - 实现极简上下文增强、支持非 Widget 作用域下的 BuildContext 访问与状态注入

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 mix_context 的鸿蒙化适配指南 - 实现极简上下文增强、支持非 Widget 作用域下的 BuildContext 访问与状态注入 前言 在进行 Flutter for OpenHarmony 开发时,我们经常会遇到底层逻辑(如 Service、Repository)需要访问 BuildContext 的窘境(例如为了弹出一个全局 Dialog 或获取当前的主题颜色)。虽然传统的做法是层层传递参数,但代码会因此变得臃肿。mix_context 提供了一种更优雅的上下文混入与注入方案。本文将指导大家如何在鸿蒙端利用该库提升代码的响应能力。 一、原理解析 / 概念介绍 1.1 基础原理 mix_context 的核心思想是将 BuildContext 的引用通过全局代理或单例模式进行“

By Ne0inhk