跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
编程语言AI大前端算法

GLM-5 发布:开源模型综合排名第一,Agentic 能力与前端细节显著增强

GLM-5 由智谱于 2 月 12 日发布,参数规模跃升至 744B,预训练数据增至 28.5T tokens。引入 DeepSeek Sparse Attention 及异步强化学习基础设施 slime,提升训练效率。在 Vending Bench 2 测试中,其长期规划能力居开源模型首位,接近闭源模型水平。定位转向复杂系统工程与长周期 Agent 任务,支持文件生成及跨设备操作。前端细节逼真,可模拟手机 OS 运行应用。兼容 OpenClaw 等生态,已在 Hugging Face 与 ModelScope 开源。

BackendPro发布于 2026/4/6更新于 2026/5/2333 浏览
GLM-5 发布:开源模型综合排名第一,Agentic 能力与前端细节显著增强

GLM-5 发布:大模型向真实世界复杂任务发起冲锋

大模型叙事逻辑已出现明显变化。过去三年关注点在于谁更会回答问题、回答得更聪明准确快速;随着一系列 Agent 产品涌现,大模型开始向真实世界的复杂任务发起冲锋。现在的问题变成:谁能真正承担任务?

2 月 12 日凌晨,智谱正式发布了 GLM-5。

模型训练大幅创新

参数规模从 355B(32B 激活)跃升到 744B(40B 激活),预训练数据从 23T tokens 增加到 28.5T tokens,同时引入 DeepSeek Sparse Attention,在维持长上下文能力的同时压缩部署成本。虽然整体模型大了一倍,但部署成本没有增加多少,模型表现更加稳定。

真正的变化发生在训练范式上。强化学习一直是大模型从'能用'走向'好用'的关键,但效率极低,尤其在超大模型上几乎难以规模化。GLM-5 团队为此构建了一套名为'slime'的异步强化学习基础设施,大幅提升训练吞吐量,让后训练不再是粗颗粒度修补,而是高频、细粒度迭代。

全球开源模型综合排名第一

在推理、代码与智能体任务上,GLM-5 已经成为全球开源模型中的最佳表现者,并开始逼近一线闭源模型。

在衡量长期规划能力的 Vending Bench 2 上——一个要求模型经营一年'自动售货机业务'的基准测试——GLM-5 最终账户余额达到 4,432 美元,在开源模型中排名第一,接近 Claude Opus 4.5。这里考验的不是答题,而是资源调度、长期决策与策略稳定性。

图片

图片

从对话转向工作,大模型转向 Agentic 时代

GLM-5 不再强调'聊天能力',而是明确面向复杂系统工程与长周期 Agent 任务。在内部 CC-Bench-V2 评测中,其在前端、后端与长任务执行上显著超越 GLM-4.7,缩小与顶级模型的差距。

基础模型正在从'对话产品'转向'工作基础设施'。就像 Office 之于知识工作者,IDE 之于工程师,大模型正在成为一套'生产力系统'。

GLM-5 已经支持将文本或原始材料直接转化为 .docx、.pdf、.xlsx 等文件——PRD、财务报表、课程讲义、试卷、执行手册、菜单——从输入到交付,一步完成。

图片

据官方透露,GLM-5 模型已在 Hugging Face 与 ModelScope 开源,权重采用 MIT License;开发者可在 api.z.ai 与 BigModel.cn 调用。

此外,GLM-5 已经兼容 Claude Code 与 OpenClaw。这意味着这款顶尖的开源模型现在可以通过 OpenClaw 进行跨应用与跨设备执行操作。

实测:细节逼近真实使用体验,Agent 模式工作流拆解如同专业人士

前端能力越来越强了!相比前一代的 4.7,GLM-5 在前端细节上更加丰富和丝滑,呈现风格也更加贴近现实应用的审美。

图片

这是之前 GLM-4.7 跑的效果:

图片

一位网友甚至让 GLM-5 造了一款可以运行的手机。不仅手机做了出来,手机里的各种应用都可以点击运行,比如日历、贪吃蛇、音乐等等,非常逼真。

图片

Agent 模式测试题目如下:

为一家 AI Infra 创业公司生成一份融资路演 PPT 大纲(15 页) 要求:包含市场分析 竞争格局 技术壁垒 商业模式 财务预测 团队介绍 每一页写出标题 + 3 个核心要点

可以看出该模式下,GLM-5 的工作流已经化身成了一位具备撰写融资路演 PPT 经验的专业人士,工作流拆解得非常严谨靠谱。另外注意到 GLM-5 会自主调用 pptskills 来帮助自己生成 PPT 大纲。

图片

最后生成的 PPT 大纲版式如下,当然从效果看,还需要人工进一步在细节上进行调整。

图片

智谱这次还推出了其他新产品 OCR、Image 和 Audio。可以看出智谱正在从代码模型拓展到多模态模型的布局。而这也是转向复杂系统任务的必然之举。

图片

插曲:神秘模型被传就是 GLM-5

上周在 OpenRouter 的一个名为'Pony Alpha'的神秘模型突然爆红(排名第一),就被网友爆料是智谱的 GLM-5,因为风格很像 GLM,而且聊天时,模型说自己是 z.ai 创造的。但官方目前还没有明确回应该消息是否属实。

图片

结语:大模型注定吞噬一切

大模型叙事逻辑已经出现了极为明显的变化。过去三年,大家更会关注:谁更会回答问题,谁回答得更聪明、准确、快速?但随着一系列 Agent 产品的涌现,大模型也开始向真实世界的复杂任务发起冲锋。现在的问题变成:谁能真正承担任务?

如果说 GLM-4.5 是'会推理、会写代码的模型',那么 GLM-5 的野心更直接——成为复杂系统里的执行者。

顺着这个脉络,当复杂系统的 Agentic Engineering 这座堡垒也被大模型攻克之后,恐怕之后的主命题就会变成:让 AI 自己去运营一家公司,看好未来几个月、甚至几年的现金流了吧。

总之,时代切换的周期已经越来越短了。

目录

  1. GLM-5 发布:大模型向真实世界复杂任务发起冲锋
  2. 模型训练大幅创新
  3. 全球开源模型综合排名第一
  4. 从对话转向工作,大模型转向 Agentic 时代
  5. 实测:细节逼近真实使用体验,Agent 模式工作流拆解如同专业人士
  6. 插曲:神秘模型被传就是 GLM-5
  7. 结语:大模型注定吞噬一切
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • UE5 中 SimpleOSS 集成 libcurl 冲突解决方案
  • 985 硕士毕业未进大厂是失败吗?职业选择与成长路径探讨
  • 基于 SpringAI Alibaba 开发大模型智能体,支持基础版和多模式
  • DankDroneDownloader:大疆无人机固件下载工具使用指南
  • 即梦与 Seedance 2.0 AI 提示词全场景实战指南
  • 从 C 到 Modern C++:核心机制与技术复盘
  • 国内 AI 大模型企业密集布局海外市场
  • OpenClaw 2026.3.13 发布:Dashboard-v2 与 Agent 协同架构升级
  • Spring Boot Web 三大核心交互实战:表单、AJAX 与 JSON
  • 数据结构:线性表的链式表示与实现
  • Python Web 自动化测试实战:核心函数与场景化应用
  • 产品经理是否有必要学习大模型技术
  • 近半年无人机与大模型结合的 8 项硬核研究
  • LangChain 应用开发:TruLens 利用量化技术对抗模型幻觉
  • 统信 UOS V2500 服务器 OpenClaw AI Agent 安装部署指南
  • Spring Boot 3.5.11 + JDK21 整合 RabbitMQ、RocketMQ、Kafka 实战与选型
  • Java 调用百度地图 API 实现实时路况检索实战
  • 实战:使用 Jenkins Pipeline 自动化构建与部署 Java 项目
  • 2026 年 2 月 AIGC 行业模型发布及前沿资讯
  • Linux 进程核心原理精讲:从体系结构到实战操作

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online