凌晨GLM-5炸场!世界开源模型第一名!模型训练大幅创新!实测:Agentic能力、前端细节逼近专业人士,可模拟手机OS,游戏秒运行!代际变化

凌晨GLM-5炸场!世界开源模型第一名!模型训练大幅创新!实测:Agentic能力、前端细节逼近专业人士,可模拟手机OS,游戏秒运行!代际变化

大模型叙事逻辑已经出现了极为明显的变化。过去三年,大家更会关注:谁更会回答问题,谁回答得更聪明、准确、快速?但随着一系列Agent产品的涌现,大模型也开始向真实世界的复杂任务发起冲锋。现在的问题变成:谁能真正承担任务?

GLM-5 终于来了!

2月12日凌晨,智谱正式发布了GLM-5。

早上,小编就围绕它展开了测评。先说一句话感受,可以说非常跟上一代GLM-4.7,比起来,代际变化非常大。

一句话感受,是一场非常激进的扩张。

模型训练大幅创新

先来看模型和参数,参数规模从 355B(32B 激活)跃升到 744B(40B 激活),预训练数据从 23T tokens 增加到 28.5T tokens,同时引入 DeepSeek Sparse Attention,在维持长上下文能力的同时压缩部署成本。

这样,虽然整体模型大了一倍、但部署成本没有增加多少,同时,模型表现更加稳定了。

真正的变化发生在训练范式上。

强化学习一直是大模型从“能用”走向“好用”的关键,但问题是效率极低,尤其在超大模型上几乎难以规模化。GLM-5 团队为此构建了一套名为“ slime”的异步强化学习基础设施,大幅提升训练吞吐量,让后训练不再是粗颗粒度修补,而是高频、细粒度迭代。这意味着模型不仅在能力上变强,在优化路径上也更系统。

全球开源模型综合排名第一

效果如何?

在推理、代码与智能体任务上,GLM-5 已经成为全球开源模型中的最佳表现者,并开始逼近一线闭源模型。

图片

有一个例子值得注意。

在衡量长期规划能力的 Vending Bench 2 上——一个要求模型经营一年“自动售货机业务”的基准测试——GLM-5 最终账户余额达到 4,432 美元,在开源模型中排名第一,接近 Claude Opus 4.5。这里考验的不是答题,而是资源调度、长期决策与策略稳定性。

图片
从对话转向工作,大模型转向Agentic时代

更值得注意的是定位变化。

GLM-5 不再强调“聊天能力”,而是明确面向复杂系统工程与长周期 Agent 任务。在内部 CC-Bench-V2 评测中,其在前端、后端与长任务执行上显著超越 GLM-4.7,缩小与顶级模型的差距。

这其实透露出一个更重要的趋势变化:基础模型正在从“对话产品”转向“工作基础设施”。(从 Claude Opus4.6 也能看出来这个趋势越来越明显。)

就像 Office 之于知识工作者,IDE 之于工程师,大模型正在成为一套“生产力系统”。

GLM-5 已经支持将文本或原始材料直接转化为 .docx、.pdf、.xlsx 等文件——PRD、财务报表、课程讲义、试卷、执行手册、菜单——从输入到交付,一步完成。

这也说明,生成内容这种能力已经被各大模型厂商卷到足够Cover了,今年以后的大模型的突破重点,将长期聚焦在“完成工作闭环”方面。

图片

与此同时,据官方透露,GLM-5模型已在 Hugging Face 与 ModelScope 开源,权重采用 MIT License;开发者可在 api.z.ai 与 BigModel.cn 调用,

而且,GLM- 5 已经兼容 Claude Code 与 OpenClaw。

这也就意味着,这款顶尖的开源模型现在可以通过 OpenClaw 进行跨应用与跨设备执行操作

实测:细节逼近真实使用体验,Agent模式工作流拆解如同专业人士、可模拟手机操作系统

前端能力越来越强了!

相比前一代的4.7,GLM-5在前端细节上更加丰富和丝滑,呈现风格也更加贴近现实应用的审美。

图片

这是之前小编在GLM-4.7跑的效果:

图片

更厉害的来了。一位网友甚至让GLM-5造了一款可以运行的手机。

不仅手机做了出来,手机里的各种应用都可以点击运行,比如日历、贪吃蛇、音乐等等,可以说非常逼真、惊艳了!

图片

此外,小编还特意测试了Agent模式。这次的测试题目是:

为一家AI Infra创业公司生成一份融资路演PPT大纲(15页) 要求: 包含市场分析 竞争格局 技术壁垒 商业模式 财务预测 团队介绍 每一页写出标题 + 3个核心要点

可以看出该模式下,GLM-5的工作流已经化身成了一位具备撰写融资路演PPT经验的专业人士,工作流拆解得非常严谨靠谱。另外小编还注意到GLM-5会自主调用pptskills来帮助自己生成PPT大纲。

图片

最后生成的PPT大纲版式如下,当然从效果看,还需要人工进一步在细节上进行调整。

图片

当然小编还注意到,智谱这次还推出了其他新产品 OCR、Image和Audio。

可以看出智谱,正在从代码模型拓展到多模态模型的布局。而这也是转向复杂系统任务的必然之举。

图片
插曲:神秘模型被传就是GLM-5

上周在OpenRouter的一个名为“Pony Alpha ”的神秘模型突然爆红(排名第一),就被网友爆料是智谱的GLM-5,因为风格很像GLM,而且聊天时,模型说自己是z.ai创造的。但官方目前还没有明确回应该消息是否属实。

图片
写在最后:大模型,注定吞噬一切

大模型叙事逻辑已经出现了极为明显的变化。

过去三年,大家更会关注:谁更会回答问题,谁回答得更聪明、准确、快速?

但随着一系列Agent产品的涌现,大模型也开始向真实世界的复杂任务发起冲锋。现在的问题变成:谁能真正承担任务?

如果说 GLM-4.5 是“会推理、会写代码的模型”,那么 GLM-5 的野心更直接——成为复杂系统里的执行者。

顺着这个脉络,当复杂系统的Agentic Engineering 这座堡垒也被大模型攻克之后,恐怕之后的主命题就会变成:让AI自己去运营一家公司,看好未来几个月、甚至几年的现金流了吧。

总之,时代切换的周期已经越来越短了。

Read more

【数据库】国产数据库的新机遇:电科金仓以融合技术同步全球竞争

【数据库】国产数据库的新机遇:电科金仓以融合技术同步全球竞争

7月15日,国产数据库厂商中电科金仓(北京)科技股份有限公司(以下简称“电科金仓”)在北京举行了一场技术发布会,集中发布四款核心产品:AI时代的融合数据库KES V9 2025、企业级统一管控平台KEMCC、数据库一体机(云数据库AI版)以及企业级智能海量数据集成平台KFS Ultra,并同步举行了“金兰组织2.0”启动仪式。 如果放在过去几年,这场发布会可能被归入“信创替代”的常规范畴。但这一次,电科金仓试图讲述的不再是“我们也能做、我们可以兼容”,而是“我们能不能定义下一代数据库形态”。 整个发布会贯穿了三个关键词:“融合”“AI”“平台能力”。这背后的核心逻辑是清晰的:在“去IOE”与“兼容Oracle”的红利渐近尾声之际,国产数据库厂商开始面对一个更加复杂、也更具挑战性的市场命题——如何在大模型时代支撑非结构化数据、高维向量检索和复杂语义计算的新需求? 正如我国数据库学科带头人王珊教授所说,数据库内核与AI能力的深度结合,已成为释放数据核心价值的关键路径,正催生着更智能、更自适应、更能应对复杂挑战的新一代数据库形态。

By Ne0inhk
【Part 4 XR综合技术分享】第一节|技术上的抉择:三维实时渲染与VR全景视频的共生

【Part 4 XR综合技术分享】第一节|技术上的抉择:三维实时渲染与VR全景视频的共生

《VR 360°全景视频开发》专栏 将带你深入探索从全景视频制作到Unity眼镜端应用开发的全流程技术。专栏内容涵盖安卓原生VR播放器开发、Unity VR视频渲染与手势交互、360°全景视频制作与优化,以及高分辨率视频性能优化等实战技巧。 📝 希望通过这个专栏,帮助更多朋友进入VR 360°全景视频的世界! Part 4|XR综合技术分享 最后一Part了,我将分享一些关于当前常用的XR综合技术,内容涵盖三维实时渲染与全景视频的共生、多模态交互体验的融合,以及AI如何深度赋能XR应用,推动智能化发展。同时畅想通向全感知XR智能沉浸时代的未来,探索如何通过更先进的技术不断提升用户体验。毕竟,360°全景视频仅是XR应用中的冰山一角。 第一节|技术上的抉择:三维实时渲染与VR全景视频的共生 文章目录 * 《VR 360°全景视频开发》专栏 * Part 4|XR综合技术分享 * 第一节|技术上的抉择:三维实时渲染与VR全景视频的共生 * 1、VR内容形态的分化与融合 * 1.1 三维实时渲染的发展 * 1.2

By Ne0inhk

OpenClaw 完整安装与配置文档(包含Minimax/deepseek模型接入、飞书机器人接入)

OpenClaw 完整安装与配置文档 文档说明:本文档适用于 Linux 系统(Debian/Ubuntu 系列),详细梳理 OpenClaw 从基础环境准备、核心程序安装,到模型配置(Minimax/DeepSeek)、飞书渠道对接的全流程,所有交互式配置选项完整呈现,步骤可直接复制执行,适配新手操作。 适用场景:OpenClaw 新手部署、企业内部飞书机器人对接、Minimax/DeepSeek 模型配置 前置说明: 1. 服务器需联网,确保能访问 GitHub、npm、飞书官网; 2. 操作全程使用终端命令行,建议使用远程工具(如 Xshell、Putty)连接服务器; 3. 复制命令时需完整复制,避免遗漏特殊符号; 4. 所有交互式配置选项均完整列出,按文档指引选择即可。 5. 拥有root用户/sudo权限。

By Ne0inhk
WorkBuddy 使用指南:从零开始配置 QQ 机器人,解锁桌面智能体新玩法

WorkBuddy 使用指南:从零开始配置 QQ 机器人,解锁桌面智能体新玩法

文章目录 * 前言 * 下载 WorkBuddy * 认识 WorkBuddy * 插件类型 * 配置 QQ 机器人 * 登录 QQ 开放平台并注册激活账号 * 配置超级管理员、主体及认证信息 * 创建 QQ 机器人 * 获取 AppID 和 AppSecret * 从 Claw 中获取 Webhook * 在 QQ 开发平台配置回调地址 * 开始使用 WorkBuddy Claw * 总结 前言 在大家还在沉迷于如何搭建 OpenClaw 的时候,腾讯竟然悄悄公测了 WorkBuddy。这是一款面向全角色的桌面智能体,下达指令即可自动生成文档、表格、图表及 PPT 等可视化成果,能够自主规划并交付多模态复杂任务结果,支持多 Agents 并行工作,极致提效,

By Ne0inhk