GLM-4-9B重磅开源：26种语言+128K上下文，性能超越Llama-3-8B

优质文章学习记录

06 Apr 2026 — 5 min read

智谱AI正式发布新一代开源大语言模型GLM-4-9B，该模型在多维度性能测试中全面超越Meta的Llama-3-8B，同时带来26种语言支持和128K超长上下文能力，为开发者社区提供了兼具高性能与实用性的本地化部署选择。

【免费下载链接】glm-4-9b 项目地址: https://ai.gitcode.com/zai-org/glm-4-9b

行业现状：开源模型进入"性能跃升期"

当前大语言模型领域正经历开源与闭源的双线竞争。Meta的Llama-3系列凭借8B和70B两个版本构建了强大的生态壁垒，而国内模型如ChatGLM3-6B则在中文场景中保持优势。据行业分析，2024年第二季度开源大模型下载量同比增长217%，企业级本地化部署需求激增，开发者对模型的性能、上下文长度和多语言能力提出了更高要求。在此背景下，GLM-4-9B的推出恰逢其时，填补了9B参数级别高性能开源模型的市场空白。

模型核心亮点：从参数规模到场景落地的全面突破

GLM-4-9B系列包含基座模型和对话模型两个版本，其中对话版本（GLM-4-9B-Chat）实现了四大关键突破：

性能全面超越同类模型：在权威测评中，GLM-4-9B基座模型展现出显著优势。MMLU（多任务语言理解）测试达到74.7分，较Llama-3-8B高出8.1分；C-Eval（中文综合能力）测试以77.1分领先Llama-3-8B-Instruct近26个百分点；数学推理方面，GSM8K数据集得分84.0，超越Llama-3-8B-Instruct的79.6；代码能力在HumanEval评测中获得70.1分，领先行业平均水平约8个百分点。

跨语言能力大幅提升：首次实现26种语言的深度支持，覆盖中、英、日、韩、德等主流语种，以及多个沿线国家的14种稀缺语言。模型采用全新的多语言预训练策略，在低资源语言理解任务上较上一代提升40%以上，为全球化应用提供基础支撑。

超长上下文与工具调用能力：对话版本支持128K上下文窗口（约200万中文字符），可处理完整的技术文档、书籍章节或企业年报。同时内置网页浏览、代码执行和自定义工具调用（Function Call）功能，开发者可通过API轻松扩展模型能力边界，构建智能客服、数据分析等复杂应用。

多模态与场景化版本矩阵：同步推出支持1120×1120高分辨率图像理解的GLM-4V-9B，以及上下文长度达1M（百万字符）的GLM-4-9B-Chat-1M专用模型。这种场景化版本策略，使开发者能够根据实际需求选择最优配置，平衡性能与部署成本。

性能实测：9B参数实现"越级挑战"

在智谱AI公布的对比数据中，GLM-4-9B基座模型在核心评测集上展现出惊人实力：

知识掌握：MMLU（74.7分）和C-Eval（77.1分）的成绩表明，该模型在专业领域知识上已接近部分闭源API水平
逻辑推理：GSM8K数学推理84.0分的成绩，意味着能解决大部分中学数学问题
代码能力：HumanEval 70.1分的表现，可满足85%的基础编程辅助需求

特别值得注意的是，这些成绩是在9B参数规模下实现的，较Llama-3-8B仅增加12.5%的参数量，却实现了全方位性能超越，体现出高效的模型设计理念。

行业影响：重塑企业级AI应用格局

GLM-4-9B的开源将对行业产生多重影响：首先，为中小企业提供了免许可费的高性能本地化方案，将企业级AI部署成本降低60%以上；其次，128K上下文能力使长文档处理、法律分析等专业场景成为可能；最后，多语言支持配合工具调用功能，有望加速跨境电商、国际教育等场景的AI落地。

据智谱AI官方资料显示，该模型已通过Hugging Face开放下载，并提供完整的部署教程和API文档。开发者可基于 Transformers 4.44.0及以上版本快速集成，支持CPU、GPU等多种部署环境，最低只需16GB显存即可实现基本功能运行。

未来展望：开源生态进入"精细化竞争"

随着GLM-4-9B的开源，大语言模型领域正从"参数竞赛"转向"效率比拼"。该模型证明通过优化架构设计和训练策略，中等参数规模的模型完全可以实现高性能表现。业内专家预测，接下来开源社区将聚焦三大方向：垂直领域的模型精调技术、多模态能力的深度融合、以及轻量化部署方案的创新。

对于企业用户而言，GLM-4-9B提供了一个理想的平衡点——既避免了小模型的性能局限，又无需承担超大模型的部署成本。随着模型生态的完善，我们或将看到更多基于GLM-4架构的行业解决方案涌现，推动AI技术在制造、金融、医疗等传统行业的深度落地。

【免费下载链接】glm-4-9b 项目地址: https://ai.gitcode.com/zai-org/glm-4-9b

Retinaface+CurricularFace一文详解：RetinaFace检测+CurricularFace识别双模型协同原理

Retinaface+CurricularFace一文详解：RetinaFace检测+CurricularFace识别双模型协同原理人脸识别技术早已不是实验室里的概念，而是深入到考勤打卡、门禁通行、身份核验等日常场景中的实用工具。但真正落地时，很多人会发现：单靠一个“端到端”的黑盒模型，效果不稳定、调试无从下手、换张侧脸图就失效——问题往往不出在算法本身，而在于检测与识别两个环节的割裂。 RetinaFace + CurricularFace 这套组合，不是简单拼凑，而是一次有明确分工、深度协同的工程化设计：RetinaFace 负责“找得准”，CurricularFace 负责“认得牢”。它不追求参数量最大，而是把每一步都落在实处——人脸在哪、怎么对齐、特征怎么提、相似度怎么算，全都透明可查、可控可调。本文不讲论文公式，不堆架构图，只带你理清这套镜像背后的真实逻辑：为什么是 RetinaFace 而不是 YOLO？为什么选 CurricularFace 而非 ArcFace？两个模型之间到底发生了什么？

OpenCowork 实测：支持本地文件、飞书机器人的 Windows AI 助手（只需配置 Token）

目的找一款window 本地ai助手，但有如下要求 1）windows一键安装，带gui界面，操作简单 2）直接操作本地文件，能生成和写入本地文件内容 3）配置token 即可，无需绑定账号登陆测试效果 OpenCowork 可直接操作本地电脑文件，并支持接入飞书机器人应用，实现类似 OpenClaw 的电脑操作能力；但整体更适合本地文档生成、资料整理、代码或文本批量处理等场景。相比云端 AI，在生成速度、工具能力和复杂任务支持方面仍有差距，尤其在长文档生成和多工具协作时效率与稳定性较弱，因此更适合作为本地文件处理的辅助工具，而非替代云端 AI。 OpenCowork 很多自动化能力依赖python，你可以自己升级一下python，然后让OpenCowork 检测环境是不是最新的，并升级一下; 1 安装 OpenCowork 客户端下载地址 https://github.com/AIDotNet/OpenCowork 找右侧侧

宇树G1机器人强化学习训练完整实战教程

0. 前言人形机器人的运动控制一直是机器人领域的重要挑战，而强化学习为解决这一问题提供了强有力的工具。本教程将基于宇树G1人形机器人，从基础的强化学习环境搭建开始，逐步深入到高自由度模型的训练配置、奖励函数设计与优化，最终实现复杂动作的训练控制。作者看到一个很棒的系列，所以针对性的对文章内容进行了整理和二次理解，方便大家更好的阅读《不同自由度的宇树G1机器人强化学习训练配置及运行实战 + RSL-RL代码库问题修复》、《宇树G1机器人强化学习训练奖励函数代码架构 + 创建新的奖励函数（1）》、《RL指标分析与看板应用 — 宇树G1机器人高自由度模型强化学习训练实战（3）》、《调参解析 — 宇树G1机器人高自由度模型强化学习训练实战（4）》、《舞蹈训练？手撕奖励函数 — 宇树G1机器人高自由度模型强化学习训练实战（5）》。 1. 强化学习训练环境配置 1.1 基础环境搭建宇树机器人的强化学习训练基于Isaac Gym物理仿真环境和RSL-RL强化学习框架。首先需要确保这两个核心组件正确安装和配置。在开始训练之前，我们通过简单的命令来启动12自由度G1机器人的基础训练：

Retinaface+CurricularFace效果案例：高清证件照vs手机自拍跨设备比对结果

Retinaface+CurricularFace效果案例：高清证件照vs手机自拍跨设备比对结果你有没有遇到过这样的场景？公司新员工入职，需要核对身份证照片和本人是否一致；或者某个线上平台需要你上传手持身份证的照片进行实名认证。这时候，一个靠谱的人脸比对工具就显得尤为重要。今天，我们就来实测一个非常实用的人脸识别组合：Retinaface+CurricularFace。这个组合就像一个经验丰富的“人脸鉴定师”，能快速、准确地判断两张照片里是不是同一个人。我们这次测试的重点很接地气：用高清的证件照，去比对不同光线、不同角度下用手机随手拍的自拍照。这几乎是日常生活中最常遇到，也最考验模型能力的场景了。 1. 为什么这个组合值得关注？在开始看效果之前，我们先简单了解一下这对“黄金搭档”是干什么的。你可以把整个比对过程想象成两个步骤： 1. 找人（Retinaface负责）：在一张照片里，不管背景多复杂，它都能像鹰眼一样，精准地找到人脸的位置，并且把脸“框”出来、摆正。这一步很关键，如果脸都没找对，后面就全错了。 2. 认人（CurricularFace负责）：拿到摆