智谱 AI 正式开源了新一代大语言模型 GLM-4-9B。这款模型在多维度测试中表现亮眼,不仅支持 26 种语言,还具备 128K 超长上下文能力,为开发者提供了高性能的本地化部署选项。
性能对比:小参数实现越级挑战
在权威测评中,GLM-4-9B 展现了显著优势。基座模型的 MMLU 得分达到 74.7 分,比 Llama-3-8B 高出 8.1 分;中文综合能力 C-Eval 以 77.1 分领先近 26 个百分点。数学推理方面,GSM8K 数据集得分为 84.0,超越了 Llama-3-8B-Instruct 的 79.6;代码能力在 HumanEval 评测中获得 70.1 分,领先行业平均水平约 8 个百分点。这些成绩是在仅增加 12.5% 参数量下实现的,体现了高效的模型设计理念。
核心能力与场景落地
GLM-4-9B 系列包含基座和对话两个版本。对话版(GLM-4-9B-Chat)支持 128K 上下文窗口,能处理完整的技术文档或企业年报。同时内置网页浏览、代码执行和自定义工具调用功能,方便构建智能客服等复杂应用。此外,还推出了支持高分辨率图像理解的 GLM-4V-9B,以及上下文达 1M 的专用模型,开发者可根据实际需求选择配置。
部署建议
目前模型已通过 Hugging Face 开放下载。基于 Transformers 4.44.0 及以上版本即可快速集成,支持 CPU、GPU 等多种环境,最低只需 16GB 显存就能运行基本功能。对于中小企业而言,这提供了一个免许可费的高性能本地化方案,有助于降低企业级 AI 部署成本。随着生态完善,预计会有更多基于 GLM-4 架构的行业解决方案涌现。

