GLM-4-9B 开源发布：支持 26 种语言与 128K 上下文，性能优于 Llama-3-8B

智谱 AI 正式开源了新一代大语言模型 GLM-4-9B。这款模型在多维度测试中表现亮眼，不仅支持 26 种语言，还具备 128K 超长上下文能力，为开发者提供了高性能的本地化部署选项。

性能对比：小参数实现越级挑战

在权威测评中，GLM-4-9B 展现了显著优势。基座模型的 MMLU 得分达到 74.7 分，比 Llama-3-8B 高出 8.1 分；中文综合能力 C-Eval 以 77.1 分领先近 26 个百分点。数学推理方面，GSM8K 数据集得分为 84.0，超越了 Llama-3-8B-Instruct 的 79.6；代码能力在 HumanEval 评测中获得 70.1 分，领先行业平均水平约 8 个百分点。这些成绩是在仅增加 12.5% 参数量下实现的，体现了高效的模型设计理念。

核心能力与场景落地

GLM-4-9B 系列包含基座和对话两个版本。对话版（GLM-4-9B-Chat）支持 128K 上下文窗口，能处理完整的技术文档或企业年报。同时内置网页浏览、代码执行和自定义工具调用功能，方便构建智能客服等复杂应用。此外，还推出了支持高分辨率图像理解的 GLM-4V-9B，以及上下文达 1M 的专用模型，开发者可根据实际需求选择配置。

部署建议

目前模型已通过 Hugging Face 开放下载。基于 Transformers 4.44.0 及以上版本即可快速集成，支持 CPU、GPU 等多种环境，最低只需 16GB 显存就能运行基本功能。对于中小企业而言，这提供了一个免许可费的高性能本地化方案，有助于降低企业级 AI 部署成本。随着生态完善，预计会有更多基于 GLM-4 架构的行业解决方案涌现。