GLM-4-9B 及 CodeGeeX4-ALL-9B 支持 Ollama 本地部署

GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中，GLM-4-9B 在各项能力上均表现出卓越的能力。

CodeGeeX4-ALL-9B 是最新的 CodeGeeX4 系列模型的开源版本。该模型是在 GLM-4-9B 基础上持续训练的多语言代码生成模型，显著提升了代码生成能力。

Ollama 是一个专为在本地环境中运行和定制大型语言模型而设计的工具。它提供了一个简单而高效的接口，用于创建、运行和管理这些模型，同时还提供了一个丰富的预构建模型库，可以轻松集成到各种应用程序中。Ollama 支持多种操作系统，包括 macOS、Windows、Linux 以及 Docker，适用性广泛。通过 Ollama，用户可以方便地部署和运行 GLM-4-9B 等开源的大语言模型。

环境要求

在开始部署之前，请确保您的系统满足以下基本要求：

操作系统：macOS (Apple Silicon 或 Intel)、Windows 10/11、Linux (Ubuntu 20.04+ 等)
内存：建议至少 8GB RAM，推荐 16GB 或以上
存储：模型文件约占用 5GB-10GB 空间，请预留足够磁盘空间
GPU：非必需，但拥有 NVIDIA GPU 可显著提升推理速度

安装 Ollama

Windows / macOS

访问 Ollama 官网下载对应系统的安装包，双击运行并按照提示完成安装。安装完成后，打开终端（Terminal）验证安装：

ollama --version

注意：此模型需要 Ollama 0.2 或更高版本，目前处于预发布阶段。当前支持 ollama 部署的仅为语言模型，多模态模型尚不支持 ollama 部署。

Linux

使用官方脚本进行安装：

curl -fsSL https://ollama.com/install.sh | sh

Docker

如果您偏好容器化部署，可以使用 Docker 运行 Ollama：

docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

拉取与运行模型

Ollama 提供了便捷的命令来拉取和运行模型。以下是针对 GLM-4-9B 和 CodeGeeX4-ALL-9B 的操作步骤。

1. 拉取模型

在终端执行以下命令拉取模型：

ollama pull glm4
ollama pull codegeex4

模型地址参考：

2. 交互式运行

模型拉取完成后，可以直接启动对话：

ollama run glm4

或者运行代码模型：

ollama run codegeex4

启动后，您可以在终端输入问题，模型将直接返回回答。按 Ctrl+C 退出会话。

GLM-4-9B 及 CodeGeeX4-ALL-9B 支持 Ollama 本地部署