GLM-4-9B 及 CodeGeeX4-ALL-9B 支持 Ollama 本地部署
GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B 在各项能力上均表现出卓越的能力。
CodeGeeX4-ALL-9B 是最新的 CodeGeeX4 系列模型的开源版本。该模型是在 GLM-4-9B 基础上持续训练的多语言代码生成模型,显著提升了代码生成能力。
Ollama 是一个专为在本地环境中运行和定制大型语言模型而设计的工具。它提供了一个简单而高效的接口,用于创建、运行和管理这些模型,同时还提供了一个丰富的预构建模型库,可以轻松集成到各种应用程序中。Ollama 支持多种操作系统,包括 macOS、Windows、Linux 以及 Docker,适用性广泛。通过 Ollama,用户可以方便地部署和运行 GLM-4-9B 等开源的大语言模型。
环境要求
在开始部署之前,请确保您的系统满足以下基本要求:
- 操作系统:macOS (Apple Silicon 或 Intel)、Windows 10/11、Linux (Ubuntu 20.04+ 等)
- 内存:建议至少 8GB RAM,推荐 16GB 或以上
- 存储:模型文件约占用 5GB-10GB 空间,请预留足够磁盘空间
- GPU:非必需,但拥有 NVIDIA GPU 可显著提升推理速度
安装 Ollama
Windows / macOS
访问 Ollama 官网下载对应系统的安装包,双击运行并按照提示完成安装。安装完成后,打开终端(Terminal)验证安装:
ollama --version
注意:此模型需要 Ollama 0.2 或更高版本,目前处于预发布阶段。当前支持 ollama 部署的仅为语言模型,多模态模型尚不支持 ollama 部署。
Linux
使用官方脚本进行安装:
curl -fsSL https://ollama.com/install.sh | sh
Docker
如果您偏好容器化部署,可以使用 Docker 运行 Ollama:
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
拉取与运行模型
Ollama 提供了便捷的命令来拉取和运行模型。以下是针对 GLM-4-9B 和 CodeGeeX4-ALL-9B 的操作步骤。
1. 拉取模型
在终端执行以下命令拉取模型:
ollama pull glm4
ollama pull codegeex4
模型地址参考:
2. 交互式运行
模型拉取完成后,可以直接启动对话:
ollama run glm4
或者运行代码模型:
ollama run codegeex4
启动后,您可以在终端输入问题,模型将直接返回回答。按 Ctrl+C 退出会话。


