Ollama 本地部署与运行大型语言模型指南
概述
Ollama 是一款专为在本地机器上便捷部署和运行大型语言模型(LLM)而设计的工具。它支持 macOS、Linux 和 Windows 多个平台,通过简单的命令行即可拉取并运行各种开源大模型。
官方网站:https://ollama.com/ Github:https://github.com/ollama/ollama
安装
Ollama 支持 macOS、Linux 和 Windows 多个平台运行。
Linux 安装
以 Linux 操作系统为例,使用以下命令直接安装:
root@master:~/work# curl -fsSL https://ollama.com/install.sh | sh
安装过程中会显示下载进度、创建用户、配置 systemd 服务等信息。例如:
>>> Downloading ollama...
>>> Installing ollama to /usr/local/bin...
>>> Creating ollama user...
>>> Adding ollama user to render group...
>>> NVIDIA GPU installed.
macOS 安装
macOS 用户可以通过 Homebrew 或官方安装包进行安装:
# 使用 Homebrew
brew install ollama
# 或使用官方安装包
curl -fsSL https://ollama.com/install.sh | sh
Windows 安装
Windows 用户可直接访问官网下载安装程序,或在 PowerShell 中执行:
irm https://ollama.com/install.ps1 | iex
Docker 安装
Docker Hub 上提供了官方镜像,适合容器化部署环境:
docker pull ollama/ollama
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
配置
安装成功后,可以通过编辑 vim /etc/systemd/system/ollama.service 文件来对 Ollama 进行配置。
1. 更改 HOST
由于 Ollama 的默认参数配置,启动时设置了仅本地访问。若需开启远程访问,需配置 HOST 监听任何来源 IP:
[Service]
Environment="OLLAMA_HOST=0.0.0.0"


